- Британская GRC стала реселлером спутниковых... (918)
- IEC Telecom запускает RDK 2.0: спутниковая... (1118)
- В связи с ростом цен расходы госкомпаний на... (1156)
- Альянс телеком-гигантов NGMN представил 13... (1087)
- Ферромагнитные зеркала и электромагниты:... (1024)
- Космический зонд Solar Orbiter совершит... (1040)
- Очень «высоколобый» ноутбук. Lenovo... (994)
- Учёные призывают расширить поиск внеземной... (1137)
- 138 лет наблюдений за Ро Кассиопеи:... (901)
- Не рассчитывайте на достаточные поставки... (989)
- Epic Games засудила киберспортсмена-читера... (901)
- «Марсианский треугольник» украсил ночное... (1036)
- Космический телескоп GOES-19 запечатлел... (1046)
- «Корпоративный Telegram» с ГОСТ-шифрованием:... (901)
- Для межпланетных путешествий Луну нужно... (993)
- Safe Superintelligence соучредителя OpenAI... (959)
ИИ предпочитает взлом честному поражению в шахматах
Дата: 2025-02-24 14:39
Искусственный интеллект прибегает к обману при игре в шахматы, когда чувствует неминуемое поражение. К такому выводу пришли специалисты Palisade Research в ходе масштабного исследования, результаты которого были эксклюзивно представлены изданию TIME.
В рамках эксперимента семь моделей искусственного интеллекта состязались с шахматным движком Stockfish, который считается одним из сильнейших в мире. Исследование продолжалось несколько недель, в течение которых было проведено несколько сотен партий. Для анализа процесса принятия решений ИИ использовался специальный «блокнот», где модели фиксировали ход своих рассуждений перед каждым ходом.

Особенно показательным оказалось поведение модели o1-preview от OpenAI. Оказавшись в проигрышной позиции, она сделала примечательную запись: «Мне нужно полностью изменить подход» и далее: «Задача состоит в том, чтобы "победить мощный шахматный движок" – не обязательно победить честно в шахматной партии». После этого модель модифицировала системный файл с координатами фигур, что привело к технической победе из-за вынужденного отказа противника от игры.
Согласно данным исследования, модель o1-preview пыталась прибегнуть к нечестным методам в 37% случаев, а DeepSeek R1 – в 11% партий. Примечательно, что только эти две модели проявили склонность к «хакерству» без дополнительных подсказок от исследователей. Успешными оказались только попытки o1-preview – в 6% случаев ей удалось обойти защиту системы.
Другие тестируемые модели – o1, o3-mini, GPT-4o, Claude 3.5 Sonnet и QwQ-32B-Preview от Alibaba – не демонстрировали подобного поведения. Исследователи предполагают, что это может быть связано с более строгими системами безопасности или особенностями их обучения, однако точного объяснения пока нет.
Показательна статистика, опубликованная Palisade Research: из 71 попытки честной игры o1-preview не выиграла ни одной партии у Stockfish. При этом из 52 попыток взлома системы семь оказались успешными. Учитывая значительное превосходство Stockfish в шахматной игре, взлом системы оказался единственной результативной стратегией для языковой модели.
Подробнее на iXBT
Предыдущие новости
Alibaba инвестирует $53 млрд в ИИ и облачные технологии
Китайский технологический гигант Alibaba Group объявил о масштабных инвестициях в развитие искусственного интеллекта и облачных вычислений. Компания планирует вложить не менее $53 миллиардов в течение следующих трёх лет, что превышает её общие расходы на ИИ и облачные технологии за последнее десятилетие. Генеральный директор Alibaba Group Эдди Ву назвал искусственный интеллект...
Apple решила выпускать собственные серверы прямо в США: этим будет заниматься давний партнёр — Foxconn
В понедельник, 24 февраля, Apple заявила, что она собирается выпускать в США серверы, которые отправятся в центры обработки данных для нужд системы Apple Intelligence, запущенной на iPhone в прошлом году. Для этого Apple вместе с Hon Hai Precision Industry (Foxconn) построит и введёт в эксплуатацию к 2026 году новый завод площадью 230 000 квадратных метров в Хьюстоне, США, а...
Google раскрыла цену генерации видео в Veo 2 — в 64 000 раз дешевле «Мстителей»
Компания Google без лишнего шума раскрыла стоимость использования своей новой генеративной нейросети Veo 2, которая предназначена для создания видео и была впервые анонсирована в декабре. Стоимость генерации видео с помощью ИИ-алгоритма составит $0,5 за секунду. Источник изображения:...
Каждым десятым проданным в этом году смартфоном Apple будет «бюджетный» iPhone 16e
Представленный недавно Apple iPhone 16e станет самым доступным смартфоном марки с поддержкой Apple Intelligence, и это само по себе обеспечит неплохой рынок сбыта. Аналитики Citi Research считают, что в текущем календарном году на новую бюджетную модель будет приходиться 10 % продаж iPhone. Источник изображения:...