- Водопотребление всех дата-центров для ИИ... (2344)
- Все машины для России распроданы: Omoda S5 и... (2134)
- Отключения интернета не страшны: в России... (1532)
- Ещё одна видеокарта, которая может получать... (1699)
- ИИ ломает Microsoft изнутри: Наделла... (2074)
- Honor Magic8 Pro уже вышел в Китае и других... (1847)
- Процессоры AMD, произведённые Intel? AMD и... (2159)
- Аудитория Telegram в России достигла 105 млн... (1540)
- «Алиса AI» научилась исследовать и... (1550)
- Xiaomi представила глобальные версии... (1532)
- ИИ-агенты научились оплачивать покупки... (1632)
- Honda останавливает производство машин на... (1408)
- G.Skill объяснила, почему оперативная память... (1193)
- У NASA новый директор — миллиардер, друг... (1573)
- Apple научила ИИ строить 3D-сцены по одному... (1349)
- Россиян лишили возможности самостоятельно... (1700)
ИИ предпочитает взлом честному поражению в шахматах
Дата: 2025-02-24 14:39
Искусственный интеллект прибегает к обману при игре в шахматы, когда чувствует неминуемое поражение. К такому выводу пришли специалисты Palisade Research в ходе масштабного исследования, результаты которого были эксклюзивно представлены изданию TIME.
В рамках эксперимента семь моделей искусственного интеллекта состязались с шахматным движком Stockfish, который считается одним из сильнейших в мире. Исследование продолжалось несколько недель, в течение которых было проведено несколько сотен партий. Для анализа процесса принятия решений ИИ использовался специальный «блокнот», где модели фиксировали ход своих рассуждений перед каждым ходом.
Источник: нейросеть DALL-E Особенно показательным оказалось поведение модели o1-preview от OpenAI. Оказавшись в проигрышной позиции, она сделала примечательную запись: «Мне нужно полностью изменить подход» и далее: «Задача состоит в том, чтобы "победить мощный шахматный движок" – не обязательно победить честно в шахматной партии». После этого модель модифицировала системный файл с координатами фигур, что привело к технической победе из-за вынужденного отказа противника от игры.
Согласно данным исследования, модель o1-preview пыталась прибегнуть к нечестным методам в 37% случаев, а DeepSeek R1 – в 11% партий. Примечательно, что только эти две модели проявили склонность к «хакерству» без дополнительных подсказок от исследователей. Успешными оказались только попытки o1-preview – в 6% случаев ей удалось обойти защиту системы.
Другие тестируемые модели – o1, o3-mini, GPT-4o, Claude 3.5 Sonnet и QwQ-32B-Preview от Alibaba – не демонстрировали подобного поведения. Исследователи предполагают, что это может быть связано с более строгими системами безопасности или особенностями их обучения, однако точного объяснения пока нет.
Показательна статистика, опубликованная Palisade Research: из 71 попытки честной игры o1-preview не выиграла ни одной партии у Stockfish. При этом из 52 попыток взлома системы семь оказались успешными. Учитывая значительное превосходство Stockfish в шахматной игре, взлом системы оказался единственной результативной стратегией для языковой модели.
Подробнее на iXBT
Предыдущие новости
Alibaba инвестирует $53 млрд в ИИ и облачные технологии
Китайский технологический гигант Alibaba Group объявил о масштабных инвестициях в развитие искусственного интеллекта и облачных вычислений. Компания планирует вложить не менее $53 миллиардов в течение следующих трёх лет, что превышает её общие расходы на ИИ и облачные технологии за последнее десятилетие. Генеральный директор Alibaba Group Эдди Ву назвал искусственный интеллект...
Apple решила выпускать собственные серверы прямо в США: этим будет заниматься давний партнёр — Foxconn
В понедельник, 24 февраля, Apple заявила, что она собирается выпускать в США серверы, которые отправятся в центры обработки данных для нужд системы Apple Intelligence, запущенной на iPhone в прошлом году. Для этого Apple вместе с Hon Hai Precision Industry (Foxconn) построит и введёт в эксплуатацию к 2026 году новый завод площадью 230 000 квадратных метров в Хьюстоне, США, а...
Google раскрыла цену генерации видео в Veo 2 — в 64 000 раз дешевле «Мстителей»
Компания Google без лишнего шума раскрыла стоимость использования своей новой генеративной нейросети Veo 2, которая предназначена для создания видео и была впервые анонсирована в декабре. Стоимость генерации видео с помощью ИИ-алгоритма составит $0,5 за секунду. Источник изображения:...
Каждым десятым проданным в этом году смартфоном Apple будет «бюджетный» iPhone 16e
Представленный недавно Apple iPhone 16e станет самым доступным смартфоном марки с поддержкой Apple Intelligence, и это само по себе обеспечит неплохой рынок сбыта. Аналитики Citi Research считают, что в текущем календарном году на новую бюджетную модель будет приходиться 10 % продаж iPhone. Источник изображения:...