- Немецкие инженеры создали QR-код размером... (1401)
- Американская фирма обвиняет Lenovo в... (1431)
- Зафиксирована первая «смерть» Ryzen 7... (1925)
- «Ладу» теперь можно купить в кредит на 10... (1870)
- Программируемая кнопка действия, SpO2 и... (2321)
- Apple Mac mini и Mac Studio стали... (2513)
- Новые iPhone, MacBook и iPad представят... (1920)
- Discord будет применять возрастную цензуру ... (2355)
- Разработчики «Войны Миров: Сибирь»... (2241)
- 7-местный Nissan за 6000 долларов:... (2385)
- В 2026 году в России стартуют продажи рамных... (1655)
- Лабораторные атаки показали уязвимости в... (1608)
- 20 000 мАч, 165 Вт и цветной экран — за 60... (1515)
- Windows 11 получила полноценную поддержку... (2540)
- Интернет-трафик в обмен на бензин. Абоненты... (1714)
- Solaris HC (Hyundai Creta российской сборки)... (1795)
ИИ предпочитает взлом честному поражению в шахматах
Дата: 2025-02-24 14:39
Искусственный интеллект прибегает к обману при игре в шахматы, когда чувствует неминуемое поражение. К такому выводу пришли специалисты Palisade Research в ходе масштабного исследования, результаты которого были эксклюзивно представлены изданию TIME.
В рамках эксперимента семь моделей искусственного интеллекта состязались с шахматным движком Stockfish, который считается одним из сильнейших в мире. Исследование продолжалось несколько недель, в течение которых было проведено несколько сотен партий. Для анализа процесса принятия решений ИИ использовался специальный «блокнот», где модели фиксировали ход своих рассуждений перед каждым ходом.
Источник: нейросеть DALL-E Особенно показательным оказалось поведение модели o1-preview от OpenAI. Оказавшись в проигрышной позиции, она сделала примечательную запись: «Мне нужно полностью изменить подход» и далее: «Задача состоит в том, чтобы "победить мощный шахматный движок" – не обязательно победить честно в шахматной партии». После этого модель модифицировала системный файл с координатами фигур, что привело к технической победе из-за вынужденного отказа противника от игры.
Согласно данным исследования, модель o1-preview пыталась прибегнуть к нечестным методам в 37% случаев, а DeepSeek R1 – в 11% партий. Примечательно, что только эти две модели проявили склонность к «хакерству» без дополнительных подсказок от исследователей. Успешными оказались только попытки o1-preview – в 6% случаев ей удалось обойти защиту системы.
Другие тестируемые модели – o1, o3-mini, GPT-4o, Claude 3.5 Sonnet и QwQ-32B-Preview от Alibaba – не демонстрировали подобного поведения. Исследователи предполагают, что это может быть связано с более строгими системами безопасности или особенностями их обучения, однако точного объяснения пока нет.
Показательна статистика, опубликованная Palisade Research: из 71 попытки честной игры o1-preview не выиграла ни одной партии у Stockfish. При этом из 52 попыток взлома системы семь оказались успешными. Учитывая значительное превосходство Stockfish в шахматной игре, взлом системы оказался единственной результативной стратегией для языковой модели.
Подробнее на iXBT
Предыдущие новости
Alibaba инвестирует $53 млрд в ИИ и облачные технологии
Китайский технологический гигант Alibaba Group объявил о масштабных инвестициях в развитие искусственного интеллекта и облачных вычислений. Компания планирует вложить не менее $53 миллиардов в течение следующих трёх лет, что превышает её общие расходы на ИИ и облачные технологии за последнее десятилетие. Генеральный директор Alibaba Group Эдди Ву назвал искусственный интеллект...
Apple решила выпускать собственные серверы прямо в США: этим будет заниматься давний партнёр — Foxconn
В понедельник, 24 февраля, Apple заявила, что она собирается выпускать в США серверы, которые отправятся в центры обработки данных для нужд системы Apple Intelligence, запущенной на iPhone в прошлом году. Для этого Apple вместе с Hon Hai Precision Industry (Foxconn) построит и введёт в эксплуатацию к 2026 году новый завод площадью 230 000 квадратных метров в Хьюстоне, США, а...
Google раскрыла цену генерации видео в Veo 2 — в 64 000 раз дешевле «Мстителей»
Компания Google без лишнего шума раскрыла стоимость использования своей новой генеративной нейросети Veo 2, которая предназначена для создания видео и была впервые анонсирована в декабре. Стоимость генерации видео с помощью ИИ-алгоритма составит $0,5 за секунду. Источник изображения:...
Каждым десятым проданным в этом году смартфоном Apple будет «бюджетный» iPhone 16e
Представленный недавно Apple iPhone 16e станет самым доступным смартфоном марки с поддержкой Apple Intelligence, и это само по себе обеспечит неплохой рынок сбыта. Аналитики Citi Research считают, что в текущем календарном году на новую бюджетную модель будет приходиться 10 % продаж iPhone. Источник изображения:...