- Changan привезет в Россию конкурентов Haval... (3556)
- Китайцы заметно нарастят объёмы производства... (3843)
- Взрыв высшего уровня: на Солнце... (3178)
- Windows 11 опять сбоит — у некоторых... (2967)
- Европейские страны начинают отказываться от... (2692)
- 7400 мАч, 100 Вт, экран Samsung 2K, IP69,... (2770)
- Nvidia вложит только $20 млрд в OpenAI... (6238)
- Европа разогнала отказ от американских... (2364)
- В потребительском сегменте для AMD теперь... (3682)
- ИИ-система из пяти языковых моделей следит... (3432)
- Без наличных и карты: в Саратове появится... (2674)
- Лиза Су пообещала взрывной рост выручки:... (3198)
- В России начали выпускать высококачественные... (3550)
- Более 60 моделей смартфонов Samsung Galaxy... (3042)
- Банки, доставка и не только: Минцифры... (8131)
- Take-Two активно внедряет генеративный ИИ в... (3953)
ИИ предпочитает взлом честному поражению в шахматах
Дата: 2025-02-24 14:39
Искусственный интеллект прибегает к обману при игре в шахматы, когда чувствует неминуемое поражение. К такому выводу пришли специалисты Palisade Research в ходе масштабного исследования, результаты которого были эксклюзивно представлены изданию TIME.
В рамках эксперимента семь моделей искусственного интеллекта состязались с шахматным движком Stockfish, который считается одним из сильнейших в мире. Исследование продолжалось несколько недель, в течение которых было проведено несколько сотен партий. Для анализа процесса принятия решений ИИ использовался специальный «блокнот», где модели фиксировали ход своих рассуждений перед каждым ходом.
Источник: нейросеть DALL-E Особенно показательным оказалось поведение модели o1-preview от OpenAI. Оказавшись в проигрышной позиции, она сделала примечательную запись: «Мне нужно полностью изменить подход» и далее: «Задача состоит в том, чтобы "победить мощный шахматный движок" – не обязательно победить честно в шахматной партии». После этого модель модифицировала системный файл с координатами фигур, что привело к технической победе из-за вынужденного отказа противника от игры.
Согласно данным исследования, модель o1-preview пыталась прибегнуть к нечестным методам в 37% случаев, а DeepSeek R1 – в 11% партий. Примечательно, что только эти две модели проявили склонность к «хакерству» без дополнительных подсказок от исследователей. Успешными оказались только попытки o1-preview – в 6% случаев ей удалось обойти защиту системы.
Другие тестируемые модели – o1, o3-mini, GPT-4o, Claude 3.5 Sonnet и QwQ-32B-Preview от Alibaba – не демонстрировали подобного поведения. Исследователи предполагают, что это может быть связано с более строгими системами безопасности или особенностями их обучения, однако точного объяснения пока нет.
Показательна статистика, опубликованная Palisade Research: из 71 попытки честной игры o1-preview не выиграла ни одной партии у Stockfish. При этом из 52 попыток взлома системы семь оказались успешными. Учитывая значительное превосходство Stockfish в шахматной игре, взлом системы оказался единственной результативной стратегией для языковой модели.
Подробнее на iXBT
Предыдущие новости
Alibaba инвестирует $53 млрд в ИИ и облачные технологии
Китайский технологический гигант Alibaba Group объявил о масштабных инвестициях в развитие искусственного интеллекта и облачных вычислений. Компания планирует вложить не менее $53 миллиардов в течение следующих трёх лет, что превышает её общие расходы на ИИ и облачные технологии за последнее десятилетие. Генеральный директор Alibaba Group Эдди Ву назвал искусственный интеллект...
Apple решила выпускать собственные серверы прямо в США: этим будет заниматься давний партнёр — Foxconn
В понедельник, 24 февраля, Apple заявила, что она собирается выпускать в США серверы, которые отправятся в центры обработки данных для нужд системы Apple Intelligence, запущенной на iPhone в прошлом году. Для этого Apple вместе с Hon Hai Precision Industry (Foxconn) построит и введёт в эксплуатацию к 2026 году новый завод площадью 230 000 квадратных метров в Хьюстоне, США, а...
Google раскрыла цену генерации видео в Veo 2 — в 64 000 раз дешевле «Мстителей»
Компания Google без лишнего шума раскрыла стоимость использования своей новой генеративной нейросети Veo 2, которая предназначена для создания видео и была впервые анонсирована в декабре. Стоимость генерации видео с помощью ИИ-алгоритма составит $0,5 за секунду. Источник изображения:...
Каждым десятым проданным в этом году смартфоном Apple будет «бюджетный» iPhone 16e
Представленный недавно Apple iPhone 16e станет самым доступным смартфоном марки с поддержкой Apple Intelligence, и это само по себе обеспечит неплохой рынок сбыта. Аналитики Citi Research считают, что в текущем календарном году на новую бюджетную модель будет приходиться 10 % продаж iPhone. Источник изображения:...