- Для классических УАЗов начали выпускать... (4517)
- Microsoft сменила главу отдела безопасности... (3527)
- Google Pixel 10a официально рассекречен,... (4256)
- Новая глава, старое название: Blizzard... (4204)
- Модуль-камера формата Micro Four Thirds,... (2707)
- YouTube включил ИИ-дубляж для всех — в том... (3506)
- OpenAI получит от Nvidia не 100 млрд... (3938)
- Из-за роста цен буквально на всё рынок... (3131)
- «Нам только что сообщили, что цены на... (4000)
- Пьяные убийства, съеденные яблоки и акты... (3990)
- Google планирует выпустить свою операционную... (4368)
- Google неполноценно представила Pixel 10a —... (4142)
- Минималистичный дизайн, необычный пиксельный... (4211)
- Покупателям смартфона Honor X8d подарят... (3231)
- В США создали подводный 3D-принтер,... (3991)
- Spotify сделал тексты песен понятнее — даже... (4258)
ИИ предпочитает взлом честному поражению в шахматах
Дата: 2025-02-24 14:39
Искусственный интеллект прибегает к обману при игре в шахматы, когда чувствует неминуемое поражение. К такому выводу пришли специалисты Palisade Research в ходе масштабного исследования, результаты которого были эксклюзивно представлены изданию TIME.
В рамках эксперимента семь моделей искусственного интеллекта состязались с шахматным движком Stockfish, который считается одним из сильнейших в мире. Исследование продолжалось несколько недель, в течение которых было проведено несколько сотен партий. Для анализа процесса принятия решений ИИ использовался специальный «блокнот», где модели фиксировали ход своих рассуждений перед каждым ходом.
Источник: нейросеть DALL-E Особенно показательным оказалось поведение модели o1-preview от OpenAI. Оказавшись в проигрышной позиции, она сделала примечательную запись: «Мне нужно полностью изменить подход» и далее: «Задача состоит в том, чтобы "победить мощный шахматный движок" – не обязательно победить честно в шахматной партии». После этого модель модифицировала системный файл с координатами фигур, что привело к технической победе из-за вынужденного отказа противника от игры.
Согласно данным исследования, модель o1-preview пыталась прибегнуть к нечестным методам в 37% случаев, а DeepSeek R1 – в 11% партий. Примечательно, что только эти две модели проявили склонность к «хакерству» без дополнительных подсказок от исследователей. Успешными оказались только попытки o1-preview – в 6% случаев ей удалось обойти защиту системы.
Другие тестируемые модели – o1, o3-mini, GPT-4o, Claude 3.5 Sonnet и QwQ-32B-Preview от Alibaba – не демонстрировали подобного поведения. Исследователи предполагают, что это может быть связано с более строгими системами безопасности или особенностями их обучения, однако точного объяснения пока нет.
Показательна статистика, опубликованная Palisade Research: из 71 попытки честной игры o1-preview не выиграла ни одной партии у Stockfish. При этом из 52 попыток взлома системы семь оказались успешными. Учитывая значительное превосходство Stockfish в шахматной игре, взлом системы оказался единственной результативной стратегией для языковой модели.
Подробнее на iXBT
Предыдущие новости
Alibaba инвестирует $53 млрд в ИИ и облачные технологии
Китайский технологический гигант Alibaba Group объявил о масштабных инвестициях в развитие искусственного интеллекта и облачных вычислений. Компания планирует вложить не менее $53 миллиардов в течение следующих трёх лет, что превышает её общие расходы на ИИ и облачные технологии за последнее десятилетие. Генеральный директор Alibaba Group Эдди Ву назвал искусственный интеллект...
Apple решила выпускать собственные серверы прямо в США: этим будет заниматься давний партнёр — Foxconn
В понедельник, 24 февраля, Apple заявила, что она собирается выпускать в США серверы, которые отправятся в центры обработки данных для нужд системы Apple Intelligence, запущенной на iPhone в прошлом году. Для этого Apple вместе с Hon Hai Precision Industry (Foxconn) построит и введёт в эксплуатацию к 2026 году новый завод площадью 230 000 квадратных метров в Хьюстоне, США, а...
Google раскрыла цену генерации видео в Veo 2 — в 64 000 раз дешевле «Мстителей»
Компания Google без лишнего шума раскрыла стоимость использования своей новой генеративной нейросети Veo 2, которая предназначена для создания видео и была впервые анонсирована в декабре. Стоимость генерации видео с помощью ИИ-алгоритма составит $0,5 за секунду. Источник изображения:...
Каждым десятым проданным в этом году смартфоном Apple будет «бюджетный» iPhone 16e
Представленный недавно Apple iPhone 16e станет самым доступным смартфоном марки с поддержкой Apple Intelligence, и это само по себе обеспечит неплохой рынок сбыта. Аналитики Citi Research считают, что в текущем календарном году на новую бюджетную модель будет приходиться 10 % продаж iPhone. Источник изображения:...