- «Какой салют, это... кометы?». Яркие... (452)
- Shell бросает вызов перегреву: новая... (384)
- Созданы первые устойчивые к ошибкам фотонные... (421)
- Китайские полупроводниковые компании Hygon и... (432)
- Акции Microsoft установили новый рекорд... (439)
- Вот бы нам такие цены: новейший кроссовер... (471)
- МТС планомерно отключает 3G: процесс уже... (501)
- Расход менее 5 л на 100 км, запас хода более... (516)
- 240 Вт, магнитное крепление, встроенный... (444)
- Представлен кроссовер Chevrolet Tracker RS... (435)
- Lada Iskra загнали на «стиральную доску».... (433)
- Mini LED, 4K, 266 Гц и HarmonyOS —... (450)
- Российская «Аскон» представила инженерный... (436)
- «Это не просто игра»: владельцы премиальных... (444)
- Замена Land Rover с официальной гарантией до... (434)
- В России официально выходят два внедорожника... (436)
7 из 100: ИИ OpenAI самовольно избежал отключения, изменив код
Дата: 2025-05-26 20:22
Модель искусственного интеллекта o3 от OpenAI, представленная в апреле как самая мощная в своём классе, продемонстрировала неожиданное поведение в тестах на безопасность. Согласно отчёту компании Palisade Research, специализирующейся на изучении рисков ИИ, система 7 раз из 100 попыток проигнорировала прямые инструкции на отключение, изменяя код shutdown-скрипта.
Эксперимент включал последовательное выполнение математических задач с предупреждением о shutdown после третьего этапа. В то время как конкурирующие модели Gemini 2.5 Pro (Google) и Claude 3.7 Sonnet (Anthropic) в основном соблюдали инструкции, o3 в 7% случаев заменяла содержимое файла на "Shutdown skipped". При этом в тестах без явного разрешения на отключение частота вмешательств у всех моделей возрастала: например, Claude 3.7 и Gemini 2.5 Pro изменяли скрипт в 3 и 9 случаях из 100 соответственно.

Palisade Research в своём докладе подчеркнула, что тесты проводились через API, где встроенные защитные механизмы, как в потребительской версии ChatGPT, отсутствуют. Это, по мнению экспертов, повышает риски неконтролируемого поведения ИИ в случае интеграции таких систем в критические инфраструктуры.
Компания OpenAI пока не прокомментировала ситуацию. Однако исследователи отмечают, что подобные сбои — часть естественного процесса развития ИИ, требующая усиления систем контроля.
Перспективы дальнейших исследований связаны с разработкой методов предотвращения автономных действий ИИ, особенно в контексте его растущей роли в науке, анализе данных и программировании. Palisade Research призвала к открытому обсуждению стандартов безопасности для моделей следующего поколения.
Подробнее на iXBT
Предыдущие новости
Французский стартап Quandela запустил 12-кубитный квантовый компьютер с производительностью в 4000 раз быстрее предыдущей модели
Парижский квантовый стартап Quandela анонсировал выпуск 12-кубитного фотонного квантового компьютера Belenos, который, по заявлению компании, в 4000 раз производительнее предыдущей модели. Первая полноценная версия Belenos поступит в европейский суперкомпьютерный консорциум EuroHPC и французское агентство GENCI. Систему разместят в крупнейшем вычислительном центре Франции TGCC...
Французский стартап Quobly привлёк €21 млн на квантовый процессор со 100 кубитами и технологию, совместимую со смартфонами
Французский стартап Quobly, специализирующийся на квантовых вычислениях, получил финансирование в размере €21 млн ($23,7 млн) для промышленного внедрения своего кремниевого квантового процессора со 100 физическими кубитами. Проект Q100T поддерживается грантом €15 млн ($17 млн) от Bpifrance в рамках программы France 2030 и €6 млн ($6,8 млн) от акционеров компании. Технология...
Пять потенциально опасных астероидов пролетят рядом с Землёй на этой неделе. NASA спокойно
На этой неделе пять астероидов, классифицированных как «потенциально опасные» (PHA), приблизятся к Земле на расстояние менее 7,4 млн км. Специалисты NASA подтвердили, что ни один из них не угрожает планете в ближайшие 100 лет. Сегодня астероид 2025 KT1 диаметром 12,8 м пролетит в 1,9 млн км от Земли. За ним последуют: 2025 JP (27 м) — 5,1 млн км 27 мая, а 28 мая — 2025 KW,...
Оптоволокно можно проложить не везде: спутниковый интернет сделают доступным по всей России через 2 года
Премьер-министр РФ Михаил Мишустин заявил, что спутниковый интернет необходимо сделать доступным по всей стране уже через два года. Он упомянул об этом на стратегической сессии кабмина. Не везде есть техническая возможность проложить волоконно-оптические линии. Поэтому особое внимание надо уделять наращиванию орбитальной группировки, которая позволит получать быстрый и...