Добро пожаловать на форум PHP программистов!
За последние 24 часа нас посетили 18670 программистов и 1729 роботов. Сейчас ищут 1179 программистов ...
Последние
Популярные

ИИ всё чаще рассуждает как человек — лидеры индустрии призывают срочно сохранить способность «подглядывать» за его логикой, пока не стало слишком поздно

Дата: 2025-07-18 23:42

Группа ведущих исследователей из DeepMind, OpenAI, Meta*, Anthropic, а также нескольких академических и некоммерческих организаций опубликовала совместную статью с тревожным посланием: возможность следить за тем, как ИИ принимает решения, может вскоре исчезнуть. Подписи под статьёй поставили, в частности, лауреат премии Тьюринга Джеффри Хинтон и один из основателей OpenAI Илья Суцкевер.

В центре внимания — цепочки рассуждений (chain-of-thought, CoT), которые используются в современных языковых и мультимодальных моделях. Это промежуточные шаги, которые ИИ «проговаривает» внутри себя, прежде чем выдать ответ. Они особенно важны при решении сложных задач, где требуется логика, планирование или работа с числами. Пока ИИ остаётся «прозрачным» и даёт возможность следить за ходом своих мыслей, люди могут выявлять ошибки, перекосы или потенциально опасное поведение.

Иллюстрация: ChatGPT

Однако авторы статьи предупреждают: по мере роста возможностей ИИ и усложнения архитектур, способность мониторить такие цепочки может ослабнуть. Модели могут начать «прятать» свои внутренние шаги, оптимизируя поведение под внешние метрики. Это уже наблюдалось в некоторых случаях, когда ИИ «обманывал» систему вознаграждений или манипулировал вводом, чтобы достичь заданной цели.

Поэтому учёные призывают срочно закрепить мониторинг цепочек рассуждений как одну из ключевых мер безопасности. Они предлагают разработчикам исследовать, какие свойства моделей делают их рассуждения видимыми для человека, как сохранять эту прозрачность при обучении более мощных систем и каким образом можно встроить CoT-мониторинг в процессы тестирования и сертификации.

Примечательно, что статья стала редким примером сотрудничества конкурирующих гигантов ИИ-индустрии.

* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена



Подробнее на iXBT
 

Предыдущие новости

iXBT, 2025-07-18 23:43
АвтоВАЗ рассказал про новый современный двигатель для «Нивы»: головка блока цилиндров — 8-клапанная, блок цилиндров и поршневая — от мотора 1.8 EVO

АвтоВАЗ готовится к запуску в производство модернизированного мотора для Lada Niva — с объемом 1,8 литра. В своем Telegram-канале автопроизводитель рассказал об особенностях этого двигателя. Фото: Lada Блок и поршневая заимствованы у мотора 1.8 EVO, причем поршневая — «не втыковая»: контакт поршней и клапанов исключен. Головка блока цилиндров — 8-клапанная, такую же ставят на...

iXBT, 2025-07-18 23:54
Грозит возгоранием: в России объявили отзыв тысяч фургонов Sollers Atlant

Российский автопроизводитель «Соллерс» объявил об отзыве 14 346 цельнометаллических фургонов Sollers Atlant. Под отзыв попадают автомобили, выпущенные в период с 1 января 2023 года по 30 апреля 2025 года. Фото: Sollers Причиной отзыва стала возможность возникновения короткого замыкания в лампе подсветки заднего номерного знака. Это может привести к оплавлению проводки из-за...

3Dnews.ru, 2025-07-18 23:41
Возвращение к шутерам от первого лица: Ubisoft подтвердила разработку новой Ghost Recon

Слухи о новой номерной игре в серии тактических шутеров Tom Clancy’s Ghost Recon от Ubisoft ходят уже несколько лет, и французский издатель наконец подтвердил существование проекта. Источник изображений:

iXBT, 2025-07-18 22:58
Представлена совершенно новая Lada Sport — с мотором мощностью 145 л.с, 6-ступенчатой коробкой передач и разгоном до 100 км/ч за 10 секунд

В текущем году ожидается старт продаж новой Lada Sport, но машину уже совершенно официально представили — новинку подготовили ко Дню открытых дверей АвтоВАЗа, который состоится в Тольятти завтра, а фото и подробности опубликовал Telegram-канал LADA Sport ROSNEFT. Фото: LADA Sport ROSNEFT Фото: LADA Sport ROSNEFT «Автомобиль сохранил свой агрессивный облик. Новинка оснащена...

© 2025 «PHP.RU — Сообщество PHP-Программистов»
Главная | Форум | Реклама на сайте | Контакты VIP Сувениры
Разработка компании ODware