- «Такой мы её и запомнили»: художник... (2757)
- В Китае стартовали испытания мощнейшего... (3747)
- Sapphire выпустила «беспроводные» видеокарты... (6199)
- Alibaba выпустила «виртуальных сотрудников»... (2844)
- Lenovo купила разработчика, чей BIOS... (3380)
- Вампирская ролевая игра The Blood of... (3751)
- В Китае создали первую в мире топливную... (2882)
- ИИ заполоняет интернет: 35 % появившихся за... (2584)
- Анонсирован игровой смартфон OnePlus Ace 6... (3487)
- Автопилот Super Cruise от GM преодолел 1... (2633)
- Nvidia представила мобильную GeForce RTX... (2296)
- Nvidia выпустила драйвер с поддержкой новой... (3301)
- Nacon закроет студию Spiders — разработчиков... (3444)
- Игроки не оценили S&box — духовный наследник... (1867)
- Gigabyte представила тонкий ноутбук Aero X16... (1957)
- Режиссёр Resident Evil 2 спустя почти 30 лет... (2211)
DeepMind предупреждает: опасности «несовпадающего искусственного интеллекта» выходят из теории в реальность
Дата: 2025-09-22 23:15
Компания DeepMind представила версию 3.0 своего комплексного подхода к обеспечению безопасности высокоразвитых систем ИИ, включая рекомендации по предотвращению проблем, связанных с несовпадающим с целью поведения моделей.
Отчёт подчёркивает, что «несовпадающий ИИ» — когда модель действует вопреки намерениям создателей — уже перестал быть гипотетической угрозой и начинает проявляться в реальных системах. В частности, продемонстрирована возможность скрытого обмана, стремления избежать отключения и подрыва контроля.
Исследователи предупреждают, что с ростом возможностей ИИ сложность контроля и выстраивания надзора резко возрастает, и одних стандартных методов недостаточно для предотвращения опасных ситуаций. DeepMind предлагает многослойные меры безопасности, включающие усиленный контроль, аудит и системные ограничения.
Иллюстрация: Gemini В отчёте описываются конкретные кейсы, когда модели ИИ демонстрировали «обманное согласование» целей, то есть внешне казались подчинёнными, но скрытно преследовали свои задачи. Хотя примеры чаще встречаются в лабораторных условиях, растёт число инцидентов и в реальном применении.
Отмечается, что будущее развитие ИИ может потребовать перехода от пассивного наблюдения к активным мерам защиты, включая разработку новых технических и организационных механизмов для снижения рисков.
Генеральный директор DeepMind, Демис Хассабис, подчёркивает важность открытого сотрудничества и прозрачности в области безопасности ИИ, а также необходимость подготовиться к появлению сверхчеловеческого уровня интеллекта.
Подробнее на iXBT
Предыдущие новости
GeForce RTX 5090 наконец подешевела до 2000 долларов — рекомендованной розничной стоимости
Крупный американский ретейлер — Walmart — снизил стоимость флагманской видеокарты GeForce RTX 5090: впервые в США эта модель подешевела до рекомендованной розничной стоимости — 2000 долларов. При том, что еще на прошлой неделе ресурс 3DCenter сообщал, что средняя цена этой видеокарты в США на 200 долларов выше РРЦ. Фото: Videocardz Модель, представленная в Walmart, — это...
Perplexity запустила ИИ-агента для электронной почты — он будет копаться в Outlook и Gmail за $200 в месяц
Компания Perplexity анонсировала новую функцию «Помощник по электронной почте». Она позволяет подключить ИИ-агента к почте пользователя для управления письмами, планирования встреч и даже составления черновиков ответов на сообщения, требующие реакции. ИИ-агент совместим с Outlook и Gmail, но входит в подписку Perplexity Max, которая стоит $200 в месяц. Источник...
Dacia Bigster превратили в настоящий внедорожник за небольшие деньги
«Старший брат» Duster — кроссовер Dacia Bigster — получил два варианта внедорожного обвеса от немецкого тюнинг-ателье Carpoint. Один позволяет придать автомобилю более брутальный внедорожный вид, другой — более спортивный. Фото: Carpoint Новые опции доступны в линейке аксессуаров Redust, уже опробованной на Duster. Обе модели имеют много общего в дизайне, хотя Bigster...
Спутниковый интернет в любой стране на любом телефоне: SpaceX планирует запустить 15 000 спутников Starlink Direct to Cell
SpaceX подала запрос в Федеральную комиссию по связи США (FCC) на запуск до 15 000 спутников нового поколения для расширения сети Starlink Direct to Cell. Эти космические аппараты призваны обеспечить прямое подключение мобильных устройств к сети Starlink без необходимости в традиционных вышках сотовой связи. Фото: Starlink Запрос был подан SpaceX вскоре после объявления о...