Рекурсивный акроним словосочетания «PHP: Hypertext Preprocessor»

Добро пожаловать на форум PHP программистов!

За последние 24 часа нас посетили 19233 программиста и 1609 роботов. Сейчас ищут 860 программистов ...

Последние

Учёные раскрыли невидимую угрозу для искусственного интеллекта: атака DarkMind манипулирует рассуждениями ИИ

Дата: 2025-02-18 21:07

Учёные из Сент-Луисского университета разработали новую скрытую атаку на языковые модели искусственного интеллекта, получившую название DarkMind. Эта атака способна незаметно манипулировать процессом рассуждений ИИ, что может привести к серьёзным последствиям для безопасности систем, использующих такие модели.

Зен Го и Реза Турани, авторы исследования, обнаружили уязвимость в парадигме «цепочки рассуждений» (Chain-of-Thought, CoT), которую используют многие современные языковые модели, включая ChatGPT, для решения сложных задач. DarkMind эксплуатирует эту уязвимость, внедряя «скрытые триггеры» в настраиваемые приложения на основе языковых моделей.

Иллюстрация: нейросеть DALL-E

Особенность атаки DarkMind заключается в том, что она остаётся незаметной при обычном использовании модели и активируется при определённых шаблонах рассуждений. Это делает её чрезвычайно трудной для обнаружения стандартными методами защиты.

Исследователи провели тесты, которые показали высокую эффективность DarkMind против различных языковых моделей, включая самые современные, такие как GPT-4 и LLaMA-3. Примечательно, что более продвинутые модели с лучшими способностями к рассуждениям оказались более уязвимыми к этой атаке.

Го и Турани отмечают, что DarkMind может быть применена к различным областям рассуждений. Более того, для создания такой атаки не требуется глубоких знаний в области языковых моделей, что увеличивает риск её широкого распространения.

Учитывая растущее использование языковых моделей в различных сферах, включая банковское дело и здравоохранение, атаки типа DarkMind представляют серьёзную угрозу безопасности. Они могут манипулировать процессом принятия решений ИИ без явных признаков вмешательства.

Исследователи подчёркивают, что их работа выявила критический пробел в безопасности современных языковых моделей. Они планируют продолжить изучение этой проблемы и разработать новые механизмы защиты, такие как проверки согласованности рассуждений и обнаружение враждебных триггеров.

Работа Го и Турани открывает новое направление в исследовании безопасности искусственного интеллекта и подчёркивает необходимость разработки более совершенных мер защиты для обеспечения надёжности и безопасности систем на основе языковых моделей.

Подробнее на iXBT

Предыдущие новости

iXBT, 2025-02-18 21:17
Китайская GalaxySpace впервые соединила мобильные телефоны напрямую со спутниками на низкой орбите

Китайская компания GalaxySpace успешно продемонстрировала технологию связи между мобильными устройствами и спутниками, используя первую в Китае тестовую группировку спутников широкополосной связи на низкой околоземной орбите. Демонстрация состоялась 12 февраля во время коммерческой космической конференции в Пекине. В 10:28 утра спутник из группировки пролетел над местом...

iXBT, 2025-02-18 21:29
Астероид 2024 YR4 может оставить новый кратер на Луне: учёные оценивают вероятность столкновения

Астрономы обсуждают возможность столкновения астероида 2024 YR4 с Луной, что может привести к образованию нового кратера и взрыву, потенциально видимому с Земли. Эта гипотеза была представлена в статье журнала New Scientist, вызвав живой интерес в научном сообществе. Согласно расчётам учёных, в случае столкновения на лунной поверхности может образоваться кратер диаметром от...

iXBT, 2025-02-18 20:43
AMD создала настоящего конкурента для процессоров Apple M Pro, а RTX 4060 можно отправлять на пенсию? Опубликованы обзоры чудовищного Ryzen AI MAX+ 395

Как и сообщалось вчера, сегодня были опубликованы обзоры монструозных мобильных процессоров AMD Ryzen AI MAX 300. Videocardz Все они были получены на одной модели гибридного ноутбука — Asus ROG Flow Z13. Это может свидетельствовать о том, что первое время большого ассортимента ПК с такими APU на рынке ожидать не стоит. Также стоит сказать, что почти все тестовые версии...

iXBT, 2025-02-18 20:55
AMD играет с Nvidia в кошки-мышки. Обзоры на видеокарты Radeon RX 9070 будут опубликованы на следующий день после обзоров на RTX 5070

Компания AMD в этом году явно решила играть с Nvidia в кошки-мышки. Анонс и выход своих видеокарт Radeon RX 9070 компания подстраивает под анонсы Nvidia. И вот теперь стало известно, когда будут опубликованы обзоры новинок AMD. фото Videocardz Это произойдёт 5 марта, то есть ровно в день запуска GeForce RTX 5070. А обзоры на RTX 5070 будут опубликованы днём ранее. Анонс RX...