- АвтоВАЗ поднял цены на Lada Granta: прибавка... (269)
- Несмотря на сложности, россияне не... (278)
- Новая статья: Lost Records: Bloom & Rage —... (331)
- Тайконавты доставили из космоса 37 кг... (369)
- OpenAI придумала, как исправить угодливое... (366)
- Инновационный двигатель подвел в 238... (358)
- 53 года на орбите, а скоро снова на Земле:... (359)
- 53 года на орбите, а скоро на Земле:... (372)
- Apple рассказала о вынужденном изменении... (339)
- Ждать осталось недолго: журналист раскрыл,... (369)
- Nvidia придумала, как законно обойти... (373)
- На Землю вот-вот упадёт советская... (390)
- Toyota и Waymo объявили о стратегическом... (346)
- Японские учёные научили цикад исполнять... (308)
- Квантовые сети научили самовосстанавливаться... (294)
- NASA продлило попытки связи с Lunar... (283)
Исследование: ИИ-генераторы кода часто ссылаются на несуществующие библиотеки, открывая двери киберпреступникам
Дата: 2025-05-02 19:10
Код, созданный искусственным интеллектом, регулярно содержит ссылки на несуществующие сторонние библиотеки, что открывает возможности для атак на цепочку поставок программного обеспечения. К такому выводу пришли исследователи из Университета Техаса в Сан-Антонио, чья работа будет представлена на симпозиуме USENIX Security Symposium. Учёные проанализировали 576 тыс. образцов кода, сгенерированных 16 популярными языковыми моделями, включая OpenAI и открытые решения. В 19,7% случаев зависимости (сторонние компоненты, необходимые для работы кода) оказались «галлюцинациями» — пакетами, которых не существует в публичных репозиториях.
Особую опасность такие ошибки представляют из-за повторяемости: 43% «галлюцинированных» названий появлялись в более чем 10 запросах, а 58% — повторялись хотя бы раз в 10 итерациях. Это позволяет злоумышленникам предсказуемо создавать вредоносные пакеты с такими именами и внедрять их в легитимные программы. Как объяснил ведущий автор исследования Джозеф Спраклен, если разработчик установит поддельную зависимость, то код злоумышленника выполнится на его системе, что может привести к утечке данных или установке бэкдоров.

Наиболее уязвимыми оказались открытые модели, такие как CodeLlama и DeepSeek, — они «галлюцинировали» в 22% случаев против 5% у коммерческих аналогов. Учёные связывают это с размером моделей: коммерческие решения, такие как ChatGPT, имеют в 10 раз больше параметров, что улучшает точность. При этом в рамках открытых моделей разница в размере не влияла на частоту ошибок, что указывает на роль других факторов: обучающих данных, тонкой настройки и механизмов безопасности.
Язык программирования также имел значение: JavaScript-код содержал 21% несуществующих зависимостей против 16% у Python. Исследователи предполагают, что причина — в 10-кратном превосходстве экосистемы JavaScript по числу пакетов и сложности неймспейсов, что затрудняет точное воспроизведение названий.
Проблема усугубляет риски «подмены зависимостей» — атак, при которых злоумышленник публикует вредоносный пакет с именем, совпадающим с легитимным, но более новой версией. В 2021 году подобная техника использовалась против Apple, Microsoft и Tesla. С ростом популярности ИИ-генераторов кода, по прогнозам Microsoft CTO Кевина Скотта, к 2030 году 95% программ может создаваться с их помощью, что увеличит масштаб угрозы.
«Галлюцинации в LLM — это не случайные ошибки, а системная уязвимость, — подчеркнул Спраклен. — Разработчикам критически важно проверять каждую зависимость, даже если её предложил ИИ». Исследователи призвали сообщество усилить механизмы верификации кода и разработать инструменты для автоматического обнаружения «галлюцинированных» пакетов, чтобы снизить риски для всей экосистемы разработки.
Подробнее на iXBT
Предыдущие новости
«Полимер действует как супергерой, мгновенно залечивая свои раны». США создали самозаживляющийся полимер DAP для защиты спутников от высокоскоростного космического мусора
Команда ученых из Техасского университета A&M разработала уникальный самозаживляющийся полимер Diels-Adler Polymer (DAP), который впервые в мире способен защищать спутники и космические аппараты от высокоскоростного космического мусора, движущегося со скоростью 8 км/с — быстрее пули. Материал, протестированный на наноуровне с использованием передовой технологии лазерного...
«Это сравнимо с попаданием в волос с расстояния 10 км». Китай впервые измерил расстояние от Земли до Луны в в дневное время — с точностью в 1 см
Китайская лаборатория глубокого космоса (DSEL) впервые в мире успешно провела лазерную дальнометрию Земля-Луна в условиях яркого дневного света. В ходе двухдневного эксперимента 26–27 апреля 2025 года лазерный луч, отправленный с Земли, преодолел 130 000 км, отразился от спутника Tiandu-1, находящегося на окололунной орбите, и вернулся, обеспечив точность измерений до...
Google откроет Gemini доступ ко всей информации о пользователях, которую она накопила
Гонка чат-ботов с искусственным интеллектом накаляется, и теперь Google собирается дать Gemini возможность понять пользователя как, возможно, никто другой. Gemini сможет не только запоминать предыдущие разговоры с человеком, но также учиться на его действиях в других приложениях: Gmail, «Google Календарь» и YouTube, сообщил президент Google Labs и Gemini Джош Вудворд (Josh...
Опубликованы изображения тонкого Samsung Galaxy S25 Edge — он получит батарею на 3900 мА·ч
До выпуска сверхтонкого смартфона Samsung Galaxy S25 Edge, по неподтверждённым данным, остаются менее двух недель, и уже сейчас вездесущие инсайдеры утверждают, что знают об устройстве всё. Его изображения и технические характеристики в результате очередной утечки опубликовал немецкоязычный ресурс WinFuture. Источник изображений:...