- В мессенджере Max появился сервис с... (7171)
- Xiaomi выпустила умный обогреватель для... (6491)
- В США запущена первая за 70 лет промышленная... (7212)
- Роскомнадзор опроверг сообщения о том, что... (6338)
- Регулятор США углубил расследование в... (12151)
- Лунный экипаж NASA повторно ушёл на карантин... (7338)
- Яндекс: количество станций «Бери заряд»... (7298)
- Игровые ноутбуки на новых процессорах Intel... (7607)
- Apple зарабатывает на чужом ИИ, пока Siri... (7484)
- Россия обогнала почти все страны «большой... (7062)
- Китайские учёные научили робота играть в... (7860)
- Европа получила ключ к ангстрёмным... (6574)
- Galaxy S22 Ultra оказался главным... (6862)
- Измеритель скорости интернета «Яндекс... (5786)
- Китайский космонавт совершил шестой выход в... (6835)
- Облачные провайдеры стали поднимать цены... (8634)
ИИ научился чинить собственные баги: Meta представила открытый фреймворк LlamaFirewall для защиты моделей от взломов и вредоносного кода
Дата: 2025-05-02 07:46
Meta* анонсировала LlamaFirewall — открытый фреймворк, призванный защитить приложения на базе больших языковых моделей (LLM) от современных киберрисков. Решение, опубликованное в репозитории GitHub, сочетает три уровня безопасности: PromptGuard 2, Agent Alignment Checks и CodeShield, позволяя разработчикам создавать многоуровневую защиту для чат-ботов и автономных агентов.
Ядро фреймворка, PromptGuard 2, анализирует пользовательские запросы в реальном времени, выявляя прямые атаки через инъекции промптов и попытки «джейлбрейка» — обхода ограничений модели. Второй компонент, Agent Alignment Checks, отслеживает логику работы автономных агентов, предотвращая перехват целей и косвенные инъекции. Третий элемент, CodeShield, представляет собой статический анализатор кода, блокирующий генерацию небезопасных или вредоносных скриптов.
Иллюстрация: Leonardo «Архитектура LlamaFirewall модульная, что даёт возможность комбинировать слои защиты от этапа обработки входных данных до финальных действий системы», — пояснили в Meta.
Параллельно компания представила обновлённые инструменты LlamaGuard и CyberSecEval. Последний, CyberSecEval 4, теперь включает бенчмарк AutoPatchBench для оценки способности ИИ-агентов автоматически исправлять уязвимости в коде на C/C++, обнаруженные через фаззинг. «AutoPatchBench стандартизирует тестирование ИИ-инструментов, что поможет понять их эффективность в устранении багов», — отметили разработчики.
Для поддержки сообщества Meta запустила программу Llama for Defenders, предоставляя партнёрам ранний доступ к экспериментальным и закрытым ИИ-решениям. В фокусе — борьба с мошенничеством: обнаружение фишинговых атак, фейкового контента и сценариев, где злоумышленники используют генеративный ИИ.
Отдельное внимание привлекла новая технология WhatsApp — Private Processing. Она позволяет обрабатывать пользовательские запросы через ИИ в изолированной среде, не передавая данные на сторонние серверы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Представлен абсолютно новый Jeep Compass 2025: с ДВС и без него
Новый Jeep Compass рассекречен благодаря фотографиям и деталям, опубликованным Сarscoops со ссылкой на Quatrorodas. Компактный внедорожник получил современный рубленый дизайн и будет доступен с тремя типами силовых установок: полностью электрической, гибридной и подключаемой гибридной. Производство начнётся в Италии в конце 2025 года, а в Северной Америке — в 2026 году, с...
WhatsApp преодолел отметку в 3 млрд пользователей и усиливает интеграцию с искусственным интеллектом
Марк Цукерберг, глава Meta*, в ходе конференц-звонка по итогам первого квартала 2025 года объявил, что ежемесячная аудитория WhatsApp превысила 3 млрд человек. Этот результат делает мессенджер, купленный Facebook (ныне Meta) за $19 млрд в 2014 году, одним из трёх приложений в мире с подобным охватом. При этом WhatsApp, основанный в 2009 году, по-прежнему остаётся бесплатным и...
Компания Radian Aerospace анонсировала многоразовый аппарат R3V для гиперзвуковых испытаний
Компания Radian Aerospace объявила о разработке многоразового возвращаемого космического аппарата R3V, который станет ключевым элементом для тестирования технологий будущего космоплана Radian One и коммерческих задач в области гиперзвука. Устройство высотой менее двух метров планируют запускать на малых или средних ракетах-носителях по суборбитальной траектории с последующим...
SpaceX посадила 440 ракет, но компания отстаёт от графика по запускам Falcon 9
Компания SpaceX успешно отправила в космос ракету-носитель Falcon 9 со спутниками Starlink. Этот запуск стал для ракеты 18-м по счёту. Ранее она участвовала в двух частных миссиях астронавтов на Международную космическую станцию, двух грузовых миссиях и доставке обсерватории Евклид, созданной Европейским космическим агентством. Спустя чуть более восьми минут после старта...