- Asus подняла цены на новые ноутбуки со... (4279)
- Современный 55-дюймовый телевизор Mini LED... (5026)
- Эта камера понимает, что делает человек или... (5005)
- Платформа Snapdragon 8 Elite Gen 6 может... (5464)
- Корабль Orion совершил первое включение... (5574)
- Supermicro начала собственное расследование... (5943)
- Представлен планшет Moto Pad... (4461)
- Представлен смартфон Moto G Stylus 2026:... (5382)
- «Лучший босс, что я видел»: фанатов Diablo... (4527)
- Стране нужен FP64: AMD пообещала повысить... (5686)
- Появились первые официальные изображения... (4406)
- Xiaomi анонcировала более безопасные внешние... (4519)
- «Большинство из тех 90%, кто остался жив,... (5220)
- «Последний кусочек пазла». Tesla выпустила... (4839)
- Глава Google дал понять, что компания... (4720)
- Самая большая батарея в истории... (4690)
ИИ научился чинить собственные баги: Meta представила открытый фреймворк LlamaFirewall для защиты моделей от взломов и вредоносного кода
Дата: 2025-05-02 07:46
Meta* анонсировала LlamaFirewall — открытый фреймворк, призванный защитить приложения на базе больших языковых моделей (LLM) от современных киберрисков. Решение, опубликованное в репозитории GitHub, сочетает три уровня безопасности: PromptGuard 2, Agent Alignment Checks и CodeShield, позволяя разработчикам создавать многоуровневую защиту для чат-ботов и автономных агентов.
Ядро фреймворка, PromptGuard 2, анализирует пользовательские запросы в реальном времени, выявляя прямые атаки через инъекции промптов и попытки «джейлбрейка» — обхода ограничений модели. Второй компонент, Agent Alignment Checks, отслеживает логику работы автономных агентов, предотвращая перехват целей и косвенные инъекции. Третий элемент, CodeShield, представляет собой статический анализатор кода, блокирующий генерацию небезопасных или вредоносных скриптов.
Иллюстрация: Leonardo «Архитектура LlamaFirewall модульная, что даёт возможность комбинировать слои защиты от этапа обработки входных данных до финальных действий системы», — пояснили в Meta.
Параллельно компания представила обновлённые инструменты LlamaGuard и CyberSecEval. Последний, CyberSecEval 4, теперь включает бенчмарк AutoPatchBench для оценки способности ИИ-агентов автоматически исправлять уязвимости в коде на C/C++, обнаруженные через фаззинг. «AutoPatchBench стандартизирует тестирование ИИ-инструментов, что поможет понять их эффективность в устранении багов», — отметили разработчики.
Для поддержки сообщества Meta запустила программу Llama for Defenders, предоставляя партнёрам ранний доступ к экспериментальным и закрытым ИИ-решениям. В фокусе — борьба с мошенничеством: обнаружение фишинговых атак, фейкового контента и сценариев, где злоумышленники используют генеративный ИИ.
Отдельное внимание привлекла новая технология WhatsApp — Private Processing. Она позволяет обрабатывать пользовательские запросы через ИИ в изолированной среде, не передавая данные на сторонние серверы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Представлен абсолютно новый Jeep Compass 2025: с ДВС и без него
Новый Jeep Compass рассекречен благодаря фотографиям и деталям, опубликованным Сarscoops со ссылкой на Quatrorodas. Компактный внедорожник получил современный рубленый дизайн и будет доступен с тремя типами силовых установок: полностью электрической, гибридной и подключаемой гибридной. Производство начнётся в Италии в конце 2025 года, а в Северной Америке — в 2026 году, с...
WhatsApp преодолел отметку в 3 млрд пользователей и усиливает интеграцию с искусственным интеллектом
Марк Цукерберг, глава Meta*, в ходе конференц-звонка по итогам первого квартала 2025 года объявил, что ежемесячная аудитория WhatsApp превысила 3 млрд человек. Этот результат делает мессенджер, купленный Facebook (ныне Meta) за $19 млрд в 2014 году, одним из трёх приложений в мире с подобным охватом. При этом WhatsApp, основанный в 2009 году, по-прежнему остаётся бесплатным и...
Компания Radian Aerospace анонсировала многоразовый аппарат R3V для гиперзвуковых испытаний
Компания Radian Aerospace объявила о разработке многоразового возвращаемого космического аппарата R3V, который станет ключевым элементом для тестирования технологий будущего космоплана Radian One и коммерческих задач в области гиперзвука. Устройство высотой менее двух метров планируют запускать на малых или средних ракетах-носителях по суборбитальной траектории с последующим...
SpaceX посадила 440 ракет, но компания отстаёт от графика по запускам Falcon 9
Компания SpaceX успешно отправила в космос ракету-носитель Falcon 9 со спутниками Starlink. Этот запуск стал для ракеты 18-м по счёту. Ранее она участвовала в двух частных миссиях астронавтов на Международную космическую станцию, двух грузовых миссиях и доставке обсерватории Евклид, созданной Европейским космическим агентством. Спустя чуть более восьми минут после старта...