- Новая статья: Обзор Apple iPhone 17e:... (6524)
- Новая статья: Краткий обзор смартфона realme... (6596)
- Уже не Nokia, но зато должно быть недорого.... (6759)
- Небольшой мини-ПК, но есть место для трёх... (6328)
- SpaceX подала заявку на IPO. Оценка может... (6643)
- Ноутбук Dell XPS 14 проработал в режиме... (6227)
- Лабиринт откроет двери на следующей неделе:... (6508)
- Первый готовый ПК с новым процессором Ryzen... (6522)
- Заказал один SSD за 200 долларов, а получит... (7220)
- Смартфон с 52-герцевым цветным экраном E Ink... (5791)
- А есть в этом смартфоне что-то кроме... (6503)
- Китайские компании активно отъедают долю у... (5796)
- Текущее снижение цен на память — затишье... (5941)
- Киберпанк для панка: мозговые импланты... (5230)
- Стратегия Stormgate от экс-разработчиков... (5936)
- Китайский мини-ПК в форме шайбы от Lenovo... (5423)
ИИ научился чинить собственные баги: Meta представила открытый фреймворк LlamaFirewall для защиты моделей от взломов и вредоносного кода
Дата: 2025-05-02 07:46
Meta* анонсировала LlamaFirewall — открытый фреймворк, призванный защитить приложения на базе больших языковых моделей (LLM) от современных киберрисков. Решение, опубликованное в репозитории GitHub, сочетает три уровня безопасности: PromptGuard 2, Agent Alignment Checks и CodeShield, позволяя разработчикам создавать многоуровневую защиту для чат-ботов и автономных агентов.
Ядро фреймворка, PromptGuard 2, анализирует пользовательские запросы в реальном времени, выявляя прямые атаки через инъекции промптов и попытки «джейлбрейка» — обхода ограничений модели. Второй компонент, Agent Alignment Checks, отслеживает логику работы автономных агентов, предотвращая перехват целей и косвенные инъекции. Третий элемент, CodeShield, представляет собой статический анализатор кода, блокирующий генерацию небезопасных или вредоносных скриптов.
Иллюстрация: Leonardo «Архитектура LlamaFirewall модульная, что даёт возможность комбинировать слои защиты от этапа обработки входных данных до финальных действий системы», — пояснили в Meta.
Параллельно компания представила обновлённые инструменты LlamaGuard и CyberSecEval. Последний, CyberSecEval 4, теперь включает бенчмарк AutoPatchBench для оценки способности ИИ-агентов автоматически исправлять уязвимости в коде на C/C++, обнаруженные через фаззинг. «AutoPatchBench стандартизирует тестирование ИИ-инструментов, что поможет понять их эффективность в устранении багов», — отметили разработчики.
Для поддержки сообщества Meta запустила программу Llama for Defenders, предоставляя партнёрам ранний доступ к экспериментальным и закрытым ИИ-решениям. В фокусе — борьба с мошенничеством: обнаружение фишинговых атак, фейкового контента и сценариев, где злоумышленники используют генеративный ИИ.
Отдельное внимание привлекла новая технология WhatsApp — Private Processing. Она позволяет обрабатывать пользовательские запросы через ИИ в изолированной среде, не передавая данные на сторонние серверы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Представлен абсолютно новый Jeep Compass 2025: с ДВС и без него
Новый Jeep Compass рассекречен благодаря фотографиям и деталям, опубликованным Сarscoops со ссылкой на Quatrorodas. Компактный внедорожник получил современный рубленый дизайн и будет доступен с тремя типами силовых установок: полностью электрической, гибридной и подключаемой гибридной. Производство начнётся в Италии в конце 2025 года, а в Северной Америке — в 2026 году, с...
WhatsApp преодолел отметку в 3 млрд пользователей и усиливает интеграцию с искусственным интеллектом
Марк Цукерберг, глава Meta*, в ходе конференц-звонка по итогам первого квартала 2025 года объявил, что ежемесячная аудитория WhatsApp превысила 3 млрд человек. Этот результат делает мессенджер, купленный Facebook (ныне Meta) за $19 млрд в 2014 году, одним из трёх приложений в мире с подобным охватом. При этом WhatsApp, основанный в 2009 году, по-прежнему остаётся бесплатным и...
Компания Radian Aerospace анонсировала многоразовый аппарат R3V для гиперзвуковых испытаний
Компания Radian Aerospace объявила о разработке многоразового возвращаемого космического аппарата R3V, который станет ключевым элементом для тестирования технологий будущего космоплана Radian One и коммерческих задач в области гиперзвука. Устройство высотой менее двух метров планируют запускать на малых или средних ракетах-носителях по суборбитальной траектории с последующим...
SpaceX посадила 440 ракет, но компания отстаёт от графика по запускам Falcon 9
Компания SpaceX успешно отправила в космос ракету-носитель Falcon 9 со спутниками Starlink. Этот запуск стал для ракеты 18-м по счёту. Ранее она участвовала в двух частных миссиях астронавтов на Международную космическую станцию, двух грузовых миссиях и доставке обсерватории Евклид, созданной Европейским космическим агентством. Спустя чуть более восьми минут после старта...