- Hazelight похвасталась продажами A Way Out,... (4765)
- 9000 мАч заряжаются за полчаса на 54%. Обзор... (4536)
- ВТБ заменит ИИ-ускорители NVIDIA на... (4857)
- Чемпион с 7000 мАч и ценой 215 долларов.... (4428)
- Представлено Insta360 Snap — цифровое... (4710)
- X запустила перевод публикаций и... (5661)
- Honor представила новые дешёвые смартфон X5d... (5635)
- Сверхлёгкий планшет Oppo Pad mini засветился... (5708)
- Кибермошенники наращивают активность:... (4676)
- MSI и Asus не собираются выпускать новые... (4903)
- Anthropic не стала выпускать новую... (5622)
- ЦРУ использовало секретную технологию... (5003)
- В Wildberries запустили ИИ-примерку... (5978)
- TikTok инвестирует ещё €1 млрд в ЦОД в... (5705)
- Сбер выпустил «космическую» ИИ-монету с... (4989)
- Обойдутся без Nvidia: Alibaba запустит... (4445)
ИИ научился чинить собственные баги: Meta представила открытый фреймворк LlamaFirewall для защиты моделей от взломов и вредоносного кода
Дата: 2025-05-02 07:46
Meta* анонсировала LlamaFirewall — открытый фреймворк, призванный защитить приложения на базе больших языковых моделей (LLM) от современных киберрисков. Решение, опубликованное в репозитории GitHub, сочетает три уровня безопасности: PromptGuard 2, Agent Alignment Checks и CodeShield, позволяя разработчикам создавать многоуровневую защиту для чат-ботов и автономных агентов.
Ядро фреймворка, PromptGuard 2, анализирует пользовательские запросы в реальном времени, выявляя прямые атаки через инъекции промптов и попытки «джейлбрейка» — обхода ограничений модели. Второй компонент, Agent Alignment Checks, отслеживает логику работы автономных агентов, предотвращая перехват целей и косвенные инъекции. Третий элемент, CodeShield, представляет собой статический анализатор кода, блокирующий генерацию небезопасных или вредоносных скриптов.
Иллюстрация: Leonardo «Архитектура LlamaFirewall модульная, что даёт возможность комбинировать слои защиты от этапа обработки входных данных до финальных действий системы», — пояснили в Meta.
Параллельно компания представила обновлённые инструменты LlamaGuard и CyberSecEval. Последний, CyberSecEval 4, теперь включает бенчмарк AutoPatchBench для оценки способности ИИ-агентов автоматически исправлять уязвимости в коде на C/C++, обнаруженные через фаззинг. «AutoPatchBench стандартизирует тестирование ИИ-инструментов, что поможет понять их эффективность в устранении багов», — отметили разработчики.
Для поддержки сообщества Meta запустила программу Llama for Defenders, предоставляя партнёрам ранний доступ к экспериментальным и закрытым ИИ-решениям. В фокусе — борьба с мошенничеством: обнаружение фишинговых атак, фейкового контента и сценариев, где злоумышленники используют генеративный ИИ.
Отдельное внимание привлекла новая технология WhatsApp — Private Processing. Она позволяет обрабатывать пользовательские запросы через ИИ в изолированной среде, не передавая данные на сторонние серверы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Представлен абсолютно новый Jeep Compass 2025: с ДВС и без него
Новый Jeep Compass рассекречен благодаря фотографиям и деталям, опубликованным Сarscoops со ссылкой на Quatrorodas. Компактный внедорожник получил современный рубленый дизайн и будет доступен с тремя типами силовых установок: полностью электрической, гибридной и подключаемой гибридной. Производство начнётся в Италии в конце 2025 года, а в Северной Америке — в 2026 году, с...
WhatsApp преодолел отметку в 3 млрд пользователей и усиливает интеграцию с искусственным интеллектом
Марк Цукерберг, глава Meta*, в ходе конференц-звонка по итогам первого квартала 2025 года объявил, что ежемесячная аудитория WhatsApp превысила 3 млрд человек. Этот результат делает мессенджер, купленный Facebook (ныне Meta) за $19 млрд в 2014 году, одним из трёх приложений в мире с подобным охватом. При этом WhatsApp, основанный в 2009 году, по-прежнему остаётся бесплатным и...
Компания Radian Aerospace анонсировала многоразовый аппарат R3V для гиперзвуковых испытаний
Компания Radian Aerospace объявила о разработке многоразового возвращаемого космического аппарата R3V, который станет ключевым элементом для тестирования технологий будущего космоплана Radian One и коммерческих задач в области гиперзвука. Устройство высотой менее двух метров планируют запускать на малых или средних ракетах-носителях по суборбитальной траектории с последующим...
SpaceX посадила 440 ракет, но компания отстаёт от графика по запускам Falcon 9
Компания SpaceX успешно отправила в космос ракету-носитель Falcon 9 со спутниками Starlink. Этот запуск стал для ракеты 18-м по счёту. Ранее она участвовала в двух частных миссиях астронавтов на Международную космическую станцию, двух грузовых миссиях и доставке обсерватории Евклид, созданной Европейским космическим агентством. Спустя чуть более восьми минут после старта...