- Владельцы компьютеров Mac с чипами M-серии... (5044)
- LinkedIn скрытно собирает данные о ПО,... (5565)
- Найдена третья галактика без тёмной... (4734)
- «Союз-5» всё никак не взлетит: запуск... (5712)
- Аэробот для Венеры сможет работать до 10 лет... (5489)
- В Google Chrome появится функция, которая... (4999)
- «Не верьте всему, что читаете. Bloomberg... (4591)
- Крупнейший в мире суперкомпьютер Илона Маска... (5082)
- Появились первые живые фото работающего... (4838)
- В следующем году натриевые аккумуляторы... (4656)
- Xiaomi представила монитор Redmi G25 2026 с... (5921)
- Представлен ПК Machenike Dawn Pro с... (5172)
- Американские ИИ-компании не смогут запустить... (4722)
- «История творится на наших глазах».... (5223)
- Космический корабль доставит на МКС конфеты,... (4990)
- Космическая обсерватория «Спектр-М» займётся... (4380)
ИИ научился чинить собственные баги: Meta* представила открытый фреймворк LlamaFirewall для защиты моделей от взломов и вредоносного кода
Дата: 2025-05-02 07:46
Meta* анонсировала LlamaFirewall — открытый фреймворк, призванный защитить приложения на базе больших языковых моделей (LLM) от современных киберрисков. Решение, опубликованное в репозитории GitHub, сочетает три уровня безопасности: PromptGuard 2, Agent Alignment Checks и CodeShield, позволяя разработчикам создавать многоуровневую защиту для чат-ботов и автономных агентов.
Ядро фреймворка, PromptGuard 2, анализирует пользовательские запросы в реальном времени, выявляя прямые атаки через инъекции промптов и попытки «джейлбрейка» — обхода ограничений модели. Второй компонент, Agent Alignment Checks, отслеживает логику работы автономных агентов, предотвращая перехват целей и косвенные инъекции. Третий элемент, CodeShield, представляет собой статический анализатор кода, блокирующий генерацию небезопасных или вредоносных скриптов.
Иллюстрация: Leonardo «Архитектура LlamaFirewall модульная, что даёт возможность комбинировать слои защиты от этапа обработки входных данных до финальных действий системы», — пояснили в Meta.
Параллельно компания представила обновлённые инструменты LlamaGuard и CyberSecEval. Последний, CyberSecEval 4, теперь включает бенчмарк AutoPatchBench для оценки способности ИИ-агентов автоматически исправлять уязвимости в коде на C/C++, обнаруженные через фаззинг. «AutoPatchBench стандартизирует тестирование ИИ-инструментов, что поможет понять их эффективность в устранении багов», — отметили разработчики.
Для поддержки сообщества Meta запустила программу Llama for Defenders, предоставляя партнёрам ранний доступ к экспериментальным и закрытым ИИ-решениям. В фокусе — борьба с мошенничеством: обнаружение фишинговых атак, фейкового контента и сценариев, где злоумышленники используют генеративный ИИ.
Отдельное внимание привлекла новая технология WhatsApp — Private Processing. Она позволяет обрабатывать пользовательские запросы через ИИ в изолированной среде, не передавая данные на сторонние серверы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Альтману не понравится: Microsoft тестирует Grok и DeepSeek для замены Copilot. Grok разместят на платформе Azure AI Foundry
Microsoft разрабатывает внутренние модели рассуждений на основе ИИ, чтобы снизить свою зависимость от OpenAI, и начала тестировать модели из xAI, Meta (признана в России экстремистcкой и запрещена) и DeepSeek в качестве потенциальных замен в системе искусственного интеллекта-помощника Copilot. На этой неделе стало известно, что Microsoft ведёт переговоры с xAI, стартапом Илона...
Космическая авария на скорости 3,2 миллиона километров в час: пульсар повредил гигантскую структуру Млечного Пути
Астрономы обнаружили, что гигантская тонкая структура в центре нашей галактики получила «перелом» из-за столкновения с быстро движущейся нейтронной звездой. Это открытие, сделанное с помощью рентгеновской обсерватории «Чандра» и радиотелескопов, проливает свет на процессы, формирующие магнитные «скелеты» Млечного Пути. Космическая «змея» G359.13, длиной 230 световых лет,...
Хит продаж Ford Fiesta могут «возродить из пепла» при помощи Volkswagen. Сотрудничество Ford и VW оказалось «очень, очень, очень успешным»
Классическая модель автомобиля Ford Fiesta может быть «возрождена из пепла» при помощи Volkswagen. По данным Auto Express, Ford и Volkswagen изучают новые проекты сотрудничества после достижения «очень успешных» результатов в ходе своего первого сотрудничества. Последняя Fiesta от Ford сошла с конвейера в июле 2023 года. Но с тех пор модели Explorer и Capri от Ford были...
Intel добавила 25% к играм на Lunar Lake с последними обновлениями драйверов
Компания Intel представила обновление драйверов версии 32.0.101.6734, которое улучшает производительность интегрированных графических ускорителей Arc 130V и 140V в мобильных процессорах Core Ultra 200V (кодовое имя Lunar Lake). Эти чипы, позиционируемые как экспериментальные, останутся уникальным решением — Intel не планирует повторять их архитектуру в будущих поколениях....