- Microsoft закроет приложение Outlook Lite... (1260)
- Уже 50 % сотрудников в США используют ИИ в... (1165)
- QD-OLED, 1440p и 240 Гц всего за $350: Dell... (1867)
- Asus представила первую плату Mini-ITX серии... (1574)
- Завтра смартфон Vivo V70 поступит в продажу... (1390)
- Учёные превратили каплю жидкого кристалла в... (1730)
- Intel зачистила официальный сайт от старых... (1261)
- Китайские власти за десять лет потратили на... (1099)
- Первый iPhone Fold выведет Apple в тройку... (1363)
- ORG: зависимость Великобритании от... (1209)
- Microsoft обрушила рынок углеродных... (1297)
- Кооперативный пиратский экшен Windrose... (1352)
- Смартфон Trump Mobile T1 показался в новом... (1378)
- Китай почти догнал США в сфере ИИ и даже уже... (1429)
- Российские сайты и сервисы стали ухудшать... (1510)
- Украденные хакерами данные Rockstar... (1136)
ИИ научился чинить собственные баги: Meta* представила открытый фреймворк LlamaFirewall для защиты моделей от взломов и вредоносного кода
Дата: 2025-05-02 07:46
Meta* анонсировала LlamaFirewall — открытый фреймворк, призванный защитить приложения на базе больших языковых моделей (LLM) от современных киберрисков. Решение, опубликованное в репозитории GitHub, сочетает три уровня безопасности: PromptGuard 2, Agent Alignment Checks и CodeShield, позволяя разработчикам создавать многоуровневую защиту для чат-ботов и автономных агентов.
Ядро фреймворка, PromptGuard 2, анализирует пользовательские запросы в реальном времени, выявляя прямые атаки через инъекции промптов и попытки «джейлбрейка» — обхода ограничений модели. Второй компонент, Agent Alignment Checks, отслеживает логику работы автономных агентов, предотвращая перехват целей и косвенные инъекции. Третий элемент, CodeShield, представляет собой статический анализатор кода, блокирующий генерацию небезопасных или вредоносных скриптов.
Иллюстрация: Leonardo «Архитектура LlamaFirewall модульная, что даёт возможность комбинировать слои защиты от этапа обработки входных данных до финальных действий системы», — пояснили в Meta.
Параллельно компания представила обновлённые инструменты LlamaGuard и CyberSecEval. Последний, CyberSecEval 4, теперь включает бенчмарк AutoPatchBench для оценки способности ИИ-агентов автоматически исправлять уязвимости в коде на C/C++, обнаруженные через фаззинг. «AutoPatchBench стандартизирует тестирование ИИ-инструментов, что поможет понять их эффективность в устранении багов», — отметили разработчики.
Для поддержки сообщества Meta запустила программу Llama for Defenders, предоставляя партнёрам ранний доступ к экспериментальным и закрытым ИИ-решениям. В фокусе — борьба с мошенничеством: обнаружение фишинговых атак, фейкового контента и сценариев, где злоумышленники используют генеративный ИИ.
Отдельное внимание привлекла новая технология WhatsApp — Private Processing. Она позволяет обрабатывать пользовательские запросы через ИИ в изолированной среде, не передавая данные на сторонние серверы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Альтману не понравится: Microsoft тестирует Grok и DeepSeek для замены Copilot. Grok разместят на платформе Azure AI Foundry
Microsoft разрабатывает внутренние модели рассуждений на основе ИИ, чтобы снизить свою зависимость от OpenAI, и начала тестировать модели из xAI, Meta (признана в России экстремистcкой и запрещена) и DeepSeek в качестве потенциальных замен в системе искусственного интеллекта-помощника Copilot. На этой неделе стало известно, что Microsoft ведёт переговоры с xAI, стартапом Илона...
Космическая авария на скорости 3,2 миллиона километров в час: пульсар повредил гигантскую структуру Млечного Пути
Астрономы обнаружили, что гигантская тонкая структура в центре нашей галактики получила «перелом» из-за столкновения с быстро движущейся нейтронной звездой. Это открытие, сделанное с помощью рентгеновской обсерватории «Чандра» и радиотелескопов, проливает свет на процессы, формирующие магнитные «скелеты» Млечного Пути. Космическая «змея» G359.13, длиной 230 световых лет,...
Хит продаж Ford Fiesta могут «возродить из пепла» при помощи Volkswagen. Сотрудничество Ford и VW оказалось «очень, очень, очень успешным»
Классическая модель автомобиля Ford Fiesta может быть «возрождена из пепла» при помощи Volkswagen. По данным Auto Express, Ford и Volkswagen изучают новые проекты сотрудничества после достижения «очень успешных» результатов в ходе своего первого сотрудничества. Последняя Fiesta от Ford сошла с конвейера в июле 2023 года. Но с тех пор модели Explorer и Capri от Ford были...
Intel добавила 25% к играм на Lunar Lake с последними обновлениями драйверов
Компания Intel представила обновление драйверов версии 32.0.101.6734, которое улучшает производительность интегрированных графических ускорителей Arc 130V и 140V в мобильных процессорах Core Ultra 200V (кодовое имя Lunar Lake). Эти чипы, позиционируемые как экспериментальные, останутся уникальным решением — Intel не планирует повторять их архитектуру в будущих поколениях....