- Два цилиндра сверху, три — снизу:... (411)
- Очередное научное исследование показывает... (451)
- 10 050 мАч, никакого AMOLED и «мягкий» экран... (693)
- Новый кроссовер Mazda EZ-60 появился у... (634)
- Является ли хот-дог сэндвичем? AMD локально... (491)
- В продаже появился «секретный» Aurus Senat:... (333)
- Сначала пристыдила Dell за цены, а теперь... (494)
- «Сто тысяч благодарностей»: хоррор Bye Sweet... (486)
- Несимметрично размещённый разъём питания у... (389)
- От видеозвонков до управления чайником:... (483)
- Смартфон OnePlus Turbo с батареей на 9000... (491)
- Российское Yadro создаст собственный... (743)
- Google позволила пользователям менять адреса... (698)
- На Auto.ru продают уникальный гибрид: пикап... (474)
- Непрерывный зум без компромиссов: как... (500)
- Nvidia собирается продавать Китаю ускорители... (515)
ИИ научился чинить собственные баги: Meta* представила открытый фреймворк LlamaFirewall для защиты моделей от взломов и вредоносного кода
Дата: 2025-05-02 07:46
Meta* анонсировала LlamaFirewall — открытый фреймворк, призванный защитить приложения на базе больших языковых моделей (LLM) от современных киберрисков. Решение, опубликованное в репозитории GitHub, сочетает три уровня безопасности: PromptGuard 2, Agent Alignment Checks и CodeShield, позволяя разработчикам создавать многоуровневую защиту для чат-ботов и автономных агентов.
Ядро фреймворка, PromptGuard 2, анализирует пользовательские запросы в реальном времени, выявляя прямые атаки через инъекции промптов и попытки «джейлбрейка» — обхода ограничений модели. Второй компонент, Agent Alignment Checks, отслеживает логику работы автономных агентов, предотвращая перехват целей и косвенные инъекции. Третий элемент, CodeShield, представляет собой статический анализатор кода, блокирующий генерацию небезопасных или вредоносных скриптов.
Иллюстрация: Leonardo «Архитектура LlamaFirewall модульная, что даёт возможность комбинировать слои защиты от этапа обработки входных данных до финальных действий системы», — пояснили в Meta.
Параллельно компания представила обновлённые инструменты LlamaGuard и CyberSecEval. Последний, CyberSecEval 4, теперь включает бенчмарк AutoPatchBench для оценки способности ИИ-агентов автоматически исправлять уязвимости в коде на C/C++, обнаруженные через фаззинг. «AutoPatchBench стандартизирует тестирование ИИ-инструментов, что поможет понять их эффективность в устранении багов», — отметили разработчики.
Для поддержки сообщества Meta запустила программу Llama for Defenders, предоставляя партнёрам ранний доступ к экспериментальным и закрытым ИИ-решениям. В фокусе — борьба с мошенничеством: обнаружение фишинговых атак, фейкового контента и сценариев, где злоумышленники используют генеративный ИИ.
Отдельное внимание привлекла новая технология WhatsApp — Private Processing. Она позволяет обрабатывать пользовательские запросы через ИИ в изолированной среде, не передавая данные на сторонние серверы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Альтману не понравится: Microsoft тестирует Grok и DeepSeek для замены Copilot. Grok разместят на платформе Azure AI Foundry
Microsoft разрабатывает внутренние модели рассуждений на основе ИИ, чтобы снизить свою зависимость от OpenAI, и начала тестировать модели из xAI, Meta (признана в России экстремистcкой и запрещена) и DeepSeek в качестве потенциальных замен в системе искусственного интеллекта-помощника Copilot. На этой неделе стало известно, что Microsoft ведёт переговоры с xAI, стартапом Илона...
Космическая авария на скорости 3,2 миллиона километров в час: пульсар повредил гигантскую структуру Млечного Пути
Астрономы обнаружили, что гигантская тонкая структура в центре нашей галактики получила «перелом» из-за столкновения с быстро движущейся нейтронной звездой. Это открытие, сделанное с помощью рентгеновской обсерватории «Чандра» и радиотелескопов, проливает свет на процессы, формирующие магнитные «скелеты» Млечного Пути. Космическая «змея» G359.13, длиной 230 световых лет,...
Хит продаж Ford Fiesta могут «возродить из пепла» при помощи Volkswagen. Сотрудничество Ford и VW оказалось «очень, очень, очень успешным»
Классическая модель автомобиля Ford Fiesta может быть «возрождена из пепла» при помощи Volkswagen. По данным Auto Express, Ford и Volkswagen изучают новые проекты сотрудничества после достижения «очень успешных» результатов в ходе своего первого сотрудничества. Последняя Fiesta от Ford сошла с конвейера в июле 2023 года. Но с тех пор модели Explorer и Capri от Ford были...
Intel добавила 25% к играм на Lunar Lake с последними обновлениями драйверов
Компания Intel представила обновление драйверов версии 32.0.101.6734, которое улучшает производительность интегрированных графических ускорителей Arc 130V и 140V в мобильных процессорах Core Ultra 200V (кодовое имя Lunar Lake). Эти чипы, позиционируемые как экспериментальные, останутся уникальным решением — Intel не планирует повторять их архитектуру в будущих поколениях....