- Xiaomi рассказала, насколько на самом деле... (6521)
- Xiaomi повысит цены на Redmi K90 Pro Max и... (6411)
- Anysphere выпустил ИИ-помощника по написанию... (8561)
- Смартфон Xiaomi Redmi Note 17 Pro Max может... (6251)
- От ИИ-стартапа Poolside разом отвернулись... (6725)
- Астрономы нашли у миллисекундных пульсаров... (6578)
- ИИ-модели оказались склонны лгать и... (6206)
- Спрос на аренду устаревающих ускорителей... (6824)
- Apple упростила смену региона в аккаунте для... (6375)
- «Яндекс» готовит массовый запуск роботакси и... (6506)
- Apple признала устаревшим ещё один... (6135)
- Мошенники начали маскировать вредоносы под... (5904)
- JEDEC разрешит памяти HBM4E подрасти — ради... (5891)
- Швейцарский стартап превратил б/у... (5748)
- Мир выбирает возобновляемую энергию. На... (5544)
- Чтобы пожароопасный разъём 12v-2x6 был более... (6570)
ИИ научился чинить собственные баги: Meta* представила открытый фреймворк LlamaFirewall для защиты моделей от взломов и вредоносного кода
Дата: 2025-05-02 07:46
Meta* анонсировала LlamaFirewall — открытый фреймворк, призванный защитить приложения на базе больших языковых моделей (LLM) от современных киберрисков. Решение, опубликованное в репозитории GitHub, сочетает три уровня безопасности: PromptGuard 2, Agent Alignment Checks и CodeShield, позволяя разработчикам создавать многоуровневую защиту для чат-ботов и автономных агентов.
Ядро фреймворка, PromptGuard 2, анализирует пользовательские запросы в реальном времени, выявляя прямые атаки через инъекции промптов и попытки «джейлбрейка» — обхода ограничений модели. Второй компонент, Agent Alignment Checks, отслеживает логику работы автономных агентов, предотвращая перехват целей и косвенные инъекции. Третий элемент, CodeShield, представляет собой статический анализатор кода, блокирующий генерацию небезопасных или вредоносных скриптов.
Иллюстрация: Leonardo «Архитектура LlamaFirewall модульная, что даёт возможность комбинировать слои защиты от этапа обработки входных данных до финальных действий системы», — пояснили в Meta.
Параллельно компания представила обновлённые инструменты LlamaGuard и CyberSecEval. Последний, CyberSecEval 4, теперь включает бенчмарк AutoPatchBench для оценки способности ИИ-агентов автоматически исправлять уязвимости в коде на C/C++, обнаруженные через фаззинг. «AutoPatchBench стандартизирует тестирование ИИ-инструментов, что поможет понять их эффективность в устранении багов», — отметили разработчики.
Для поддержки сообщества Meta запустила программу Llama for Defenders, предоставляя партнёрам ранний доступ к экспериментальным и закрытым ИИ-решениям. В фокусе — борьба с мошенничеством: обнаружение фишинговых атак, фейкового контента и сценариев, где злоумышленники используют генеративный ИИ.
Отдельное внимание привлекла новая технология WhatsApp — Private Processing. Она позволяет обрабатывать пользовательские запросы через ИИ в изолированной среде, не передавая данные на сторонние серверы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Альтману не понравится: Microsoft тестирует Grok и DeepSeek для замены Copilot. Grok разместят на платформе Azure AI Foundry
Microsoft разрабатывает внутренние модели рассуждений на основе ИИ, чтобы снизить свою зависимость от OpenAI, и начала тестировать модели из xAI, Meta (признана в России экстремистcкой и запрещена) и DeepSeek в качестве потенциальных замен в системе искусственного интеллекта-помощника Copilot. На этой неделе стало известно, что Microsoft ведёт переговоры с xAI, стартапом Илона...
Космическая авария на скорости 3,2 миллиона километров в час: пульсар повредил гигантскую структуру Млечного Пути
Астрономы обнаружили, что гигантская тонкая структура в центре нашей галактики получила «перелом» из-за столкновения с быстро движущейся нейтронной звездой. Это открытие, сделанное с помощью рентгеновской обсерватории «Чандра» и радиотелескопов, проливает свет на процессы, формирующие магнитные «скелеты» Млечного Пути. Космическая «змея» G359.13, длиной 230 световых лет,...
Хит продаж Ford Fiesta могут «возродить из пепла» при помощи Volkswagen. Сотрудничество Ford и VW оказалось «очень, очень, очень успешным»
Классическая модель автомобиля Ford Fiesta может быть «возрождена из пепла» при помощи Volkswagen. По данным Auto Express, Ford и Volkswagen изучают новые проекты сотрудничества после достижения «очень успешных» результатов в ходе своего первого сотрудничества. Последняя Fiesta от Ford сошла с конвейера в июле 2023 года. Но с тех пор модели Explorer и Capri от Ford были...
Intel добавила 25% к играм на Lunar Lake с последними обновлениями драйверов
Компания Intel представила обновление драйверов версии 32.0.101.6734, которое улучшает производительность интегрированных графических ускорителей Arc 130V и 140V в мобильных процессорах Core Ultra 200V (кодовое имя Lunar Lake). Эти чипы, позиционируемые как экспериментальные, останутся уникальным решением — Intel не планирует повторять их архитектуру в будущих поколениях....