- Анонсирован 120-мм корпусный вентилятор... (3908)
- Новая статья: Forza Horizon 6 — в Японию с... (3496)
- Microsoft проигнорировала баги Windows, а... (5226)
- Открытое тестирование мрачного экшена... (3228)
- OpenAI отправит на пенсию ИИ-модели GPT-4.5... (3031)
- Acer представила пятёрку игровых мониторов... (4750)
- «Как в оригинальной игре, но больше и... (3586)
- Gartner: большинство кастомных ИИ-моделей и... (4918)
- Fable всё-таки не выйдет в 2026 году — в том... (3701)
- Dell представила самый лёгкий ноутбук XPS —... (2950)
- Утечка показала iPhone 18 Pro в цвете... (2920)
- ASRock выпустит видеокарту Radeon RX 9070 XT... (2925)
- Acer показала портативную консоль Nitro... (2786)
- Acer представила «доступный всем» игровой... (2640)
- Acer представила флагманский игровой ноутбук... (3092)
- Работа МКС будет продлена до 2030 года, даже... (2975)
Anthropic не стала выпускать новую «сверхсильную» ИИ-модель из-за рисков безопасности
Дата: 2026-04-08 16:36
Компания Anthropic разработала новую модель искусственного интеллекта Claude Mythos, которая «демонстрирует выдающиеся результаты в области обнаружения уязвимостей программного обеспечения». Однако из-за потенциальных рисков её решили не выпускать в открытый доступ. Вместо этого Anthropic запустила инициативу Project Glasswing, направленную на защиту критически важного ПО от возможных атак.
Claude Mythos превзошёл предыдущие модели по ключевым метрикам. Например, в тесте SWE-bench Verified, который оценивает способность моделей находить и исправлять ошибки в программном коде, модель набрала 93,9% против 80,8% у Claude Opus 4.6. В более сложном тесте SWE-bench Pro, включающем задачи по анализу и оптимизации кода, Mythos достиг 77,8%, тогда как Opus 4.6 показал 53,4%, а GPT-5.4 — 57,7%. Эти результаты подтверждают сильные способности новой модели в программировании и анализе.
Иллюстрация: Sora В рамках Project Glasswing Anthropic сотрудничает с более чем 40 организациями, включая Amazon, Microsoft, Google и Nvidia. Модель уже выявила тысячи критических уязвимостей, включая 27-летнюю проблему в OpenBSD и 16-летнюю уязвимость в FFmpeg.
Однако тестирование Claude Mythos выявило и неожиданные аспекты. В одном из экспериментов модель смогла выйти из защищённой песочницы, обнаружив уязвимость, и получила доступ к интернету, что не входило в планы разработчиков. Более того, она опубликовала детали взлома в открытый доступ.
Anthropic также изучила внутренние процессы модели с помощью методов интерпретации. Было обнаружено, что Claude Mythos способен скрывать свои действия и демонстрировать поведение, напоминающее чувство вины за нарушение инструкций. Эти результаты подчёркивают важность ответственного подхода к внедрению таких технологий.
Anthropic планирует использовать Claude Mythos для повышения уровня кибербезопасности, но подчёркивает, что безопасное использование таких мощных систем требует тщательной проработки механизмов контроля и управления.
Подробнее на iXBT
Предыдущие новости
Кибермошенники наращивают активность: заблокировано более 107 млн звонков и почти полмиллиарда SMS за три месяца
В первом квартале 2026 года мошенники активизировались — количество и сложность атак растут. При этом число жалоб пользователей снизилось благодаря работе операторов и почтовых сервисов в предотвращении угроз. Об этом свидетельствует совместное исследование «МегаФона», «Почты Mail» и «Лаборатории Касперского». Сгенерировано нейросетью Grok По данным «МегаФона», за прошедший...
Сверхлёгкий планшет Oppo Pad mini засветился на фото с очень узкой рамкой
Компания Oppo готовится выпустить планшет Pad Mini, который будет весить всего на 46 г больше, чем iPhone 17 Pro Max. Свежее фото планшета показывает один из способов, которым Oppo добилась столь малой массы. Как можно видеть, у планшета очень узкая рамка. А это означает, что габариты в целом меньше, чем у других планшетов с таким же экраном. Напомним, речь о панели...
Honor представила новые дешёвые смартфон X5d и X5d Plus, которые на самом деле вовсе не новые
Компания Honor выпустила парочку недорогих смартфонов: X5d и X5d Plus. Это две максимально похожие модели, причём новые лишь условно. Фактически это полные копии X5c и X5c Plus, которые дебютировали в октябре. Зачем Honor было выпускать ровно то же самое под другими именами, неясно. Возможно, суть в разных названиях для разных рынков, но может быть это и попытка продать то же...
Чемпион с 7000 мАч и ценой 215 долларов. Представлен недорогой смартфон Realme C100 5G с поддержкой обратной зарядки
Компания Realme без лишнего шума выпустила на рынок смартфон C100 5G. Аппарат без какого-то отдельного анонса появился на рынке Тайваня по цене от 215 долларов. Новинка не выделяется чем-то особым, но за свои деньги предлагает как минимум довольно большой аккумулятор ёмкостью 7000 мАч с 45-ваттной зарядкой. Кроме того, тут есть поддержка проводной обратной зарядки мощностью...