- От исторического максимума 2000 года курс... (1153)
- Глава Anthropic предрёк исчезновение... (1467)
- Дефицит процессоров бьёт по рынку сильнее,... (901)
- Asus подтвердила, что её платы способны... (1099)
- Новая статья: Samson — «Смута» не у нас... (1037)
- Империя Adobe рушится: конкуренты нашли у... (959)
- Суд возобновил иск VLSI к Intel на $3 млрд и... (860)
- В I квартале мировые поставки ПК выросли на... (622)
- Plaion возродила ретро-приставку Neo Geo AES... (981)
- AOC выпустила 24,5-дюймовый игровой монитор... (726)
- NASA хочет устроить на Луне пожар и изучить... (1252)
- TSMC запланировала начать опытный выпуск... (1288)
- «Увидимся в мае»: Lenovo показала грядущий... (1283)
- Нидерландский боевой корабль отследили с... (1355)
- На зонде «Вояджер-1» отключили один из... (1357)
- В Китае тяжёлые беспилотники стали... (1564)
Anthropic не стала выпускать новую «сверхсильную» ИИ-модель из-за рисков безопасности
Дата: 2026-04-08 16:36
Компания Anthropic разработала новую модель искусственного интеллекта Claude Mythos, которая «демонстрирует выдающиеся результаты в области обнаружения уязвимостей программного обеспечения». Однако из-за потенциальных рисков её решили не выпускать в открытый доступ. Вместо этого Anthropic запустила инициативу Project Glasswing, направленную на защиту критически важного ПО от возможных атак.
Claude Mythos превзошёл предыдущие модели по ключевым метрикам. Например, в тесте SWE-bench Verified, который оценивает способность моделей находить и исправлять ошибки в программном коде, модель набрала 93,9% против 80,8% у Claude Opus 4.6. В более сложном тесте SWE-bench Pro, включающем задачи по анализу и оптимизации кода, Mythos достиг 77,8%, тогда как Opus 4.6 показал 53,4%, а GPT-5.4 — 57,7%. Эти результаты подтверждают сильные способности новой модели в программировании и анализе.
Иллюстрация: Sora В рамках Project Glasswing Anthropic сотрудничает с более чем 40 организациями, включая Amazon, Microsoft, Google и Nvidia. Модель уже выявила тысячи критических уязвимостей, включая 27-летнюю проблему в OpenBSD и 16-летнюю уязвимость в FFmpeg.
Однако тестирование Claude Mythos выявило и неожиданные аспекты. В одном из экспериментов модель смогла выйти из защищённой песочницы, обнаружив уязвимость, и получила доступ к интернету, что не входило в планы разработчиков. Более того, она опубликовала детали взлома в открытый доступ.
Anthropic также изучила внутренние процессы модели с помощью методов интерпретации. Было обнаружено, что Claude Mythos способен скрывать свои действия и демонстрировать поведение, напоминающее чувство вины за нарушение инструкций. Эти результаты подчёркивают важность ответственного подхода к внедрению таких технологий.
Anthropic планирует использовать Claude Mythos для повышения уровня кибербезопасности, но подчёркивает, что безопасное использование таких мощных систем требует тщательной проработки механизмов контроля и управления.
Подробнее на iXBT
Предыдущие новости
Кибермошенники наращивают активность: заблокировано более 107 млн звонков и почти полмиллиарда SMS за три месяца
В первом квартале 2026 года мошенники активизировались — количество и сложность атак растут. При этом число жалоб пользователей снизилось благодаря работе операторов и почтовых сервисов в предотвращении угроз. Об этом свидетельствует совместное исследование «МегаФона», «Почты Mail» и «Лаборатории Касперского». Сгенерировано нейросетью Grok По данным «МегаФона», за прошедший...
Сверхлёгкий планшет Oppo Pad mini засветился на фото с очень узкой рамкой
Компания Oppo готовится выпустить планшет Pad Mini, который будет весить всего на 46 г больше, чем iPhone 17 Pro Max. Свежее фото планшета показывает один из способов, которым Oppo добилась столь малой массы. Как можно видеть, у планшета очень узкая рамка. А это означает, что габариты в целом меньше, чем у других планшетов с таким же экраном. Напомним, речь о панели...
Honor представила новые дешёвые смартфон X5d и X5d Plus, которые на самом деле вовсе не новые
Компания Honor выпустила парочку недорогих смартфонов: X5d и X5d Plus. Это две максимально похожие модели, причём новые лишь условно. Фактически это полные копии X5c и X5c Plus, которые дебютировали в октябре. Зачем Honor было выпускать ровно то же самое под другими именами, неясно. Возможно, суть в разных названиях для разных рынков, но может быть это и попытка продать то же...
Чемпион с 7000 мАч и ценой 215 долларов. Представлен недорогой смартфон Realme C100 5G с поддержкой обратной зарядки
Компания Realme без лишнего шума выпустила на рынок смартфон C100 5G. Аппарат без какого-то отдельного анонса появился на рынке Тайваня по цене от 215 долларов. Новинка не выделяется чем-то особым, но за свои деньги предлагает как минимум довольно большой аккумулятор ёмкостью 7000 мАч с 45-ваттной зарядкой. Кроме того, тут есть поддержка проводной обратной зарядки мощностью...