- CleanSpark по решению суда закрыла... (35)
- Cloud.ru создал неооблако для работы с... (46)
- Уже в этом году OpenAI рассчитывает выручить... (175)
- В России стартовали продажи белорусского... (354)
- SpaceX с учётом xAI завершила прошлый год с... (209)
- OpenAI и Anthropic бросились мериться... (359)
- Microsoft объяснила блокировку WireGuard и... (363)
- Хакеры похитили и слили в сеть секретные... (255)
- Приложение M**a AI взлетело на 5 место в App... (271)
- Google Chrome получил защиту от кражи сессий... (282)
- YouTube опроверг наличие 90-секундной... (431)
- Anthropic тоже задумалась о разработке... (378)
- Новая статья: Аналоговый ИИ: теперь и на... (262)
- Razer выпустила геймерские TWS-наушники... (440)
- Asus представила ROG Equalizer — кабель... (437)
- В Steam вышла «печатная» королевская битва... (374)
Anthropic не стала выпускать новую «сверхсильную» ИИ-модель из-за рисков безопасности
Дата: 2026-04-08 16:36
Компания Anthropic разработала новую модель искусственного интеллекта Claude Mythos, которая «демонстрирует выдающиеся результаты в области обнаружения уязвимостей программного обеспечения». Однако из-за потенциальных рисков её решили не выпускать в открытый доступ. Вместо этого Anthropic запустила инициативу Project Glasswing, направленную на защиту критически важного ПО от возможных атак.
Claude Mythos превзошёл предыдущие модели по ключевым метрикам. Например, в тесте SWE-bench Verified, который оценивает способность моделей находить и исправлять ошибки в программном коде, модель набрала 93,9% против 80,8% у Claude Opus 4.6. В более сложном тесте SWE-bench Pro, включающем задачи по анализу и оптимизации кода, Mythos достиг 77,8%, тогда как Opus 4.6 показал 53,4%, а GPT-5.4 — 57,7%. Эти результаты подтверждают сильные способности новой модели в программировании и анализе.
Иллюстрация: Sora В рамках Project Glasswing Anthropic сотрудничает с более чем 40 организациями, включая Amazon, Microsoft, Google и Nvidia. Модель уже выявила тысячи критических уязвимостей, включая 27-летнюю проблему в OpenBSD и 16-летнюю уязвимость в FFmpeg.
Однако тестирование Claude Mythos выявило и неожиданные аспекты. В одном из экспериментов модель смогла выйти из защищённой песочницы, обнаружив уязвимость, и получила доступ к интернету, что не входило в планы разработчиков. Более того, она опубликовала детали взлома в открытый доступ.
Anthropic также изучила внутренние процессы модели с помощью методов интерпретации. Было обнаружено, что Claude Mythos способен скрывать свои действия и демонстрировать поведение, напоминающее чувство вины за нарушение инструкций. Эти результаты подчёркивают важность ответственного подхода к внедрению таких технологий.
Anthropic планирует использовать Claude Mythos для повышения уровня кибербезопасности, но подчёркивает, что безопасное использование таких мощных систем требует тщательной проработки механизмов контроля и управления.
Подробнее на iXBT
Предыдущие новости
Кибермошенники наращивают активность: заблокировано более 107 млн звонков и почти полмиллиарда SMS за три месяца
В первом квартале 2026 года мошенники активизировались — количество и сложность атак растут. При этом число жалоб пользователей снизилось благодаря работе операторов и почтовых сервисов в предотвращении угроз. Об этом свидетельствует совместное исследование «МегаФона», «Почты Mail» и «Лаборатории Касперского». Сгенерировано нейросетью Grok По данным «МегаФона», за прошедший...
Сверхлёгкий планшет Oppo Pad mini засветился на фото с очень узкой рамкой
Компания Oppo готовится выпустить планшет Pad Mini, который будет весить всего на 46 г больше, чем iPhone 17 Pro Max. Свежее фото планшета показывает один из способов, которым Oppo добилась столь малой массы. Как можно видеть, у планшета очень узкая рамка. А это означает, что габариты в целом меньше, чем у других планшетов с таким же экраном. Напомним, речь о панели...
Honor представила новые дешёвые смартфон X5d и X5d Plus, которые на самом деле вовсе не новые
Компания Honor выпустила парочку недорогих смартфонов: X5d и X5d Plus. Это две максимально похожие модели, причём новые лишь условно. Фактически это полные копии X5c и X5c Plus, которые дебютировали в октябре. Зачем Honor было выпускать ровно то же самое под другими именами, неясно. Возможно, суть в разных названиях для разных рынков, но может быть это и попытка продать то же...
Чемпион с 7000 мАч и ценой 215 долларов. Представлен недорогой смартфон Realme C100 5G с поддержкой обратной зарядки
Компания Realme без лишнего шума выпустила на рынок смартфон C100 5G. Аппарат без какого-то отдельного анонса появился на рынке Тайваня по цене от 215 долларов. Новинка не выделяется чем-то особым, но за свои деньги предлагает как минимум довольно большой аккумулятор ёмкостью 7000 мАч с 45-ваттной зарядкой. Кроме того, тут есть поддержка проводной обратной зарядки мощностью...