- Улучшение посадки семян, эксклюзивные... (2678)
- Новая статья: Обзор робота-уборщика Roborock... (2700)
- Экспансия ИИ-агентов разгонит рынок памяти... (3015)
- Группа инвесторов влезла в долги на $36... (2605)
- ReactOS, воссоздающая Windows NT, получила... (3506)
- Reactors, воссоздающая Windows NT, получила... (3135)
- Nikon намерена нарастить продажи... (2494)
- «Яндекс Карты» научились предлагать разные... (6053)
- «Если бы у Zelda, Castlevania и Dark Souls... (2865)
- CD Projekt объяснила, почему не стоит ждать... (3096)
- Anthropic подтвердила, что откроет... (2812)
- Инвестиция в светлое будущее: Nvidia... (4433)
- Люди теряют интернет: всемирную паутину всё... (2275)
- Curator нейтрализовал несколько атак на... (2612)
- 5G заработает в крупных городах России уже... (2615)
- Руководство Amazon запретило сотрудникам... (2416)
Anthropic не стала выпускать новую «сверхсильную» ИИ-модель из-за рисков безопасности
Дата: 2026-04-08 16:36
Компания Anthropic разработала новую модель искусственного интеллекта Claude Mythos, которая «демонстрирует выдающиеся результаты в области обнаружения уязвимостей программного обеспечения». Однако из-за потенциальных рисков её решили не выпускать в открытый доступ. Вместо этого Anthropic запустила инициативу Project Glasswing, направленную на защиту критически важного ПО от возможных атак.
Claude Mythos превзошёл предыдущие модели по ключевым метрикам. Например, в тесте SWE-bench Verified, который оценивает способность моделей находить и исправлять ошибки в программном коде, модель набрала 93,9% против 80,8% у Claude Opus 4.6. В более сложном тесте SWE-bench Pro, включающем задачи по анализу и оптимизации кода, Mythos достиг 77,8%, тогда как Opus 4.6 показал 53,4%, а GPT-5.4 — 57,7%. Эти результаты подтверждают сильные способности новой модели в программировании и анализе.
Иллюстрация: Sora В рамках Project Glasswing Anthropic сотрудничает с более чем 40 организациями, включая Amazon, Microsoft, Google и Nvidia. Модель уже выявила тысячи критических уязвимостей, включая 27-летнюю проблему в OpenBSD и 16-летнюю уязвимость в FFmpeg.
Однако тестирование Claude Mythos выявило и неожиданные аспекты. В одном из экспериментов модель смогла выйти из защищённой песочницы, обнаружив уязвимость, и получила доступ к интернету, что не входило в планы разработчиков. Более того, она опубликовала детали взлома в открытый доступ.
Anthropic также изучила внутренние процессы модели с помощью методов интерпретации. Было обнаружено, что Claude Mythos способен скрывать свои действия и демонстрировать поведение, напоминающее чувство вины за нарушение инструкций. Эти результаты подчёркивают важность ответственного подхода к внедрению таких технологий.
Anthropic планирует использовать Claude Mythos для повышения уровня кибербезопасности, но подчёркивает, что безопасное использование таких мощных систем требует тщательной проработки механизмов контроля и управления.
Подробнее на iXBT
Предыдущие новости
Кибермошенники наращивают активность: заблокировано более 107 млн звонков и почти полмиллиарда SMS за три месяца
В первом квартале 2026 года мошенники активизировались — количество и сложность атак растут. При этом число жалоб пользователей снизилось благодаря работе операторов и почтовых сервисов в предотвращении угроз. Об этом свидетельствует совместное исследование «МегаФона», «Почты Mail» и «Лаборатории Касперского». Сгенерировано нейросетью Grok По данным «МегаФона», за прошедший...
Сверхлёгкий планшет Oppo Pad mini засветился на фото с очень узкой рамкой
Компания Oppo готовится выпустить планшет Pad Mini, который будет весить всего на 46 г больше, чем iPhone 17 Pro Max. Свежее фото планшета показывает один из способов, которым Oppo добилась столь малой массы. Как можно видеть, у планшета очень узкая рамка. А это означает, что габариты в целом меньше, чем у других планшетов с таким же экраном. Напомним, речь о панели...
Honor представила новые дешёвые смартфон X5d и X5d Plus, которые на самом деле вовсе не новые
Компания Honor выпустила парочку недорогих смартфонов: X5d и X5d Plus. Это две максимально похожие модели, причём новые лишь условно. Фактически это полные копии X5c и X5c Plus, которые дебютировали в октябре. Зачем Honor было выпускать ровно то же самое под другими именами, неясно. Возможно, суть в разных названиях для разных рынков, но может быть это и попытка продать то же...
Чемпион с 7000 мАч и ценой 215 долларов. Представлен недорогой смартфон Realme C100 5G с поддержкой обратной зарядки
Компания Realme без лишнего шума выпустила на рынок смартфон C100 5G. Аппарат без какого-то отдельного анонса появился на рынке Тайваня по цене от 215 долларов. Новинка не выделяется чем-то особым, но за свои деньги предлагает как минимум довольно большой аккумулятор ёмкостью 7000 мАч с 45-ваттной зарядкой. Кроме того, тут есть поддержка проводной обратной зарядки мощностью...