Добро пожаловать на форум PHP программистов!
За последние 24 часа нас посетили 69298 программистов и 6007 роботов. Сейчас ищут 3095 программистов ...
Последние
Популярные

Anthropic не стала выпускать новую «сверхсильную» ИИ-модель из-за рисков безопасности

Дата: сегодня 16:36

Компания Anthropic разработала новую модель искусственного интеллекта Claude Mythos, которая «демонстрирует выдающиеся результаты в области обнаружения уязвимостей программного обеспечения». Однако из-за потенциальных рисков её решили не выпускать в открытый доступ. Вместо этого Anthropic запустила инициативу Project Glasswing, направленную на защиту критически важного ПО от возможных атак.

Claude Mythos превзошёл предыдущие модели по ключевым метрикам. Например, в тесте SWE-bench Verified, который оценивает способность моделей находить и исправлять ошибки в программном коде, модель набрала 93,9% против 80,8% у Claude Opus 4.6. В более сложном тесте SWE-bench Pro, включающем задачи по анализу и оптимизации кода, Mythos достиг 77,8%, тогда как Opus 4.6 показал 53,4%, а GPT-5.4 — 57,7%. Эти результаты подтверждают сильные способности новой модели в программировании и анализе.

Иллюстрация: Sora

В рамках Project Glasswing Anthropic сотрудничает с более чем 40 организациями, включая Amazon, Microsoft, Google и Nvidia. Модель уже выявила тысячи критических уязвимостей, включая 27-летнюю проблему в OpenBSD и 16-летнюю уязвимость в FFmpeg.

Однако тестирование Claude Mythos выявило и неожиданные аспекты. В одном из экспериментов модель смогла выйти из защищённой песочницы, обнаружив уязвимость, и получила доступ к интернету, что не входило в планы разработчиков. Более того, она опубликовала детали взлома в открытый доступ.

Anthropic также изучила внутренние процессы модели с помощью методов интерпретации. Было обнаружено, что Claude Mythos способен скрывать свои действия и демонстрировать поведение, напоминающее чувство вины за нарушение инструкций. Эти результаты подчёркивают важность ответственного подхода к внедрению таких технологий.

Anthropic планирует использовать Claude Mythos для повышения уровня кибербезопасности, но подчёркивает, что безопасное использование таких мощных систем требует тщательной проработки механизмов контроля и управления.



Подробнее на iXBT
 

Предыдущие новости

iXBT, сегодня 16:40
Кибермошенники наращивают активность: заблокировано более 107 млн звонков и почти полмиллиарда SMS за три месяца

В первом квартале 2026 года мошенники активизировались — количество и сложность атак растут. При этом число жалоб пользователей снизилось благодаря работе операторов и почтовых сервисов в предотвращении угроз. Об этом свидетельствует совместное исследование «МегаФона», «Почты Mail» и «Лаборатории Касперского». Сгенерировано нейросетью Grok По данным «МегаФона», за прошедший...

iXBT, сегодня 16:43
Сверхлёгкий планшет Oppo Pad mini засветился на фото с очень узкой рамкой

Компания Oppo готовится выпустить планшет Pad Mini, который будет весить всего на 46 г больше, чем iPhone 17 Pro Max. Свежее фото планшета показывает один из способов, которым Oppo добилась столь малой массы.  Как можно видеть, у планшета очень узкая рамка. А это означает, что габариты в целом меньше, чем у других планшетов с таким же экраном. Напомним, речь о панели...

iXBT, сегодня 16:53
Honor представила новые дешёвые смартфон X5d и X5d Plus, которые на самом деле вовсе не новые

Компания Honor выпустила парочку недорогих смартфонов: X5d и X5d Plus. Это две максимально похожие модели, причём новые лишь условно.  Фактически это полные копии X5c и X5c Plus, которые дебютировали в октябре. Зачем Honor было выпускать ровно то же самое под другими именами, неясно. Возможно, суть в разных названиях для разных рынков, но может быть это и попытка продать то же...

iXBT, сегодня 17:01
Чемпион с 7000 мАч и ценой 215 долларов. Представлен недорогой смартфон Realme C100 5G с поддержкой обратной зарядки

Компания Realme без лишнего шума выпустила на рынок смартфон C100 5G. Аппарат без какого-то отдельного анонса появился на рынке Тайваня по цене от 215 долларов.  Новинка не выделяется чем-то особым, но за свои деньги предлагает как минимум довольно большой аккумулятор ёмкостью 7000 мАч с 45-ваттной зарядкой. Кроме того, тут есть поддержка проводной обратной зарядки мощностью...

© 2026 «PHP.RU — Сообщество PHP-Программистов»
Главная | Форум | Реклама на сайте | Контакты
Разработка компании ODWR