Добро пожаловать на форум PHP программистов!
За последние 24 часа нас посетили 17307 программистов и 1911 роботов. Сейчас ищет 981 программист ...
Последние
Популярные

OpenAI готова скорректировать правила безопасности ради конкуренции? Обновлённая система готовности допускает корректировку, если конкуренты пойдут на риск

Дата: 2025-04-18 10:10

OpenAI обновила свою «Систему готовности» — внутренний механизм, используемый для оценки безопасности разрабатываемых ИИ-моделей и определения необходимых мер предосторожности на этапах создания и развёртывания. В обновлённой версии компания заявила о возможности «корректировки» собственных требований к безопасности в том случае, если конкурирующая лаборатория выпустит на рынок «высокорискованную» систему без аналогичных защитных мер.

Прежде OpenAI уже подвергалась критике за возможное снижение стандартов безопасности ради ускорения релизов и за задержки с публикацией отчётов о тестировании безопасности. Примечательно, что на прошлой неделе 12 бывших сотрудников OpenAI подали документ в рамках судебного процесса Илона Маска против компании, утверждая, что запланированная корпоративная реструктуризация может стимулировать компанию к ещё большей экономии на мерах безопасности.

Источник: Dustin Chambers / Bloomberg

В преддверии возможной критики, OpenAI утверждает, что не станет легкомысленно относиться к подобным корректировкам политики и постарается сохранить защитные меры на «более высоком уровне». «Если другой передовой разработчик ИИ выпустит высокорискованную систему без сопоставимых мер защиты, то мы можем скорректировать наши требования», — говорится в сообщении OpenAI в блоге. «Однако, прежде чем пойти на такой шаг, мы тщательно убедимся, что ландшафт рисков действительно изменился, публично признаем, что вносим корректировку, оценим, что эта корректировка не приведёт к существенному увеличению общего риска серьёзного вреда, и при этом сохраним защитные меры на более высоком уровне».

Компания заявляет, что, не отказываясь полностью от тестирования под руководством человека, она создала «растущий набор автоматизированных оценок», которые, предположительно, способны «успевать за более быстрым темпом релизов». При этом, по некоторым данным, ситуация выглядит несколько иначе. Так, Financial Times сообщает, что на проверку безопасности готовящейся к выпуску крупной модели OpenAI выделила тестировщикам менее недели — крайне сжатый срок по сравнению с предыдущими релизами. Источники издания также утверждают, что многие тесты безопасности OpenAI теперь проводятся на более ранних версиях моделей, а не на тех версиях, которые выпускаются для широкой публики. В своих заявлениях OpenAI опровергает утверждения о том, что идёт на компромисс с безопасностью.

Среди прочих изменений в «Системе готовности» OpenAI, которые остались за кадром публичного обсуждения, примечателен отказ от обязательного тестирования безопасности моделей, подвергшихся тонкой настройке, что было отмечено в публикации Стивена Адлера в социальной сети X (ранее Twitter). Другие изменения в системе касаются категоризации моделей по уровню риска, включая модели, способные скрывать свои возможности, обходить защитные меры, препятствовать своему отключению и даже самовоспроизводиться. OpenAI заявляет, что теперь будет фокусироваться на том, достигают ли модели одного из двух пороговых значений: «высокой» или «критической» способности.

Согласно определению OpenAI, «высокая» способность — это способность модели «усиливать существующие пути нанесения серьёзного вреда». «Критическая» способность относится к моделям, которые «открывают беспрецедентные новые пути нанесения серьёзного вреда». «Системы, которые достигают высокой способности, должны иметь защитные меры, которые в достаточной степени минимизируют связанный с этим риск серьёзного вреда до их развертывания», — пишет OpenAI в блоге. Обновления «Системы готовности» стали первыми с 2023 года.



Подробнее на iXBT
 

Предыдущие новости

iXBT, 2025-04-18 10:12
NASA завершает сборку ракеты Space Launch System для миссии Artemis 2, готовя четырех астронавтов к историческому облёту Луны в 2026 году

NASA завершает сборку ракеты Space Launch System (SLS) для миссии Artemis 2 — первого пилотируемого полета программы Artemis, намеченного на весну 2026 года. Работы проходят в Центре космических полетов имени Кеннеди во Флориде. Фото: NASA На прошлой неделе, 12 апреля, инженеры установили конический адаптер, связывающий основной блок ракеты с верхней ступенью. 15 апреля в...

iXBT, 2025-04-18 10:25
Замена Hyundai Santa Fe и Kia Sorento: новейший «Москвич 8» уже колесит по Москве

«Москвич 8» заметили на улицах Москвы, о чем пишет «Автопоток». Машина получила обкаточный госномер, который закреплён за самим заводом. Фото «Автопоток» Ранее сообщалось, что несколько экземпляров этой модели уже зарегистрированы в ГИБДД. «Москвич 8» предложит просторный салон с тремя рядами сидений. Габаритные размеры модели составляют 4825 х 1870 х 1758 мм, колесная база...

3Dnews.ru, 2025-04-18 10:05
Повышение цен сработало: квартальная выручка Netflix подскочила до $10,5 млрд

Компания Netflix объявила финансовые результаты по итогам первого квартала. За несколько месяцев с момента повышения цен объём полученной Netflix выручки вырос до $10,5 млрд, что на 13 % больше аналогичного показателя за первый квартал прошлого года. Чистая прибыль увеличилась до $2,9 млрд, и компания заявляет, что ожидает дальнейшего роста в ближайшие месяцы, когда эффект...

3Dnews.ru, 2025-04-18 10:06
WhatsApp перенял ещё одну «фишку» Telegram — пользовательские наборы стикеров

На этой неделе началось распространение крупного обновления для мессенджера WhatsApp, которое добавляет новый способ создания и управления наборами стикеров без необходимости покидать приложение. Такой подход упрощает процесс взаимодействия с сервисом для пользователей, которые создают собственные наборы стикеров. Источник изображения: Grant Davies /...

© 2025 «PHP.RU — Сообщество PHP-Программистов»
Главная | Форум | Реклама на сайте | Контакты VIP Сувениры
Разработка компании ODware