- Белорусские кроссоверы захватывают... (1)
- В Apple готовятся к волне увольнений... (0)
- Последнее обновление Windows 11 24H2 ломает... (0)
- Путин подарил американцу мотоцикл «Урал» за... (71)
- BYD построила «Автомобильный Диснейленд» —... (72)
- Китайский автогигант Sinotruk строит завод в... (73)
- Учёный из Национальной лаборатории... (83)
- Олдскульный хоррор Caput Mortum покажет,... (66)
- «Китайцы показывают, как надо делать игры»:... (69)
- Китайцы доработают свой кроссовер специально... (68)
- Учёные раскрыли когнитивное искажение,... (68)
- Очень тонкий смартфон c «батареей... (73)
- Американская фабрика TSMC начала приносить... (64)
- Американская фабрика TSMC начало приносить... (78)
- Число солнечных пятен резко снизилось:... (65)
- ИИ научился говорить «стоп»: Anthropic... (80)
ИИ научился говорить «стоп»: Anthropic научила чат-бота пресекать опасные диалоги для предотвращения преступлений и защиты детей
Дата: сегодня 12:24
Компания Anthropic сообщила о внедрении новой функции в своих языковых моделях Claude Opus 4 и 4.1, призванной пресекать «некорректные» беседы. Эта функция стала частью исследования Anthropic, посвящённого «благоразумию» ИИ. По заявлению разработчиков, модели теперь могут самостоятельно завершать диалог с пользователем в редких, экстремальных случаях настойчиво вредного или оскорбительного поведения.
Речь идёт о ситуациях, когда пользователь запрашивает контент сексуального характера с участием несовершеннолетних, пытается получить информацию, которая может быть использована для организации крупномасштабного насилия или террористических актов. Прерывание диалога – это крайняя мера, применяемая только после многократных попыток перенаправить диалог в конструктивное русло. Anthropic подчёркивает, что большинство пользователей не столкнутся с этим ограничением, даже при обсуждении спорных тем.

Если разговор прерывается моделью, то пользователь теряет возможность отправлять новые сообщения в этом конкретном чате, однако может начать новый диалог. При этом завершение одного диалога никак не влияет на другие, а пользователи могут вернуться к прерванному чату и отредактировать предыдущие сообщения, попытавшись изменить направление беседы.
Хотя антропоморфизация ИИ-моделей остаётся предметом дискуссий, компания считает, что возможность прерывать потенциально травмирующие взаимодействия — это недорогой способ управления рисками. Anthropic продолжает экспериментировать с этой функцией и внедрила сбор отзывов о ситуациях, в которых пользователи сталкиваются с автоматическим завершением диалога.
Подробнее на iXBT
Предыдущие новости
Intel скатилась на пятое место среди крупнейших поставщиком чипов в мире — лидирует Nvidia с в 3,5 раза большей выручкой
По данным WSTS, глобальная выручка производителей полупроводников во втором квартале выросла на 19,6 % до $180 млрд. Рынок сохраняет потенциал дальнейшего роста, но не все его участники чувствуют себя хорошо. Например, Intel хоть и не скатилась до снижения выручки, сейчас занимает пятое место среди 20 крупнейших поставщиков чипов, хотя многие годы оставалась лидером рынка....
Foxconn займётся выпуском ИИ-серверов для SoftBank на месте бывшего «проклятого автозавода»
Бывшее автосборочное предприятие General Motors в Огайо не приносило удачи своим последующим владельцам, тайваньская Foxconn не стала исключением, а потому решила перепрофилировать его под выпуск серверных систем для ИИ, одновременно продав площадку новому собственнику. Как стало известно недавно, им станет японская SoftBank, по заказам которой Foxconn продолжит свою...
Смартфон realme 15 Pro с Snapdragon 7 Gen 4 и батареей на 7000 мА·ч поступил в глобальную продажу
Компания realme объявила о старте глобальных продаже смартфона realme 15 Pro, представленного в конце прошлого месяца. Новый realme 15 Pro является преемником прошлогоднего realme 14 Pro+, и отличается производительным процессором, ярким дисплеем и ёмкой батареей, а также продвинутой системой камер с поддержкой ИИ и высокой защищённостью от влаги и пыли. Realme 15 Pro...
7000 мАч, 90 Вт, невероятная прочность и улучшенная камера. Опубликованы первые официальные изображения Redmi Note 15 Pro+, смартфон представят 21 августа
Redmi сегодня объявила дату премьеры смартфона Redmi Note 15 Pro+: новинку представят уже через три дня — 21 августа. Вероятно, вместе с Pro+ версией будут представлены и другие модели линейки — Redmi Note 15 Pro и Note 15. Фото: Redmi Сегодня же Redmi опубликовала официальные изображения смартфона в разных цветах и поделилась новыми подробностями. В компании считают, что...