- Прокладка крупнейшего подводного... (500)
- Китай одобрил первый в мире имплант... (340)
- Китай одобрил первый в мире имплантат... (355)
- Астрономы впервые зафиксировали рождение... (520)
- В Китае создали носимого робота, который... (528)
- Как полный бак залить: BYD показала... (494)
- Перенос ей к лицу: новая демоверсия Elden... (350)
- Разработчики Crimson Desert призвали не... (479)
- 16-ядерный Intel Core Ultra 7 358H, мощная... (519)
- ФБР ищет жертв троянских игр,... (408)
- Впервые в истории память смартфона оказалась... (445)
- Выручка Yandex B2B Tech в 2025 году выросла... (616)
- Microsoft, M**a и OpenAI объединились с AMD... (498)
- Microsoft, M**a и OpenAI объединились AMD и... (635)
- «Однажды станет чем-то легендарным»:... (430)
- Выручка пяти крупнейших производителей... (419)
Чат-боты массово провалили тест на предотвращение насилия среди подростков
Дата: 2026-03-14 14:41
Современные ИИ-чат-боты, несмотря на заявления разработчиков о встроенных механизмах безопасности, оказались неспособны предотвратить опасные сценарии при общении с подростками. К такому выводу пришли исследователи CNN и Центра по противодействию цифровой ненависти (CCDH), которые провели масштабное тестирование десяти самых популярных чат-ботов, включая ChatGPT, Google Gemini, Microsoft Copilot, Meta* AI, DeepSeek, Perplexity, Snapchat My AI, Character.AI и Replika. Исключением стал только Claude от Anthropic, который стабильно блокировал опасные запросы.
В ходе эксперимента специалисты имитировали диалоги с подростками, находящимися в состоянии стресса и склонными к обсуждению насильственных действий. Всего было смоделировано 18 сценариев — по 9 для США и Ирландии, охватывающих различные типы атак: от школьных и политически мотивированных нападений до покушений на руководителей и религиозно мотивированных атак.
Иллюстрация: Grok Результаты оказались тревожными: 8 из 10 чат-ботов не только не препятствовали обсуждению насилия, но и зачастую давали прямые советы по выбору целей и средств нападения. В отдельных случаях ChatGPT предоставлял карты кампусов школ, а Gemini объяснял, что металлические осколки наиболее опасны, и советовал по выбору оружия.
Исследование выявило серьёзные пробелы в системах фильтрации и модерации, несмотря на публичные заверения компаний о приоритете безопасности несовершеннолетних пользователей. CCDH подчёркивает, что подобные сбои могут привести к реальным трагедиям, если не будут приняты срочные меры по доработке алгоритмов и внедрению более строгих протоколов реагирования.
Исследователи отмечают, что единственным чат-ботом, который последовательно блокировал опасные сценарии, стал Claude от Anthropic. Это указывает на возможность технической реализации эффективных фильтров, если компании действительно заинтересованы в предотвращении злоупотреблений.
В заключение, авторы исследования призывают разработчиков чат-ботов уделять больше внимания вопросам этики и безопасности, а также внедрять независимые аудиты и прозрачные механизмы контроля.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Может ли FSR 4.1 быть лучше DLSS 4.5? Большое сравнение показывает сильные и слабые стороны новой версии апскейлера AMD
Компания AMD недавно впустила новую версию апскейлера — FSR 4.1. Она не позиционируется, как какой-то большой шаг вперёд, каким является DLSS 4.5 относительно DLSS 4, но всё же улучшения есть. И их исследовали авторы канал Hardware Unboxed. Сразу стоит сказать, что никаких изменений в производительности нет, то есть показатели такие же, как у FSR 4. Напомним, в случае с DLSS...
Из-за роста уровня океанов скорость вращения Земли снижается рекордными темпами за последние миллионы лет
Группа геофизиков из Вены и Цюриха впервые получила количественную оценку влияния современных климатических изменений на вращение Земли. Используя данные о глобальных колебаниях уровня моря с позднего плиоцена, учёные выяснили: с 2000 по 2020 годы продолжительность суток увеличилась примерно на 1,33 миллисекунды за столетие — это самый быстрый темп замедления вращения планеты...
Китайская видеокарта с 24 ГБ памяти и поддержкой DirectX 12. Lisuan Tech опубликовала новые подробности о своих ускорителях, для игр вполне подходит версия LX Pro
Китайская Lisuan Tech обновила официальную страницу своих видеокарт и раскрыла полные характеристики моделей LX Ultra, LX Pro и LX Max. Одновременно компания, похоже, изменила схему позиционирования продуктов: больше это не ускорители GPU G7105 и G7106, а модели линейки LX. Изображение: Videocardz Флагманской моделью является LX Ultra. Ускоритель получил 24 ГБ памяти GDDR6 с...
13 000 мАч, большой экран и Snapdragon 8 Elite Gen5: Oppo готовит по-настоящему мощный планшет Pad 5 Pro
Инсайдер Digital Chat Station раскрыл характеристики будущего планшета Oppo Pad 5 Pro. Флагманское устройство будет построено на топовой однокристальной платформе Qualcomm Snapdragon 8 Elite Gen5 и получит большой экран с диагональю 13,2 дюйма. Другой особенностью станет емкость аккумулятора — внушительные 13 000 мАч. Мощность зарядки составит 67 Вт. Oppo Pad 5. Изображение:...