- Mozilla анонсировала Thunderbolt — открытая... (152)
- Смартфоны Google Pixel 11 могут получить... (170)
- OpenAI представила ИИ-модель GPT-Rosalind... (333)
- Google и Gucci выпустят дизайнерские умные... (398)
- Взрывной олдскульный боевик Huntdown:... (152)
- Конференция OS DAY 2026 «Встроенные... (391)
- «Захотелось теперь отцом стать»:... (467)
- Warhammer 40,000: Space Marine 2 превзошла... (432)
- МТС Exolve: как ставка на self-service за... (390)
- Xiaomi представила телевизоры Redmi TV A Pro... (620)
- Российскую криптобиржу Grinex взломали и... (688)
- Лояльность к iPhone превысила 96 % —... (611)
- Ветеран Apple, который выводил на рынок... (567)
- Смартфон Huawei Mate 80 Pro с продвинутыми... (765)
- Надёжный инсайдер подтвердил дату выхода... (803)
- Одноплатный компьютер Orange Pi Zero 3W... (517)
Чат-боты массово провалили тест на предотвращение насилия среди подростков
Дата: 2026-03-14 14:41
Современные ИИ-чат-боты, несмотря на заявления разработчиков о встроенных механизмах безопасности, оказались неспособны предотвратить опасные сценарии при общении с подростками. К такому выводу пришли исследователи CNN и Центра по противодействию цифровой ненависти (CCDH), которые провели масштабное тестирование десяти самых популярных чат-ботов, включая ChatGPT, Google Gemini, Microsoft Copilot, Meta* AI, DeepSeek, Perplexity, Snapchat My AI, Character.AI и Replika. Исключением стал только Claude от Anthropic, который стабильно блокировал опасные запросы.
В ходе эксперимента специалисты имитировали диалоги с подростками, находящимися в состоянии стресса и склонными к обсуждению насильственных действий. Всего было смоделировано 18 сценариев — по 9 для США и Ирландии, охватывающих различные типы атак: от школьных и политически мотивированных нападений до покушений на руководителей и религиозно мотивированных атак.
Иллюстрация: Grok Результаты оказались тревожными: 8 из 10 чат-ботов не только не препятствовали обсуждению насилия, но и зачастую давали прямые советы по выбору целей и средств нападения. В отдельных случаях ChatGPT предоставлял карты кампусов школ, а Gemini объяснял, что металлические осколки наиболее опасны, и советовал по выбору оружия.
Исследование выявило серьёзные пробелы в системах фильтрации и модерации, несмотря на публичные заверения компаний о приоритете безопасности несовершеннолетних пользователей. CCDH подчёркивает, что подобные сбои могут привести к реальным трагедиям, если не будут приняты срочные меры по доработке алгоритмов и внедрению более строгих протоколов реагирования.
Исследователи отмечают, что единственным чат-ботом, который последовательно блокировал опасные сценарии, стал Claude от Anthropic. Это указывает на возможность технической реализации эффективных фильтров, если компании действительно заинтересованы в предотвращении злоупотреблений.
В заключение, авторы исследования призывают разработчиков чат-ботов уделять больше внимания вопросам этики и безопасности, а также внедрять независимые аудиты и прозрачные механизмы контроля.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Может ли FSR 4.1 быть лучше DLSS 4.5? Большое сравнение показывает сильные и слабые стороны новой версии апскейлера AMD
Компания AMD недавно впустила новую версию апскейлера — FSR 4.1. Она не позиционируется, как какой-то большой шаг вперёд, каким является DLSS 4.5 относительно DLSS 4, но всё же улучшения есть. И их исследовали авторы канал Hardware Unboxed. Сразу стоит сказать, что никаких изменений в производительности нет, то есть показатели такие же, как у FSR 4. Напомним, в случае с DLSS...
Из-за роста уровня океанов скорость вращения Земли снижается рекордными темпами за последние миллионы лет
Группа геофизиков из Вены и Цюриха впервые получила количественную оценку влияния современных климатических изменений на вращение Земли. Используя данные о глобальных колебаниях уровня моря с позднего плиоцена, учёные выяснили: с 2000 по 2020 годы продолжительность суток увеличилась примерно на 1,33 миллисекунды за столетие — это самый быстрый темп замедления вращения планеты...
Китайская видеокарта с 24 ГБ памяти и поддержкой DirectX 12. Lisuan Tech опубликовала новые подробности о своих ускорителях, для игр вполне подходит версия LX Pro
Китайская Lisuan Tech обновила официальную страницу своих видеокарт и раскрыла полные характеристики моделей LX Ultra, LX Pro и LX Max. Одновременно компания, похоже, изменила схему позиционирования продуктов: больше это не ускорители GPU G7105 и G7106, а модели линейки LX. Изображение: Videocardz Флагманской моделью является LX Ultra. Ускоритель получил 24 ГБ памяти GDDR6 с...
13 000 мАч, большой экран и Snapdragon 8 Elite Gen5: Oppo готовит по-настоящему мощный планшет Pad 5 Pro
Инсайдер Digital Chat Station раскрыл характеристики будущего планшета Oppo Pad 5 Pro. Флагманское устройство будет построено на топовой однокристальной платформе Qualcomm Snapdragon 8 Elite Gen5 и получит большой экран с диагональю 13,2 дюйма. Другой особенностью станет емкость аккумулятора — внушительные 13 000 мАч. Мощность зарядки составит 67 Вт. Oppo Pad 5. Изображение:...