- Максимально комфортный салон, звук мощностью... (4971)
- В Яндексе разработали ИИ-сервис для... (4960)
- Классические Resident Evil, Resident Evil 2,... (4449)
- Спутниковый интернет в российских самолетах... (5192)
- Alibaba представила закрытую ИИ-модель... (4898)
- «Турбо Облако» запустило импортонезависимую... (4428)
- Motorola Razr 70 выйдет во втором квартале... (4695)
- Операторы готовы к запуску 5G в России, но... (4169)
- Новейший 100-дюймовый 4К-телевизор Redmi —... (4796)
- В РФ хотят сократить количество провайдеров.... (4601)
- 7000 мАч, OLED-дисплей Honor Oasis 120 Гц,... (5093)
- Когда системная плата может быть... (4675)
- Кризис памяти добрался до разработчиков... (4771)
- Представлен новый Geely Atlas с запасом хода... (4921)
- Глава отдела Apple Fitness в июле выйдет на... (4891)
- Hina: натрий-ионные батареи сравняются по... (5244)
Чат-боты массово провалили тест на предотвращение насилия среди подростков
Дата: 2026-03-14 14:41
Современные ИИ-чат-боты, несмотря на заявления разработчиков о встроенных механизмах безопасности, оказались неспособны предотвратить опасные сценарии при общении с подростками. К такому выводу пришли исследователи CNN и Центра по противодействию цифровой ненависти (CCDH), которые провели масштабное тестирование десяти самых популярных чат-ботов, включая ChatGPT, Google Gemini, Microsoft Copilot, Meta* AI, DeepSeek, Perplexity, Snapchat My AI, Character.AI и Replika. Исключением стал только Claude от Anthropic, который стабильно блокировал опасные запросы.
В ходе эксперимента специалисты имитировали диалоги с подростками, находящимися в состоянии стресса и склонными к обсуждению насильственных действий. Всего было смоделировано 18 сценариев — по 9 для США и Ирландии, охватывающих различные типы атак: от школьных и политически мотивированных нападений до покушений на руководителей и религиозно мотивированных атак.
Иллюстрация: Grok Результаты оказались тревожными: 8 из 10 чат-ботов не только не препятствовали обсуждению насилия, но и зачастую давали прямые советы по выбору целей и средств нападения. В отдельных случаях ChatGPT предоставлял карты кампусов школ, а Gemini объяснял, что металлические осколки наиболее опасны, и советовал по выбору оружия.
Исследование выявило серьёзные пробелы в системах фильтрации и модерации, несмотря на публичные заверения компаний о приоритете безопасности несовершеннолетних пользователей. CCDH подчёркивает, что подобные сбои могут привести к реальным трагедиям, если не будут приняты срочные меры по доработке алгоритмов и внедрению более строгих протоколов реагирования.
Исследователи отмечают, что единственным чат-ботом, который последовательно блокировал опасные сценарии, стал Claude от Anthropic. Это указывает на возможность технической реализации эффективных фильтров, если компании действительно заинтересованы в предотвращении злоупотреблений.
В заключение, авторы исследования призывают разработчиков чат-ботов уделять больше внимания вопросам этики и безопасности, а также внедрять независимые аудиты и прозрачные механизмы контроля.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Может ли FSR 4.1 быть лучше DLSS 4.5? Большое сравнение показывает сильные и слабые стороны новой версии апскейлера AMD
Компания AMD недавно впустила новую версию апскейлера — FSR 4.1. Она не позиционируется, как какой-то большой шаг вперёд, каким является DLSS 4.5 относительно DLSS 4, но всё же улучшения есть. И их исследовали авторы канал Hardware Unboxed. Сразу стоит сказать, что никаких изменений в производительности нет, то есть показатели такие же, как у FSR 4. Напомним, в случае с DLSS...
Из-за роста уровня океанов скорость вращения Земли снижается рекордными темпами за последние миллионы лет
Группа геофизиков из Вены и Цюриха впервые получила количественную оценку влияния современных климатических изменений на вращение Земли. Используя данные о глобальных колебаниях уровня моря с позднего плиоцена, учёные выяснили: с 2000 по 2020 годы продолжительность суток увеличилась примерно на 1,33 миллисекунды за столетие — это самый быстрый темп замедления вращения планеты...
Китайская видеокарта с 24 ГБ памяти и поддержкой DirectX 12. Lisuan Tech опубликовала новые подробности о своих ускорителях, для игр вполне подходит версия LX Pro
Китайская Lisuan Tech обновила официальную страницу своих видеокарт и раскрыла полные характеристики моделей LX Ultra, LX Pro и LX Max. Одновременно компания, похоже, изменила схему позиционирования продуктов: больше это не ускорители GPU G7105 и G7106, а модели линейки LX. Изображение: Videocardz Флагманской моделью является LX Ultra. Ускоритель получил 24 ГБ памяти GDDR6 с...
13 000 мАч, большой экран и Snapdragon 8 Elite Gen5: Oppo готовит по-настоящему мощный планшет Pad 5 Pro
Инсайдер Digital Chat Station раскрыл характеристики будущего планшета Oppo Pad 5 Pro. Флагманское устройство будет построено на топовой однокристальной платформе Qualcomm Snapdragon 8 Elite Gen5 и получит большой экран с диагональю 13,2 дюйма. Другой особенностью станет емкость аккумулятора — внушительные 13 000 мАч. Мощность зарядки составит 67 Вт. Oppo Pad 5. Изображение:...