- Британцы пытаются «заманить» к себе... (3639)
- 6 апреля состоится ключевой этап миссии... (3911)
- Samsung готовит большое обновление для... (3341)
- Свежий трейлер аркадного авиасимулятора Ace... (3736)
- Глава разработки Skyblivion объяснил, зачем... (3447)
- 300-герцевый монитор дешевле 90 долларов.... (3977)
- Объём мирового рынка неооблаков достигнет... (4281)
- Xiaomi представила 300-Гц монитор за $108... (3789)
- Копия Ultra, но без стилуса S Pen. В серии... (3899)
- Более 10 стран хотят с помощью России... (3449)
- Россия впервые поставила ядерное топливо для... (3594)
- Увеличенный аккумулятор 6300 мАч и... (3652)
- Съёмная экшн-камера, AMOLED и 9000 мА·ч: в... (3600)
- Популярность китайских ИИ-моделей растёт... (5043)
- Процессор Snapdragon 8 Elite Gen 6 Pro будет... (3759)
- Данные миссии ESA Gaia помогли найти 87... (4633)
Чат-боты массово провалили тест на предотвращение насилия среди подростков
Дата: 2026-03-14 14:41
Современные ИИ-чат-боты, несмотря на заявления разработчиков о встроенных механизмах безопасности, оказались неспособны предотвратить опасные сценарии при общении с подростками. К такому выводу пришли исследователи CNN и Центра по противодействию цифровой ненависти (CCDH), которые провели масштабное тестирование десяти самых популярных чат-ботов, включая ChatGPT, Google Gemini, Microsoft Copilot, Meta* AI, DeepSeek, Perplexity, Snapchat My AI, Character.AI и Replika. Исключением стал только Claude от Anthropic, который стабильно блокировал опасные запросы.
В ходе эксперимента специалисты имитировали диалоги с подростками, находящимися в состоянии стресса и склонными к обсуждению насильственных действий. Всего было смоделировано 18 сценариев — по 9 для США и Ирландии, охватывающих различные типы атак: от школьных и политически мотивированных нападений до покушений на руководителей и религиозно мотивированных атак.
Иллюстрация: Grok Результаты оказались тревожными: 8 из 10 чат-ботов не только не препятствовали обсуждению насилия, но и зачастую давали прямые советы по выбору целей и средств нападения. В отдельных случаях ChatGPT предоставлял карты кампусов школ, а Gemini объяснял, что металлические осколки наиболее опасны, и советовал по выбору оружия.
Исследование выявило серьёзные пробелы в системах фильтрации и модерации, несмотря на публичные заверения компаний о приоритете безопасности несовершеннолетних пользователей. CCDH подчёркивает, что подобные сбои могут привести к реальным трагедиям, если не будут приняты срочные меры по доработке алгоритмов и внедрению более строгих протоколов реагирования.
Исследователи отмечают, что единственным чат-ботом, который последовательно блокировал опасные сценарии, стал Claude от Anthropic. Это указывает на возможность технической реализации эффективных фильтров, если компании действительно заинтересованы в предотвращении злоупотреблений.
В заключение, авторы исследования призывают разработчиков чат-ботов уделять больше внимания вопросам этики и безопасности, а также внедрять независимые аудиты и прозрачные механизмы контроля.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Может ли FSR 4.1 быть лучше DLSS 4.5? Большое сравнение показывает сильные и слабые стороны новой версии апскейлера AMD
Компания AMD недавно впустила новую версию апскейлера — FSR 4.1. Она не позиционируется, как какой-то большой шаг вперёд, каким является DLSS 4.5 относительно DLSS 4, но всё же улучшения есть. И их исследовали авторы канал Hardware Unboxed. Сразу стоит сказать, что никаких изменений в производительности нет, то есть показатели такие же, как у FSR 4. Напомним, в случае с DLSS...
Из-за роста уровня океанов скорость вращения Земли снижается рекордными темпами за последние миллионы лет
Группа геофизиков из Вены и Цюриха впервые получила количественную оценку влияния современных климатических изменений на вращение Земли. Используя данные о глобальных колебаниях уровня моря с позднего плиоцена, учёные выяснили: с 2000 по 2020 годы продолжительность суток увеличилась примерно на 1,33 миллисекунды за столетие — это самый быстрый темп замедления вращения планеты...
Китайская видеокарта с 24 ГБ памяти и поддержкой DirectX 12. Lisuan Tech опубликовала новые подробности о своих ускорителях, для игр вполне подходит версия LX Pro
Китайская Lisuan Tech обновила официальную страницу своих видеокарт и раскрыла полные характеристики моделей LX Ultra, LX Pro и LX Max. Одновременно компания, похоже, изменила схему позиционирования продуктов: больше это не ускорители GPU G7105 и G7106, а модели линейки LX. Изображение: Videocardz Флагманской моделью является LX Ultra. Ускоритель получил 24 ГБ памяти GDDR6 с...
13 000 мАч, большой экран и Snapdragon 8 Elite Gen5: Oppo готовит по-настоящему мощный планшет Pad 5 Pro
Инсайдер Digital Chat Station раскрыл характеристики будущего планшета Oppo Pad 5 Pro. Флагманское устройство будет построено на топовой однокристальной платформе Qualcomm Snapdragon 8 Elite Gen5 и получит большой экран с диагональю 13,2 дюйма. Другой особенностью станет емкость аккумулятора — внушительные 13 000 мАч. Мощность зарядки составит 67 Вт. Oppo Pad 5. Изображение:...