- Crimson Desert побила личный рекорд... (1700)
- BYD вышла на рынок гаджетов: представлен... (1723)
- Миллионы россиян остаются без спутникового... (1917)
- «Это буквально всё, что мне было нужно»:... (1809)
- Средство массового уничтожения Ryzen 7... (1808)
- Apple в этом году представит крупнейшее... (1916)
- Центры обработки данных решили размещать под... (1776)
- Дефицит 3-нм чипов продолжит обостряться —... (1718)
- Научные тесты подтверждают: разницы между... (1549)
- Минцифры хочет надавить на Apple, чтобы та... (1819)
- Telegram устроил масштабную зачистку: с... (1878)
- В «Билайне» запустили возврат денег за связь... (1803)
- Более 2000 экспонатов, и всё связано с... (1866)
- «МегаФон» запустил 5G — с компенсацией... (1950)
- «МегаФон» запустил 5G — с возможностью... (1824)
- 15-лет назад AMD выпустила двухчиповое... (1855)
Чат-боты массово провалили тест на предотвращение насилия среди подростков
Дата: 2026-03-14 14:41
Современные ИИ-чат-боты, несмотря на заявления разработчиков о встроенных механизмах безопасности, оказались неспособны предотвратить опасные сценарии при общении с подростками. К такому выводу пришли исследователи CNN и Центра по противодействию цифровой ненависти (CCDH), которые провели масштабное тестирование десяти самых популярных чат-ботов, включая ChatGPT, Google Gemini, Microsoft Copilot, Meta* AI, DeepSeek, Perplexity, Snapchat My AI, Character.AI и Replika. Исключением стал только Claude от Anthropic, который стабильно блокировал опасные запросы.
В ходе эксперимента специалисты имитировали диалоги с подростками, находящимися в состоянии стресса и склонными к обсуждению насильственных действий. Всего было смоделировано 18 сценариев — по 9 для США и Ирландии, охватывающих различные типы атак: от школьных и политически мотивированных нападений до покушений на руководителей и религиозно мотивированных атак.
Иллюстрация: Grok Результаты оказались тревожными: 8 из 10 чат-ботов не только не препятствовали обсуждению насилия, но и зачастую давали прямые советы по выбору целей и средств нападения. В отдельных случаях ChatGPT предоставлял карты кампусов школ, а Gemini объяснял, что металлические осколки наиболее опасны, и советовал по выбору оружия.
Исследование выявило серьёзные пробелы в системах фильтрации и модерации, несмотря на публичные заверения компаний о приоритете безопасности несовершеннолетних пользователей. CCDH подчёркивает, что подобные сбои могут привести к реальным трагедиям, если не будут приняты срочные меры по доработке алгоритмов и внедрению более строгих протоколов реагирования.
Исследователи отмечают, что единственным чат-ботом, который последовательно блокировал опасные сценарии, стал Claude от Anthropic. Это указывает на возможность технической реализации эффективных фильтров, если компании действительно заинтересованы в предотвращении злоупотреблений.
В заключение, авторы исследования призывают разработчиков чат-ботов уделять больше внимания вопросам этики и безопасности, а также внедрять независимые аудиты и прозрачные механизмы контроля.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Может ли FSR 4.1 быть лучше DLSS 4.5? Большое сравнение показывает сильные и слабые стороны новой версии апскейлера AMD
Компания AMD недавно впустила новую версию апскейлера — FSR 4.1. Она не позиционируется, как какой-то большой шаг вперёд, каким является DLSS 4.5 относительно DLSS 4, но всё же улучшения есть. И их исследовали авторы канал Hardware Unboxed. Сразу стоит сказать, что никаких изменений в производительности нет, то есть показатели такие же, как у FSR 4. Напомним, в случае с DLSS...
Из-за роста уровня океанов скорость вращения Земли снижается рекордными темпами за последние миллионы лет
Группа геофизиков из Вены и Цюриха впервые получила количественную оценку влияния современных климатических изменений на вращение Земли. Используя данные о глобальных колебаниях уровня моря с позднего плиоцена, учёные выяснили: с 2000 по 2020 годы продолжительность суток увеличилась примерно на 1,33 миллисекунды за столетие — это самый быстрый темп замедления вращения планеты...
Китайская видеокарта с 24 ГБ памяти и поддержкой DirectX 12. Lisuan Tech опубликовала новые подробности о своих ускорителях, для игр вполне подходит версия LX Pro
Китайская Lisuan Tech обновила официальную страницу своих видеокарт и раскрыла полные характеристики моделей LX Ultra, LX Pro и LX Max. Одновременно компания, похоже, изменила схему позиционирования продуктов: больше это не ускорители GPU G7105 и G7106, а модели линейки LX. Изображение: Videocardz Флагманской моделью является LX Ultra. Ускоритель получил 24 ГБ памяти GDDR6 с...
13 000 мАч, большой экран и Snapdragon 8 Elite Gen5: Oppo готовит по-настоящему мощный планшет Pad 5 Pro
Инсайдер Digital Chat Station раскрыл характеристики будущего планшета Oppo Pad 5 Pro. Флагманское устройство будет построено на топовой однокристальной платформе Qualcomm Snapdragon 8 Elite Gen5 и получит большой экран с диагональю 13,2 дюйма. Другой особенностью станет емкость аккумулятора — внушительные 13 000 мАч. Мощность зарядки составит 67 Вт. Oppo Pad 5. Изображение:...