- «Это не игра. Это карьера»: правительство... (740)
- Resident Evil Requiem стала первой игрой... (540)
- Страница Rust 2 появилась в Steam, но... (537)
- Big Battlemage наконец предстал на фото:... (569)
- «Удачи вам в ваших сборках!»: EK Water... (429)
- На падающем рынке смартфонов Apple нарастила... (468)
- Microsoft заверила, что исправила все ошибки... (604)
- Спотовые цены на DDR4 упали на 5 % — впервые... (804)
- Xiaomi представила доступного конкурента... (749)
- Xiaomi 15T, Redmi Note 15 Pro 5G и Poco M8 —... (804)
- Google внедрила сквозное шифрование в Gmail... (640)
- Framework предрекла смерть ПК в их... (775)
- В Южной Корее ввели бесплатный базовый... (592)
- После года жалоб игроков разработчики Dune:... (596)
- DJI выпустила электродвигатели, которые... (875)
- Базовая модель Galaxy S26 оказалась... (563)
У Grok и GPT-4o лучше не искать эмоциональной поддержки. Тест 22 языковых моделей показал, что далеко не все могут выказывать эмпатию
Дата: 2025-11-12 17:52
Современные чат-боты на основе больших языковых моделей могут выполнять самые различные задачи, и в том числе в том или ином виде поддерживать людей эмоционально. Свежее исследование показало, что некоторые чат-боты справляются с такими задачами заметно хуже других.
Создано Grok Результаты тестирования CARE (Crisis Assessment and Response Evaluator) компании Rosebud показывают, что популярные ChatGPT и Grok не просто недостаточно хороши - они были худшими из протестированных. Правда, в случае детища OpenAI худший результат показала версия на модели GPT-4o, тогда как модель GPT-5, наротив, уступила лишь Gemini.
Именно разработка Google оказалась самой эмпатичной, если можно так выразиться.
Фото Forbes Компания Rosebud протестировала всего 22 модели ИИ. Им задавали различные вопросы, такого характера, как будто их задавал пользователь с эмоциональными или психологическими проблемами. В частности, было много вопросов так или иначе связанных с самоубийством.
Модели оценивались по ряду параметров, включая способность определить критические вопросы, эмоциональность ответа и так далее. Нередко чат-боты были слишком безэмоциональными в вопросах, которые явно требовали большего внимания. При этом авторы отмечают, что каждая модель хотя бы раз, но проваливала тесты.
Подробнее на iXBT
Предыдущие новости
Утечка подтвердила научно-фантастический соревновательный шутер Project Scout от Ubisoft — первые скриншоты и подробности
Несмотря на неудачи последних лет (см. XDefiant), французский издатель Ubisoft, похоже, не оставляет попыток закрепиться на рынке мультиплеерных шутеров. По слухам, в разработке находится новая игра подобного типа. Источник изображения:...
Китайская мастерица спасает видеокарты. Мастер из Китая перепаивает разъёмы питания 12V-2x6/12VHWPR, заменяя их на усиленные
На рынке уже есть некоторые устройства, которые должны увеличить надёжность и улучшить безопасность 16-контактного разъёма питания у современных видеокарт. Но мастер по ремонту из Китая решила (это девушка), что надёжнее всего полностью заменить разъём. Фото Videocardz Мастер и автор канала Pretty Female Repairman, по её словам, провела уже множество таких операций. У уже...
«Рольф» привез в Россию Hyundai Sonata N-Line Air 2025 — мощнее Toyota Camry, но не дороже (и с гарантией 2 года)
В продаже у дилера «Рольф» в столице появился «подогретый» бизнес-седан Hyundai Sonata N-Line Air 2025. Машина в спортивном обвесе и с максимальным оснащением. Цена — 5,114 млн рублей, но за кредит, trade-in и каско можно получить скидку в размере 800 тыс. рублей. А как отмечает tarantas.news, весной такая машина в России была на 170 тыс. рублей дороже. Те же 5 млн рублей в...
Представлен Ryzen 5 7500X3D. Это самый дешёвый игровой процессор AMD для AM5
Компания AMD официально анонсировала игровой процессор Ryzen 5 7500X3D, который недавно засветился в Сети и уже успел попасть в продажу как минимум в американской сети MicroCenter. Фото AMD Ryzen 5 7500X3D теперь является самым дешёвым игровым CPU AMD для платформы AM5. Его оценили всего в 270 долларов либо 280 евро, и это говорит о том, что перед нами наконец-то глобальная...