- Короткий всплеск позади: российский... (313)
- Дефицит памяти в сегменте ПК может... (410)
- Названа дата выхода Honor 500 и 500... (316)
- iPhone Air 2 выпустят только в 2027... (192)
- Первый в мире смартфон на базе... (307)
- Huawei Mate 80 и Mate X7 представят 25... (407)
- 7000 мАч, 120 Вт, экран 2K 144 Гц,... (411)
- Флагманские смартфоны серии Poco F8... (281)
- Основным новшеством iPhone Air второго... (388)
- 200 Мп, Snapdragon 8 Gen 5, 8000 мА·ч, 80... (295)
- Всю линейку Huawei Mate 80, Huawei Mate 80... (323)
- LG зарегистрировала новые товарные знаки в... (329)
- До Земли дошёл последний выброс от мощнейшей... (373)
- Со следующего года Apple перейдёт на иной... (316)
- Tesla готовит «сверхчеловеческую» кисть... (336)
- SpaceX планирует посадку на Луну в июне 2027... (413)
У Grok и GPT-4o лучше не искать эмоциональной поддержки. Тест 22 языковых моделей показал, что далеко не все могут выказывать эмпатию
Дата: 2025-11-12 17:52
Современные чат-боты на основе больших языковых моделей могут выполнять самые различные задачи, и в том числе в том или ином виде поддерживать людей эмоционально. Свежее исследование показало, что некоторые чат-боты справляются с такими задачами заметно хуже других.
Создано Grok Результаты тестирования CARE (Crisis Assessment and Response Evaluator) компании Rosebud показывают, что популярные ChatGPT и Grok не просто недостаточно хороши - они были худшими из протестированных. Правда, в случае детища OpenAI худший результат показала версия на модели GPT-4o, тогда как модель GPT-5, наротив, уступила лишь Gemini.
Именно разработка Google оказалась самой эмпатичной, если можно так выразиться.
Фото Forbes Компания Rosebud протестировала всего 22 модели ИИ. Им задавали различные вопросы, такого характера, как будто их задавал пользователь с эмоциональными или психологическими проблемами. В частности, было много вопросов так или иначе связанных с самоубийством.
Модели оценивались по ряду параметров, включая способность определить критические вопросы, эмоциональность ответа и так далее. Нередко чат-боты были слишком безэмоциональными в вопросах, которые явно требовали большего внимания. При этом авторы отмечают, что каждая модель хотя бы раз, но проваливала тесты.
Подробнее на iXBT
Предыдущие новости
Утечка подтвердила научно-фантастический соревновательный шутер Project Scout от Ubisoft — первые скриншоты и подробности
Несмотря на неудачи последних лет (см. XDefiant), французский издатель Ubisoft, похоже, не оставляет попыток закрепиться на рынке мультиплеерных шутеров. По слухам, в разработке находится новая игра подобного типа. Источник изображения:...
Китайская мастерица спасает видеокарты. Мастер из Китая перепаивает разъёмы питания 12V-2x6/12VHWPR, заменяя их на усиленные
На рынке уже есть некоторые устройства, которые должны увеличить надёжность и улучшить безопасность 16-контактного разъёма питания у современных видеокарт. Но мастер по ремонту из Китая решила (это девушка), что надёжнее всего полностью заменить разъём. Фото Videocardz Мастер и автор канала Pretty Female Repairman, по её словам, провела уже множество таких операций. У уже...
«Рольф» привез в Россию Hyundai Sonata N-Line Air 2025 — мощнее Toyota Camry, но не дороже (и с гарантией 2 года)
В продаже у дилера «Рольф» в столице появился «подогретый» бизнес-седан Hyundai Sonata N-Line Air 2025. Машина в спортивном обвесе и с максимальным оснащением. Цена — 5,114 млн рублей, но за кредит, trade-in и каско можно получить скидку в размере 800 тыс. рублей. А как отмечает tarantas.news, весной такая машина в России была на 170 тыс. рублей дороже. Те же 5 млн рублей в...
Представлен Ryzen 5 7500X3D. Это самый дешёвый игровой процессор AMD для AM5
Компания AMD официально анонсировала игровой процессор Ryzen 5 7500X3D, который недавно засветился в Сети и уже успел попасть в продажу как минимум в американской сети MicroCenter. Фото AMD Ryzen 5 7500X3D теперь является самым дешёвым игровым CPU AMD для платформы AM5. Его оценили всего в 270 долларов либо 280 евро, и это говорит о том, что перед нами наконец-то глобальная...