- Asus первой восстановила отключённое AMD... (926)
- Акции азиатских партнёров Apple массово... (1198)
- Для литиевых аккумуляторов придумали... (962)
- Сотрудники OpenAI стали переходить от... (937)
- Космический шутер Wildgate от ветеранов... (1006)
- Администрация Трампа попросила OpenAI... (899)
- ФАС рекомендовала российским операторам не... (1411)
- SpaceX превратит Starlink в мобильного... (983)
- Swatch потребовала от Samsung компенсацию в... (998)
- Учёные создали пиксель, который научит... (1250)
- Microsoft устранила множество проблем с... (1325)
- Kingdom Come: Deliverance 2 взяла новую... (1369)
- Chuwi начала принимать предзаказы на ноутбук... (1018)
- Apatura пытается убедить жителей, что... (950)
- Илон Маск расширил доступ к фирменной... (1120)
- OpenAI может отложить IPO до следующего года... (1223)
У Grok и GPT-4o лучше не искать эмоциональной поддержки. Тест 22 языковых моделей показал, что далеко не все могут выказывать эмпатию
Дата: 2025-11-12 17:52
Современные чат-боты на основе больших языковых моделей могут выполнять самые различные задачи, и в том числе в том или ином виде поддерживать людей эмоционально. Свежее исследование показало, что некоторые чат-боты справляются с такими задачами заметно хуже других.
Создано Grok Результаты тестирования CARE (Crisis Assessment and Response Evaluator) компании Rosebud показывают, что популярные ChatGPT и Grok не просто недостаточно хороши - они были худшими из протестированных. Правда, в случае детища OpenAI худший результат показала версия на модели GPT-4o, тогда как модель GPT-5, наротив, уступила лишь Gemini.
Именно разработка Google оказалась самой эмпатичной, если можно так выразиться.
Фото Forbes Компания Rosebud протестировала всего 22 модели ИИ. Им задавали различные вопросы, такого характера, как будто их задавал пользователь с эмоциональными или психологическими проблемами. В частности, было много вопросов так или иначе связанных с самоубийством.
Модели оценивались по ряду параметров, включая способность определить критические вопросы, эмоциональность ответа и так далее. Нередко чат-боты были слишком безэмоциональными в вопросах, которые явно требовали большего внимания. При этом авторы отмечают, что каждая модель хотя бы раз, но проваливала тесты.
Подробнее на iXBT
Предыдущие новости
Утечка подтвердила научно-фантастический соревновательный шутер Project Scout от Ubisoft — первые скриншоты и подробности
Несмотря на неудачи последних лет (см. XDefiant), французский издатель Ubisoft, похоже, не оставляет попыток закрепиться на рынке мультиплеерных шутеров. По слухам, в разработке находится новая игра подобного типа. Источник изображения:...
Китайская мастерица спасает видеокарты. Мастер из Китая перепаивает разъёмы питания 12V-2x6/12VHWPR, заменяя их на усиленные
На рынке уже есть некоторые устройства, которые должны увеличить надёжность и улучшить безопасность 16-контактного разъёма питания у современных видеокарт. Но мастер по ремонту из Китая решила (это девушка), что надёжнее всего полностью заменить разъём. Фото Videocardz Мастер и автор канала Pretty Female Repairman, по её словам, провела уже множество таких операций. У уже...
«Рольф» привез в Россию Hyundai Sonata N-Line Air 2025 — мощнее Toyota Camry, но не дороже (и с гарантией 2 года)
В продаже у дилера «Рольф» в столице появился «подогретый» бизнес-седан Hyundai Sonata N-Line Air 2025. Машина в спортивном обвесе и с максимальным оснащением. Цена — 5,114 млн рублей, но за кредит, trade-in и каско можно получить скидку в размере 800 тыс. рублей. А как отмечает tarantas.news, весной такая машина в России была на 170 тыс. рублей дороже. Те же 5 млн рублей в...
Представлен Ryzen 5 7500X3D. Это самый дешёвый игровой процессор AMD для AM5
Компания AMD официально анонсировала игровой процессор Ryzen 5 7500X3D, который недавно засветился в Сети и уже успел попасть в продажу как минимум в американской сети MicroCenter. Фото AMD Ryzen 5 7500X3D теперь является самым дешёвым игровым CPU AMD для платформы AM5. Его оценили всего в 270 долларов либо 280 евро, и это говорит о том, что перед нами наконец-то глобальная...