- 27-дюймовый Xiaomi за небольшие деньги. На... (776)
- В этот ноутбук можно установить до 256 ГБ... (679)
- Новая статья: Обзор ASUS ROG Strix G16... (630)
- Представлен экстремальный Tank 300 Polar... (705)
- Представлен внедорожный пикап Great Wall... (889)
- Представлен очередной «китайский Hummer»... (724)
- Представлен лимитированный Lexus NX Aurora... (780)
- Представлены недорогие телевизоры Blaupunkt... (827)
- «Китайский Maybach»: на автосалоне в... (793)
- Apple устала от раздутого кода — в iOS 27... (906)
- Seasonic выпустит киловаттный блок питания с... (667)
- Представлен флагманский кроссовер Chery... (729)
- «Роботы могут проломить череп»: Figure AI... (760)
- Meta* ещё с 2020 года достоверно знала, что... (703)
- ИИ-пузырь «витает в воздухе», но Google всё... (741)
- Владелец iPhone 17 Pro Max взломал его и... (672)
GPT-4 проходит тест Тьюринга. Ученые провели исследование при участии 500 человек
Дата: 2024-06-17 18:56
Языковая модель GPT-4 прошла тест Тьюринга, о чем сказано в статье, опубликованной в виде препринта на Arxiv.org.
создано DALL-E Суть теста проста: участники тестирования посредством ПК общаются с собеседником, заранее не зная, является ли этот собеседник человеком или машиной.
В данном случае в исследовании принимало участие 500 человек. Каждый из них общался с каждым из четырех собеседников по пять минут и затем должен был высказать свое мнение относительно того, был ли этот собеседник человеком или машиной.
В тесте кроме GPT-4 участвовала также модель GPT-3.5, старая программа ELIZA из 60-х годов и живой человек. В итоге лишь 22% участников посчитали ELIZA человеком, в случае GPT-3.5 таких было уже 50%, а GPT-4 человеком посчитали 54% участников теста, что позволяет авторам исследования сделать вывод, что эта языковая модель проходит тест Тьюринга. К слову, настоящего человека человеком посчитало 67% участников.
Участники также оценивали свою уверенность в принятии решения по шкале от 0 до 100. Средняя уверенность для каждого случая была следующей:
GPT-4: Средняя уверенность составила 70%. GPT-3.5: Средняя уверенность составила 65% ELIZA: Средняя уверенность составила 90% Живой человек: Средняя уверенность составила 80%
Подробнее на iXBT
Предыдущие новости
Вот они — ноутбуки нового класса. На рынок массово вышли модели на основе SoC Snapdragon X с ИИ-функциями Windows
Сегодня в продажу поступили ноутбуки на основе SoC Snapdragon X. И это не только Acer Go Pro AI. На рынок вышло сразу множество ПК, которые попадают в новую категорию Copilot+, придуманную Microsoft. Как минимум в США уже доступно примерно полтора десятка моделей, и вряд ли это все. Речь о ноутбуках Microsoft, Samsung, Dell, Lenovo и HP. Цены на них варьируются от 1000 до...
Огромная мощность, четыре мотора, максимальный комфорт и яркая внешность, дорого. Стартовал приём предзаказов на Dongfeng Warrior 917 Dragon Armor в Китае
Внедорожник Dongfeng Warrior 917 Dragon Armor, который ранее был представлен на Пекинском автосалоне 2024 года, стало доступен для предзаказа по цене от 105 800 до 119 600 долларов. Длина, ширина и высота нового автомобиля составляют 5052, 2150 и 2059 мм соответственно, колёсная база — 2950 мм, а компоновка салона — пятиместная. Длина кузова, ширина и высота ранее выпущенного...
Какие смартфоны Google останутся без обновления до Android 15
Android 15 определенно станет довольно интересным обновлением. Однако новая ОС не появится на большинстве смартфонов Google Pixel. Список неподходящих для Android 15 моделей Google Pixel довольно длинный: Pixel 5; Pixel 5a 5G; Pixel 4; Pixel 4 XL; Pixel 4a; Pixel 4a 5G; Pixel 3; Pixel 3XL; Pixel 3a; Pixel 3a XL; Более старые модели Pixel. Вплоть до серии Google Pixel 7...
Отменённый российский экшен «Приключения капитана Блада» спустя 14 лет вернулся из небытия — новый трейлер, скриншоты и релиз в 2024 году
Считавшийся отменённым российский пиратский экшен «Приключения капитана Блада», пропавший с радаров в 2010 году, неожиданно объявился с новым трейлером и обещанием скорого релиза. Источник изображений:...