- Новая методика электронной микроскопии... (2708)
- Прорыв в устойчивой электронике:... (2638)
- Будущее космической связи: исследователи... (2674)
- APNIC: переход на IPv6, как оказалось, не... (2632)
- Система Веги оказалась планетарной... (2736)
- Облачный бизнес Google растёт быстрее, чем у... (2661)
- Все нарастили продажи сильнее, чем Apple, но... (2555)
- Первые тесты SoC Tensor G5 для Pixel 10... (2780)
- Новые процессоры Intel тоже немного гнутся.... (2592)
- У Intel не получается на рынке ИИ. Компания... (2487)
- Официальный дилер привез новый Honda Accord... (1924)
- Тесты Qualcomm Snapdragon 8 Elite показали,... (2221)
- Google представила Learn About — инструмент... (1996)
- Таким будет самый дешёвый Pixel. Google... (1761)
- Новейший Toyota Land Cruiser 250 превратился... (1957)
- АвтоВАЗ доработал все Lada Vesta, у которых... (1934)
GPT-4 проходит тест Тьюринга. Ученые провели исследование при участии 500 человек
Дата: 2024-06-17 18:56
Языковая модель GPT-4 прошла тест Тьюринга, о чем сказано в статье, опубликованной в виде препринта на Arxiv.org.
создано DALL-EСуть теста проста: участники тестирования посредством ПК общаются с собеседником, заранее не зная, является ли этот собеседник человеком или машиной.
В данном случае в исследовании принимало участие 500 человек. Каждый из них общался с каждым из четырех собеседников по пять минут и затем должен был высказать свое мнение относительно того, был ли этот собеседник человеком или машиной.
В тесте кроме GPT-4 участвовала также модель GPT-3.5, старая программа ELIZA из 60-х годов и живой человек. В итоге лишь 22% участников посчитали ELIZA человеком, в случае GPT-3.5 таких было уже 50%, а GPT-4 человеком посчитали 54% участников теста, что позволяет авторам исследования сделать вывод, что эта языковая модель проходит тест Тьюринга. К слову, настоящего человека человеком посчитало 67% участников.
Участники также оценивали свою уверенность в принятии решения по шкале от 0 до 100. Средняя уверенность для каждого случая была следующей:
GPT-4: Средняя уверенность составила 70%. GPT-3.5: Средняя уверенность составила 65% ELIZA: Средняя уверенность составила 90% Живой человек: Средняя уверенность составила 80%
Подробнее на iXBT
Предыдущие новости
Вот они — ноутбуки нового класса. На рынок массово вышли модели на основе SoC Snapdragon X с ИИ-функциями Windows
Сегодня в продажу поступили ноутбуки на основе SoC Snapdragon X. И это не только Acer Go Pro AI. На рынок вышло сразу множество ПК, которые попадают в новую категорию Copilot+, придуманную Microsoft. Как минимум в США уже доступно примерно полтора десятка моделей, и вряд ли это все. Речь о ноутбуках Microsoft, Samsung, Dell, Lenovo и HP. Цены на них варьируются от 1000 до...
Огромная мощность, четыре мотора, максимальный комфорт и яркая внешность, дорого. Стартовал приём предзаказов на Dongfeng Warrior 917 Dragon Armor в Китае
Внедорожник Dongfeng Warrior 917 Dragon Armor, который ранее был представлен на Пекинском автосалоне 2024 года, стало доступен для предзаказа по цене от 105 800 до 119 600 долларов. Длина, ширина и высота нового автомобиля составляют 5052, 2150 и 2059 мм соответственно, колёсная база — 2950 мм, а компоновка салона — пятиместная. Длина кузова, ширина и высота ранее выпущенного...
Какие смартфоны Google останутся без обновления до Android 15
Android 15 определенно станет довольно интересным обновлением. Однако новая ОС не появится на большинстве смартфонов Google Pixel. Список неподходящих для Android 15 моделей Google Pixel довольно длинный: Pixel 5; Pixel 5a 5G; Pixel 4; Pixel 4 XL; Pixel 4a; Pixel 4a 5G; Pixel 3; Pixel 3XL; Pixel 3a; Pixel 3a XL; Более старые модели Pixel. Вплоть до серии Google Pixel 7...
Отменённый российский экшен «Приключения капитана Блада» спустя 14 лет вернулся из небытия — новый трейлер, скриншоты и релиз в 2024 году
Считавшийся отменённым российский пиратский экшен «Приключения капитана Блада», пропавший с радаров в 2010 году, неожиданно объявился с новым трейлером и обещанием скорого релиза. Источник изображений:...