- Два сверхярких OLED-экрана, уникальный... (339)
- Мини-флагман с большим характером,... (315)
- Volkswagen и BMW практически пропали с... (230)
- «С тех пор игра сильно изменилась»: Ubisoft... (352)
- Аккумулятор 8300 мАч, 100 Вт, 165 Гц, первый... (277)
- Неубиваемый Moto G Power (2026) показали... (477)
- Власти США обсуждают планы организации... (505)
- Цены заметно падают, а гарантия зачастую... (388)
- Xiaomi 17 Ultra полностью одобрен для... (424)
- Зачем платить 250 долларов? Поддельные... (1054)
- Российская версия получит турбомотор,... (815)
- После запуска ракеты «Союз МС-28» на... (502)
- Apple обвиняют в плагиате: компания отменила... (397)
- Остался месяц: госорганы в России переводят... (772)
- Так дальше продолжаться не может:... (759)
- Видео по текстовому запросу, улучшенный... (266)
GPT-4 проходит тест Тьюринга. Ученые провели исследование при участии 500 человек
Дата: 2024-06-17 18:56
Языковая модель GPT-4 прошла тест Тьюринга, о чем сказано в статье, опубликованной в виде препринта на Arxiv.org.
создано DALL-E Суть теста проста: участники тестирования посредством ПК общаются с собеседником, заранее не зная, является ли этот собеседник человеком или машиной.
В данном случае в исследовании принимало участие 500 человек. Каждый из них общался с каждым из четырех собеседников по пять минут и затем должен был высказать свое мнение относительно того, был ли этот собеседник человеком или машиной.
В тесте кроме GPT-4 участвовала также модель GPT-3.5, старая программа ELIZA из 60-х годов и живой человек. В итоге лишь 22% участников посчитали ELIZA человеком, в случае GPT-3.5 таких было уже 50%, а GPT-4 человеком посчитали 54% участников теста, что позволяет авторам исследования сделать вывод, что эта языковая модель проходит тест Тьюринга. К слову, настоящего человека человеком посчитало 67% участников.
Участники также оценивали свою уверенность в принятии решения по шкале от 0 до 100. Средняя уверенность для каждого случая была следующей:
GPT-4: Средняя уверенность составила 70%. GPT-3.5: Средняя уверенность составила 65% ELIZA: Средняя уверенность составила 90% Живой человек: Средняя уверенность составила 80%
Подробнее на iXBT
Предыдущие новости
Вот они — ноутбуки нового класса. На рынок массово вышли модели на основе SoC Snapdragon X с ИИ-функциями Windows
Сегодня в продажу поступили ноутбуки на основе SoC Snapdragon X. И это не только Acer Go Pro AI. На рынок вышло сразу множество ПК, которые попадают в новую категорию Copilot+, придуманную Microsoft. Как минимум в США уже доступно примерно полтора десятка моделей, и вряд ли это все. Речь о ноутбуках Microsoft, Samsung, Dell, Lenovo и HP. Цены на них варьируются от 1000 до...
Огромная мощность, четыре мотора, максимальный комфорт и яркая внешность, дорого. Стартовал приём предзаказов на Dongfeng Warrior 917 Dragon Armor в Китае
Внедорожник Dongfeng Warrior 917 Dragon Armor, который ранее был представлен на Пекинском автосалоне 2024 года, стало доступен для предзаказа по цене от 105 800 до 119 600 долларов. Длина, ширина и высота нового автомобиля составляют 5052, 2150 и 2059 мм соответственно, колёсная база — 2950 мм, а компоновка салона — пятиместная. Длина кузова, ширина и высота ранее выпущенного...
Какие смартфоны Google останутся без обновления до Android 15
Android 15 определенно станет довольно интересным обновлением. Однако новая ОС не появится на большинстве смартфонов Google Pixel. Список неподходящих для Android 15 моделей Google Pixel довольно длинный: Pixel 5; Pixel 5a 5G; Pixel 4; Pixel 4 XL; Pixel 4a; Pixel 4a 5G; Pixel 3; Pixel 3XL; Pixel 3a; Pixel 3a XL; Более старые модели Pixel. Вплоть до серии Google Pixel 7...
Отменённый российский экшен «Приключения капитана Блада» спустя 14 лет вернулся из небытия — новый трейлер, скриншоты и релиз в 2024 году
Считавшийся отменённым российский пиратский экшен «Приключения капитана Блада», пропавший с радаров в 2010 году, неожиданно объявился с новым трейлером и обещанием скорого релиза. Источник изображений:...