- Представлен Voyah Free+ Sport: спортпакет,... (5990)
- Флагманский кроссовер Chery Fulwin T11 вышел... (3711)
- Google вынуждена отказывать клиентам из-за... (4518)
- Спасибо, Epic Games: Google разрешила... (3048)
- Google выяснила, что Android эффективнее iOS... (2354)
- «Код Дурова»: в России ограничили... (4298)
- SpaceX показала Starship HLS — ракету,... (3033)
- Стартап Extropic представил... (4355)
- Intel начала напрямую торговать компьютерами... (2820)
- Telegram начал предлагать россиянам... (2370)
- Так снимает Redmi K90 Pro Max: опубликованы... (3163)
- Учёные представили первую радиокарту... (2623)
- DJI представила Neo 2 — крошечный селфи-дрон... (2455)
- «Фотонный фонарик» показал невидимое:... (2115)
- AMD оставляет за бортом владельцев видеокарт... (3933)
- Флагманы vivo X300 и X300 Pro вышли в... (3720)
GPT-4 проходит тест Тьюринга. Ученые провели исследование при участии 500 человек
Дата: 2024-06-17 18:56
Языковая модель GPT-4 прошла тест Тьюринга, о чем сказано в статье, опубликованной в виде препринта на Arxiv.org.
создано DALL-E Суть теста проста: участники тестирования посредством ПК общаются с собеседником, заранее не зная, является ли этот собеседник человеком или машиной.
В данном случае в исследовании принимало участие 500 человек. Каждый из них общался с каждым из четырех собеседников по пять минут и затем должен был высказать свое мнение относительно того, был ли этот собеседник человеком или машиной.
В тесте кроме GPT-4 участвовала также модель GPT-3.5, старая программа ELIZA из 60-х годов и живой человек. В итоге лишь 22% участников посчитали ELIZA человеком, в случае GPT-3.5 таких было уже 50%, а GPT-4 человеком посчитали 54% участников теста, что позволяет авторам исследования сделать вывод, что эта языковая модель проходит тест Тьюринга. К слову, настоящего человека человеком посчитало 67% участников.
Участники также оценивали свою уверенность в принятии решения по шкале от 0 до 100. Средняя уверенность для каждого случая была следующей:
GPT-4: Средняя уверенность составила 70%. GPT-3.5: Средняя уверенность составила 65% ELIZA: Средняя уверенность составила 90% Живой человек: Средняя уверенность составила 80%
Подробнее на iXBT
Предыдущие новости
Вот они — ноутбуки нового класса. На рынок массово вышли модели на основе SoC Snapdragon X с ИИ-функциями Windows
Сегодня в продажу поступили ноутбуки на основе SoC Snapdragon X. И это не только Acer Go Pro AI. На рынок вышло сразу множество ПК, которые попадают в новую категорию Copilot+, придуманную Microsoft. Как минимум в США уже доступно примерно полтора десятка моделей, и вряд ли это все. Речь о ноутбуках Microsoft, Samsung, Dell, Lenovo и HP. Цены на них варьируются от 1000 до...
Огромная мощность, четыре мотора, максимальный комфорт и яркая внешность, дорого. Стартовал приём предзаказов на Dongfeng Warrior 917 Dragon Armor в Китае
Внедорожник Dongfeng Warrior 917 Dragon Armor, который ранее был представлен на Пекинском автосалоне 2024 года, стало доступен для предзаказа по цене от 105 800 до 119 600 долларов. Длина, ширина и высота нового автомобиля составляют 5052, 2150 и 2059 мм соответственно, колёсная база — 2950 мм, а компоновка салона — пятиместная. Длина кузова, ширина и высота ранее выпущенного...
Какие смартфоны Google останутся без обновления до Android 15
Android 15 определенно станет довольно интересным обновлением. Однако новая ОС не появится на большинстве смартфонов Google Pixel. Список неподходящих для Android 15 моделей Google Pixel довольно длинный: Pixel 5; Pixel 5a 5G; Pixel 4; Pixel 4 XL; Pixel 4a; Pixel 4a 5G; Pixel 3; Pixel 3XL; Pixel 3a; Pixel 3a XL; Более старые модели Pixel. Вплоть до серии Google Pixel 7...
Отменённый российский экшен «Приключения капитана Блада» спустя 14 лет вернулся из небытия — новый трейлер, скриншоты и релиз в 2024 году
Считавшийся отменённым российский пиратский экшен «Приключения капитана Блада», пропавший с радаров в 2010 году, неожиданно объявился с новым трейлером и обещанием скорого релиза. Источник изображений:...