- Герои нашего времени: долгожданная Heroes of... (7508)
- Продажи ускорителей Huawei в Китае в этом... (7251)
- Российские поставщики временного Wi-Fi... (8304)
- Спрос на iPhone 17 и MacBook Neo разогнал... (8157)
- Илон Маск призвал ИИ-компании «избегать... (8143)
- ИИ разогнал продажи HDD — выручка Western... (8565)
- Выручка Western Digital выросла на 45 % до... (6891)
- Финансовый директор OpenAI заявила, что... (5563)
- Новая статья: Термодинамические вычислители... (6033)
- Материнские платы Gigabyte тоже получили... (6930)
- Акции M**a упали на 9 %, а Alphabet выросли... (5657)
- «Сделано в Германии»: Volla представила... (5907)
- Lian Li выпустила компактный корпус Vector... (6031)
- Epic Games Store устроил раздачу Hogwarts... (5507)
- Microsoft запустила тестирование... (5301)
- ИИ-ассистент Gemini появится в миллионах... (6130)
GPT-4 проходит тест Тьюринга. Ученые провели исследование при участии 500 человек
Дата: 2024-06-17 18:56
Языковая модель GPT-4 прошла тест Тьюринга, о чем сказано в статье, опубликованной в виде препринта на Arxiv.org.
создано DALL-E Суть теста проста: участники тестирования посредством ПК общаются с собеседником, заранее не зная, является ли этот собеседник человеком или машиной.
В данном случае в исследовании принимало участие 500 человек. Каждый из них общался с каждым из четырех собеседников по пять минут и затем должен был высказать свое мнение относительно того, был ли этот собеседник человеком или машиной.
В тесте кроме GPT-4 участвовала также модель GPT-3.5, старая программа ELIZA из 60-х годов и живой человек. В итоге лишь 22% участников посчитали ELIZA человеком, в случае GPT-3.5 таких было уже 50%, а GPT-4 человеком посчитали 54% участников теста, что позволяет авторам исследования сделать вывод, что эта языковая модель проходит тест Тьюринга. К слову, настоящего человека человеком посчитало 67% участников.
Участники также оценивали свою уверенность в принятии решения по шкале от 0 до 100. Средняя уверенность для каждого случая была следующей:
GPT-4: Средняя уверенность составила 70%. GPT-3.5: Средняя уверенность составила 65% ELIZA: Средняя уверенность составила 90% Живой человек: Средняя уверенность составила 80%
Подробнее на iXBT
Предыдущие новости
Вот они — ноутбуки нового класса. На рынок массово вышли модели на основе SoC Snapdragon X с ИИ-функциями Windows
Сегодня в продажу поступили ноутбуки на основе SoC Snapdragon X. И это не только Acer Go Pro AI. На рынок вышло сразу множество ПК, которые попадают в новую категорию Copilot+, придуманную Microsoft. Как минимум в США уже доступно примерно полтора десятка моделей, и вряд ли это все. Речь о ноутбуках Microsoft, Samsung, Dell, Lenovo и HP. Цены на них варьируются от 1000 до...
Огромная мощность, четыре мотора, максимальный комфорт и яркая внешность, дорого. Стартовал приём предзаказов на Dongfeng Warrior 917 Dragon Armor в Китае
Внедорожник Dongfeng Warrior 917 Dragon Armor, который ранее был представлен на Пекинском автосалоне 2024 года, стало доступен для предзаказа по цене от 105 800 до 119 600 долларов. Длина, ширина и высота нового автомобиля составляют 5052, 2150 и 2059 мм соответственно, колёсная база — 2950 мм, а компоновка салона — пятиместная. Длина кузова, ширина и высота ранее выпущенного...
Какие смартфоны Google останутся без обновления до Android 15
Android 15 определенно станет довольно интересным обновлением. Однако новая ОС не появится на большинстве смартфонов Google Pixel. Список неподходящих для Android 15 моделей Google Pixel довольно длинный: Pixel 5; Pixel 5a 5G; Pixel 4; Pixel 4 XL; Pixel 4a; Pixel 4a 5G; Pixel 3; Pixel 3XL; Pixel 3a; Pixel 3a XL; Более старые модели Pixel. Вплоть до серии Google Pixel 7...
Отменённый российский экшен «Приключения капитана Блада» спустя 14 лет вернулся из небытия — новый трейлер, скриншоты и релиз в 2024 году
Считавшийся отменённым российский пиратский экшен «Приключения капитана Блада», пропавший с радаров в 2010 году, неожиданно объявился с новым трейлером и обещанием скорого релиза. Источник изображений:...