- «Люди разучились ждать»: похоже,... (1001)
- Китай направит $295 млрд на строительство... (1281)
- Еврочиновники ополчились на умные... (1112)
- На iPhone наконец можно будет регулировать... (1260)
- Глава ASML выступил против жёсткого... (2070)
- Стартовали продажи «Яндекс Дропс» —... (1103)
- Sony придумала, как вернуть былую славу... (1119)
- Nvidia выпустила Hotfix-драйвер 610.52 для... (1274)
- Кодзима оказался «не заинтересован» в ИИ на... (1340)
- Октябрьский скачок цен на Game Pass... (998)
- Учёные превратили одноразовые стаканчики в... (2113)
- Илон Маск: у SpaceX уже есть почти все... (941)
- Google экстренно обновила Chrome, закрыв... (1160)
- Акции азиатских ИТ-компаний вернулись к... (1228)
- Продажи Street Fighter 6 превысили 7 млн... (954)
- Подорожание смартфонов и ноутбуков в России... (1313)
Галлюцинации ИИ: новая модель OpenAI GPT-4.5 ошибается в 37% ответов
Дата: 2025-03-02 22:25
Компания OpenAI подтвердила, что её новая языковая модель GPT-4.5 генерирует недостоверные ответы в 37% случаев, согласно внутреннему инструменту оценки фактологичности SimpleQA. Эти данные, озвученные в официальном релизе, вызвали дискуссию о надёжности современных алгоритмов ИИ.
Несмотря на заявления о прогрессе — предыдущие версии GPT-4o и o3-mini демонстрировали 61,8% и 80,3% галлюцинаций соответственно, — эксперты подчёркивают, что даже «лучшие модели» остаются неточными.
Фото: David Paul Morris / Bloomberg «Сейчас даже самые продвинутые системы способны генерировать текст без вымысла лишь в 35% случаев», — заявила Вентинг Чжао, соавтор исследования о галлюцинациях ИИ из Корнеллского университета. Её комментарий подтверждает системную проблему отрасли: дорогостоящие модели, позиционируемые как инструменты с «человекообразным интеллектом», часто ошибаются в базовых фактах.
OpenAI, оцениваемая в сотни миллиардов долларов, пытается смягчить реакцию, акцентируя внимание на снижении ошибок по сравнению с прошлыми версиями. Однако критики отмечают, что подобные сравнения лишь маскируют стагнацию в развитии технологий. После впечатляющего старта ChatGPT компания столкнулась с замедлением прогресса, и GPT-4.5, судя по данным, не стал прорывом.
Эксперты сходятся во мнении: для преодоления кризиса доверия индустрии необходимы фундаментальные улучшения, а не косметические апдейты. Пока же пользователи вынуждены мириться с тем, что нейросети регулярно «придумывают» факты — будь то ответ на простой вопрос или анализ сложных данных.
Подробнее на iXBT
Предыдущие новости
Xiaomi представила электросамокат Electric Scooter 5 Max — 1000-ваттный мотор и запас хода в 60 км
Китайская компания Xiaomi анонсировала новый самокат на электрической тяге Electric Scooter 5 Max, который призван «переосмыслить городские поездки благодаря обновлённой системе передней двойной гидравлической и задней двойной пружинной подвеске». Такая система подвески обеспечит более плавный ход, снизит нагрузку на ноги и руки, а также в целом повысит комфорт в процессе...
Американский стартап Last Energy анонсировал строительство 30 микрореакторов в Техасе для энергоснабжения дата-центров
Американский разработчик Last Energy объявил о планах построить 30 микрореакторов на северо-западе Техаса для энергоснабжения дата-центров штата. Проект, анонсированный 28 февраля, предусматривает размещение установок на участке площадью 80 га в округе Хаскелл к западу от Далласа. Энергия будет поставляться потребителям через комбинацию частных линий и общей сети после...
Немецкий стартап Polaris получил контракт на гиперзвуковой космоплан Aurora с аэроспайк-двигателем
Немецкие вооружённые силы заключили контракт с бременским стартапом Polaris на создание многоразового гиперзвукового космоплана Aurora. Проект, реализацию которого планируют завершить за три года, направлен на разработку аппарата длиной 28 метров, сочетающего черты ракеты и самолёта. Космоплан сможет взлетать и садиться на обычную взлётно-посадочную полосу, а также выводить до...
Honor становится в один ряд с Google и Samung: компания будет обновлять свои смартфоны в течение 7 лет
Сегодня, накануне открытия выставки MWC 2025, Honor сообщила о расширении срока программной поддержки своих смартфонов — он составит 7 лет. То есть по длительности программной поддержки Honor становится в один ряд с Google и Samsung, значительно превосходя Xiaomi. Фото Honor Столь длительная программная поддержка, согласно заявлению компании, «гарантирует, что пользователи...