- «Это беспрецедентно много для нового... (187)
- ВВС США начали экологическую экспертизу для... (182)
- «Новая 3D-игра, созданная с помощью Grok 3,... (208)
- Редкий BMW 8 серии, да ещё и почти без... (175)
- HMD представила беспроводные наушники, от... (174)
- HMD представила беспроводные наушники, чей... (199)
- Дешёвый кроссовер размером с Hyundai Santa... (173)
- «Таких авто в России нет». В продаже... (178)
- Огромный, рамный, российский. УАЗ начнет... (178)
- «Вершина семейства Audi Avant», 45 лет после... (171)
- Дональд Трамп объявил о создании... (174)
- Li Auto представила универсальный фонарь с... (169)
- Как показала себя замена Toyota Camry после... (160)
- К пуску готовы: Starship и Super Heavy... (168)
- Mazda 3 от 550 тыс., Honda Civic от 460... (175)
- Настоящий внедорожник, три мотора на выбор,... (177)
Галлюцинации ИИ: новая модель OpenAI GPT-4.5 ошибается в 37% ответов
Дата: 2025-03-02 22:25
Компания OpenAI подтвердила, что её новая языковая модель GPT-4.5 генерирует недостоверные ответы в 37% случаев, согласно внутреннему инструменту оценки фактологичности SimpleQA. Эти данные, озвученные в официальном релизе, вызвали дискуссию о надёжности современных алгоритмов ИИ.
Несмотря на заявления о прогрессе — предыдущие версии GPT-4o и o3-mini демонстрировали 61,8% и 80,3% галлюцинаций соответственно, — эксперты подчёркивают, что даже «лучшие модели» остаются неточными.

«Сейчас даже самые продвинутые системы способны генерировать текст без вымысла лишь в 35% случаев», — заявила Вентинг Чжао, соавтор исследования о галлюцинациях ИИ из Корнеллского университета. Её комментарий подтверждает системную проблему отрасли: дорогостоящие модели, позиционируемые как инструменты с «человекообразным интеллектом», часто ошибаются в базовых фактах.
OpenAI, оцениваемая в сотни миллиардов долларов, пытается смягчить реакцию, акцентируя внимание на снижении ошибок по сравнению с прошлыми версиями. Однако критики отмечают, что подобные сравнения лишь маскируют стагнацию в развитии технологий. После впечатляющего старта ChatGPT компания столкнулась с замедлением прогресса, и GPT-4.5, судя по данным, не стал прорывом.
Эксперты сходятся во мнении: для преодоления кризиса доверия индустрии необходимы фундаментальные улучшения, а не косметические апдейты. Пока же пользователи вынуждены мириться с тем, что нейросети регулярно «придумывают» факты — будь то ответ на простой вопрос или анализ сложных данных.
Подробнее на iXBT
Предыдущие новости
Xiaomi представила электросамокат Electric Scooter 5 Max — 1000-ваттный мотор и запас хода в 60 км
Китайская компания Xiaomi анонсировала новый самокат на электрической тяге Electric Scooter 5 Max, который призван «переосмыслить городские поездки благодаря обновлённой системе передней двойной гидравлической и задней двойной пружинной подвеске». Такая система подвески обеспечит более плавный ход, снизит нагрузку на ноги и руки, а также в целом повысит комфорт в процессе...
Американский стартап Last Energy анонсировал строительство 30 микрореакторов в Техасе для энергоснабжения дата-центров
Американский разработчик Last Energy объявил о планах построить 30 микрореакторов на северо-западе Техаса для энергоснабжения дата-центров штата. Проект, анонсированный 28 февраля, предусматривает размещение установок на участке площадью 80 га в округе Хаскелл к западу от Далласа. Энергия будет поставляться потребителям через комбинацию частных линий и общей сети после...
Немецкий стартап Polaris получил контракт на гиперзвуковой космоплан Aurora с аэроспайк-двигателем
Немецкие вооружённые силы заключили контракт с бременским стартапом Polaris на создание многоразового гиперзвукового космоплана Aurora. Проект, реализацию которого планируют завершить за три года, направлен на разработку аппарата длиной 28 метров, сочетающего черты ракеты и самолёта. Космоплан сможет взлетать и садиться на обычную взлётно-посадочную полосу, а также выводить до...
Honor становится в один ряд с Google и Samung: компания будет обновлять свои смартфоны в течение 7 лет
Сегодня, накануне открытия выставки MWC 2025, Honor сообщила о расширении срока программной поддержки своих смартфонов — он составит 7 лет. То есть по длительности программной поддержки Honor становится в один ряд с Google и Samsung, значительно превосходя Xiaomi. Фото Honor Столь длительная программная поддержка, согласно заявлению компании, «гарантирует, что пользователи...