- OpenAI представила GPT-4.5 — самую большую и... (326)
- OpenAI представила GPT-4.5 — самую большую и... (865)
- Астрономы обнаружили сложную структуру... (749)
- Новая статья: Обзор ноутбука ASUS Vivobook S... (622)
- Новая статья: Обзор планшета HUAWEI MatePad... (785)
- Учёные преодолели ограничения традиционных... (889)
- Forza Horizon 5 примчится на PS5 в апреле —... (917)
- Телескоп «Джеймс Уэбб» впервые обнаружил... (976)
- «Яндекс» представил первый российский... (582)
- Инженеры NASA успешно проверили стыковку... (878)
- «Яндекс» представил свой первый 100-дюймовый... (936)
- Xiaomi представила SU7 Ultra — 1500-сильный... (826)
- «Игра, в которую хотел сыграть каждый... (927)
- Федеральное управление гражданской авиации... (789)
- 5000 мАч, зарядка как у Galaxy S25 Ultra,... (861)
- T-1000 всё ближе — рой микроботов научили... (2780)
Галлюцинации ИИ: новая модель OpenAI GPT-4.5 ошибается в 37% ответов
Дата: 2025-03-02 22:25
Компания OpenAI подтвердила, что её новая языковая модель GPT-4.5 генерирует недостоверные ответы в 37% случаев, согласно внутреннему инструменту оценки фактологичности SimpleQA. Эти данные, озвученные в официальном релизе, вызвали дискуссию о надёжности современных алгоритмов ИИ.
Несмотря на заявления о прогрессе — предыдущие версии GPT-4o и o3-mini демонстрировали 61,8% и 80,3% галлюцинаций соответственно, — эксперты подчёркивают, что даже «лучшие модели» остаются неточными.

«Сейчас даже самые продвинутые системы способны генерировать текст без вымысла лишь в 35% случаев», — заявила Вентинг Чжао, соавтор исследования о галлюцинациях ИИ из Корнеллского университета. Её комментарий подтверждает системную проблему отрасли: дорогостоящие модели, позиционируемые как инструменты с «человекообразным интеллектом», часто ошибаются в базовых фактах.
OpenAI, оцениваемая в сотни миллиардов долларов, пытается смягчить реакцию, акцентируя внимание на снижении ошибок по сравнению с прошлыми версиями. Однако критики отмечают, что подобные сравнения лишь маскируют стагнацию в развитии технологий. После впечатляющего старта ChatGPT компания столкнулась с замедлением прогресса, и GPT-4.5, судя по данным, не стал прорывом.
Эксперты сходятся во мнении: для преодоления кризиса доверия индустрии необходимы фундаментальные улучшения, а не косметические апдейты. Пока же пользователи вынуждены мириться с тем, что нейросети регулярно «придумывают» факты — будь то ответ на простой вопрос или анализ сложных данных.
Подробнее на iXBT
Предыдущие новости
Xiaomi представила электросамокат Electric Scooter 5 Max — 1000-ваттный мотор и запас хода в 60 км
Китайская компания Xiaomi анонсировала новый самокат на электрической тяге Electric Scooter 5 Max, который призван «переосмыслить городские поездки благодаря обновлённой системе передней двойной гидравлической и задней двойной пружинной подвеске». Такая система подвески обеспечит более плавный ход, снизит нагрузку на ноги и руки, а также в целом повысит комфорт в процессе...
Американский стартап Last Energy анонсировал строительство 30 микрореакторов в Техасе для энергоснабжения дата-центров
Американский разработчик Last Energy объявил о планах построить 30 микрореакторов на северо-западе Техаса для энергоснабжения дата-центров штата. Проект, анонсированный 28 февраля, предусматривает размещение установок на участке площадью 80 га в округе Хаскелл к западу от Далласа. Энергия будет поставляться потребителям через комбинацию частных линий и общей сети после...
Немецкий стартап Polaris получил контракт на гиперзвуковой космоплан Aurora с аэроспайк-двигателем
Немецкие вооружённые силы заключили контракт с бременским стартапом Polaris на создание многоразового гиперзвукового космоплана Aurora. Проект, реализацию которого планируют завершить за три года, направлен на разработку аппарата длиной 28 метров, сочетающего черты ракеты и самолёта. Космоплан сможет взлетать и садиться на обычную взлётно-посадочную полосу, а также выводить до...
Honor становится в один ряд с Google и Samung: компания будет обновлять свои смартфоны в течение 7 лет
Сегодня, накануне открытия выставки MWC 2025, Honor сообщила о расширении срока программной поддержки своих смартфонов — он составит 7 лет. То есть по длительности программной поддержки Honor становится в один ряд с Google и Samsung, значительно превосходя Xiaomi. Фото Honor Столь длительная программная поддержка, согласно заявлению компании, «гарантирует, что пользователи...