- Евросоюз запустил антимонопольное... (567)
- Можно установить DDR5, а можно и DDR4,... (807)
- 27-летнюю 3dfx Voodoo2 запустили вместе с... (704)
- ИИ поместили в виртуальную клетку и убрали... (544)
- «Никто не хотел его покупать, кроме Илона».... (490)
- ИИ-компании заплатят «Википедии», чтобы она... (724)
- Примерно уровень мобильной GeForce GTX 1050... (526)
- iPhone 17e будет в несколько раз менее... (535)
- В Rutube утроилось количество просмотров за... (785)
- Полный привод, шесть режимов движения,... (686)
- Китай опять опередил весь мир: представлена... (737)
- 7000 мАч и 144 Гц при цене всего 180... (479)
- Китайская Cambricon утроит выпуск... (651)
- Бесшовный мультиплеер, новое мастерство и... (567)
- «Новых чипов не поступало с октября»:... (631)
- Не такой уж и доступный: названа цена... (603)
Галлюцинации ИИ: новая модель OpenAI GPT-4.5 ошибается в 37% ответов
Дата: 2025-03-02 22:25
Компания OpenAI подтвердила, что её новая языковая модель GPT-4.5 генерирует недостоверные ответы в 37% случаев, согласно внутреннему инструменту оценки фактологичности SimpleQA. Эти данные, озвученные в официальном релизе, вызвали дискуссию о надёжности современных алгоритмов ИИ.
Несмотря на заявления о прогрессе — предыдущие версии GPT-4o и o3-mini демонстрировали 61,8% и 80,3% галлюцинаций соответственно, — эксперты подчёркивают, что даже «лучшие модели» остаются неточными.
Фото: David Paul Morris / Bloomberg «Сейчас даже самые продвинутые системы способны генерировать текст без вымысла лишь в 35% случаев», — заявила Вентинг Чжао, соавтор исследования о галлюцинациях ИИ из Корнеллского университета. Её комментарий подтверждает системную проблему отрасли: дорогостоящие модели, позиционируемые как инструменты с «человекообразным интеллектом», часто ошибаются в базовых фактах.
OpenAI, оцениваемая в сотни миллиардов долларов, пытается смягчить реакцию, акцентируя внимание на снижении ошибок по сравнению с прошлыми версиями. Однако критики отмечают, что подобные сравнения лишь маскируют стагнацию в развитии технологий. После впечатляющего старта ChatGPT компания столкнулась с замедлением прогресса, и GPT-4.5, судя по данным, не стал прорывом.
Эксперты сходятся во мнении: для преодоления кризиса доверия индустрии необходимы фундаментальные улучшения, а не косметические апдейты. Пока же пользователи вынуждены мириться с тем, что нейросети регулярно «придумывают» факты — будь то ответ на простой вопрос или анализ сложных данных.
Подробнее на iXBT
Предыдущие новости
Xiaomi представила электросамокат Electric Scooter 5 Max — 1000-ваттный мотор и запас хода в 60 км
Китайская компания Xiaomi анонсировала новый самокат на электрической тяге Electric Scooter 5 Max, который призван «переосмыслить городские поездки благодаря обновлённой системе передней двойной гидравлической и задней двойной пружинной подвеске». Такая система подвески обеспечит более плавный ход, снизит нагрузку на ноги и руки, а также в целом повысит комфорт в процессе...
Американский стартап Last Energy анонсировал строительство 30 микрореакторов в Техасе для энергоснабжения дата-центров
Американский разработчик Last Energy объявил о планах построить 30 микрореакторов на северо-западе Техаса для энергоснабжения дата-центров штата. Проект, анонсированный 28 февраля, предусматривает размещение установок на участке площадью 80 га в округе Хаскелл к западу от Далласа. Энергия будет поставляться потребителям через комбинацию частных линий и общей сети после...
Немецкий стартап Polaris получил контракт на гиперзвуковой космоплан Aurora с аэроспайк-двигателем
Немецкие вооружённые силы заключили контракт с бременским стартапом Polaris на создание многоразового гиперзвукового космоплана Aurora. Проект, реализацию которого планируют завершить за три года, направлен на разработку аппарата длиной 28 метров, сочетающего черты ракеты и самолёта. Космоплан сможет взлетать и садиться на обычную взлётно-посадочную полосу, а также выводить до...
Honor становится в один ряд с Google и Samung: компания будет обновлять свои смартфоны в течение 7 лет
Сегодня, накануне открытия выставки MWC 2025, Honor сообщила о расширении срока программной поддержки своих смартфонов — он составит 7 лет. То есть по длительности программной поддержки Honor становится в один ряд с Google и Samsung, значительно превосходя Xiaomi. Фото Honor Столь длительная программная поддержка, согласно заявлению компании, «гарантирует, что пользователи...