- Новый ИИ-помощник Adobe может использовать... (116)
- Призыв существ, талисманы и новое эпическое... (244)
- Google выпустила приложение Gemini для... (107)
- Китайские учёные совершили рывок в... (341)
- Хоррор-шутер Industria 2 перенесли на 29... (134)
- Поездка затягивается: уютный симулятор... (134)
- Keychron представила беспроводную игровую... (131)
- «Вложу всю свою страсть, энергию и душу»:... (239)
- Аналитики уверены, что Apple не будет... (237)
- Snap объявила о сокращении 1000 человек... (156)
- Китайский робот Unitree R1 появился на... (157)
- Intel рассказала, каким должен быть игровой... (159)
- Компания Science бывшего президента... (157)
- Нет худа без добра: украденные хакерами... (352)
- Еврокомиссия сочла плату WhatsApp за доступ... (227)
- Microsoft получит 30 тыс. ИИ-ускорителей... (209)
Галлюцинации ИИ: новая модель OpenAI GPT-4.5 ошибается в 37% ответов
Дата: 2025-03-02 22:25
Компания OpenAI подтвердила, что её новая языковая модель GPT-4.5 генерирует недостоверные ответы в 37% случаев, согласно внутреннему инструменту оценки фактологичности SimpleQA. Эти данные, озвученные в официальном релизе, вызвали дискуссию о надёжности современных алгоритмов ИИ.
Несмотря на заявления о прогрессе — предыдущие версии GPT-4o и o3-mini демонстрировали 61,8% и 80,3% галлюцинаций соответственно, — эксперты подчёркивают, что даже «лучшие модели» остаются неточными.
Фото: David Paul Morris / Bloomberg «Сейчас даже самые продвинутые системы способны генерировать текст без вымысла лишь в 35% случаев», — заявила Вентинг Чжао, соавтор исследования о галлюцинациях ИИ из Корнеллского университета. Её комментарий подтверждает системную проблему отрасли: дорогостоящие модели, позиционируемые как инструменты с «человекообразным интеллектом», часто ошибаются в базовых фактах.
OpenAI, оцениваемая в сотни миллиардов долларов, пытается смягчить реакцию, акцентируя внимание на снижении ошибок по сравнению с прошлыми версиями. Однако критики отмечают, что подобные сравнения лишь маскируют стагнацию в развитии технологий. После впечатляющего старта ChatGPT компания столкнулась с замедлением прогресса, и GPT-4.5, судя по данным, не стал прорывом.
Эксперты сходятся во мнении: для преодоления кризиса доверия индустрии необходимы фундаментальные улучшения, а не косметические апдейты. Пока же пользователи вынуждены мириться с тем, что нейросети регулярно «придумывают» факты — будь то ответ на простой вопрос или анализ сложных данных.
Подробнее на iXBT
Предыдущие новости
Xiaomi представила электросамокат Electric Scooter 5 Max — 1000-ваттный мотор и запас хода в 60 км
Китайская компания Xiaomi анонсировала новый самокат на электрической тяге Electric Scooter 5 Max, который призван «переосмыслить городские поездки благодаря обновлённой системе передней двойной гидравлической и задней двойной пружинной подвеске». Такая система подвески обеспечит более плавный ход, снизит нагрузку на ноги и руки, а также в целом повысит комфорт в процессе...
Американский стартап Last Energy анонсировал строительство 30 микрореакторов в Техасе для энергоснабжения дата-центров
Американский разработчик Last Energy объявил о планах построить 30 микрореакторов на северо-западе Техаса для энергоснабжения дата-центров штата. Проект, анонсированный 28 февраля, предусматривает размещение установок на участке площадью 80 га в округе Хаскелл к западу от Далласа. Энергия будет поставляться потребителям через комбинацию частных линий и общей сети после...
Немецкий стартап Polaris получил контракт на гиперзвуковой космоплан Aurora с аэроспайк-двигателем
Немецкие вооружённые силы заключили контракт с бременским стартапом Polaris на создание многоразового гиперзвукового космоплана Aurora. Проект, реализацию которого планируют завершить за три года, направлен на разработку аппарата длиной 28 метров, сочетающего черты ракеты и самолёта. Космоплан сможет взлетать и садиться на обычную взлётно-посадочную полосу, а также выводить до...
Honor становится в один ряд с Google и Samung: компания будет обновлять свои смартфоны в течение 7 лет
Сегодня, накануне открытия выставки MWC 2025, Honor сообщила о расширении срока программной поддержки своих смартфонов — он составит 7 лет. То есть по длительности программной поддержки Honor становится в один ряд с Google и Samsung, значительно превосходя Xiaomi. Фото Honor Столь длительная программная поддержка, согласно заявлению компании, «гарантирует, что пользователи...