- Под руководством Лип-Бу Тана компания Intel... (2070)
- Новая статья: Heroes of Might and Magic:... (2086)
- «Джеймс Уэбб» показал галактику «Кальмар» с... (2039)
- Война на Ближнем Востоке усугубила дефицит... (2071)
- Война на Ближнем Востоке усугубил дефицит... (3189)
- Учёные предложили квантовый процессор с... (2138)
- Anthropic отучила свой ИИ шантажировать... (1566)
- Разработчик технологии квантовых точек для... (1722)
- Microsoft улучшила работу Windows 11 с... (1736)
- В США расследуют аварии с участием роботакси... (1445)
- Пользователей I*******m лишили сквозного... (1606)
- В «Play Маркете» всплыла группа... (1517)
- Жители США бунтуют против дата-центров —... (1432)
- Китайцы научились из отходов и сточных... (1566)
- Sony призналась, что ещё не решила, когда и... (1400)
- Lian Li выпустила СЖО с 6,67-дюймовым... (1493)
OpenAI раскрыла причину ошибок ChatGPT. Но экономика мешает их исправлению
Дата: 2025-09-16 15:45
Компания OpenAI опубликовала работу, в которой объяснила, почему даже самые мощные модели искусственного интеллекта, такие как ChatGPT, часто дают неверные ответы, «галлюцинируя». Авторы работы установили, что существующие методы оценки качества работы больших языковых моделей (LLM) поощряют «угадывание» вместо точного ответа. Проще говоря, создатели ИИ стимулируют модели догадываться, а не признавать своё незнание. Это может быть эффективной стратегией на экзамене, но крайне опасно при ответах на сложные вопросы, например, в медицине или юриспруденции.
OpenAI предложила решение: изменить систему оценки, начисляя больше штрафных баллов за уверенные, но неверные ответы и частично оценивая ответы, демонстрирующие неопределённость. Однако, как предупреждает эксперт по оптимизации ИИ Вэй Синг из Шеффилдского университета в своей статье для The Conversation, такой подход может быть экономически невыгоден.
Изменение системы оценки приведёт к значительному увеличению вычислительных затрат. Модели должны будут оценивать множество возможных ответов и рассчитывать уровни уверенности, что для систем, обрабатывающих миллионы запросов ежедневно, означает резкое повышение операционных расходов. Это особенно критично сейчас, когда компании вкладывают десятки миллиардов долларов в инфраструктуру для работы всё более ресурсоёмких моделей, а окупаемость инвестиций пока отстоит на многие годы, если не десятилетия.
Иллюстрация: Sora Более того, постоянные заявления ИИ о неуверенности могут отпугнуть пользователей, привыкших к уверенным ответам, даже если они неверны. Синг утверждает, что даже если ChatGPT будет признавать своё незнание в 30% случаев, пользователи могут быстро разочароваться и перейти к другим системам.
Синг отмечает, что предложенные OpenAI исправления могут подойти для ИИ-систем, управляющих критическими бизнес-процессами или экономической инфраструктурой, где стоимость ошибок намного выше, чем затраты на оценку уровня неопределённости. Однако, приоритет в разработке ИИ по-прежнему отдаётся потребительским приложениям, где пользователи хотят получать уверенные ответы на любые вопросы. Более быстрый, но неопределённый ответ обходится компаниям дешевле, что может препятствовать переходу к более тщательному и уверенному подходу с меньшим количеством «галлюцинаций».
В долгосрочной перспективе ситуация неясна, поскольку рыночные силы продолжают меняться, и компании находят всё более эффективные способы работы своих моделей ИИ. Однако, по мнению Синга, «угадывание» останется более экономичным вариантом. Он подытожил: статья OpenAI, помимо прочего, высветила неудобную правду: экономические стимулы, движущие разработкой потребительского ИИ, остаются фундаментально несогласованными с задачей уменьшения «галлюцинаций». Пока эти стимулы не изменятся, «галлюцинации» будут сохраняться.
Подробнее на iXBT
Предыдущие новости
Samsung объявила большой список устройств Galaxy, которые получат OneUI 8 до конца года
На этой неделе компания Samsung объявила о запуске новой версии пользовательского интерфейса OneUI 8 для мобильных устройств семейства Galaxy, основой которого стала операционная система Android 16. Первыми обновление получили смартфоны серии Galaxy S25. Теперь же Samsung опубликовала список устройств, которые получат OneUI 8 до конца нынешнего года. Источник изображения:...
Не хватает аккумуляторов: Nissan сокращает план выпуска нового Leaf
Nissan сократила план производства новой модели электромобиля Leaf более чем наполовину на сентябрь-ноябрь из-за задержек с поставками аккумуляторов. Nikkei сообщил, что причиной стал более низкий, чем ожидалось, объем производства аккумуляторов на дочернем предприятии Nissan, добавив, что японский автопроизводитель планирует выпустить новую модель электромобиля к концу года. ...
Российский Solaris HS сняли с производства, возвращать модель на конвейер не планируют
Завод АГР в Санкт-Петербурге снял с производства седан Solaris HS, который является копией популярной корейской модели Hyundai Solaris), как и утверждали слухи. Об этом сообщает «Автостат» со ссылкой на свои источники в сбытовой сети АГР, при этом возвращать Solaris HS на конвейер не планируют. Фото Solaris Ранее сообщалось, что в автосалонах Санкт-Петербурга практически не...
7000 мАч, IP69, экран 1,5К 144 Гц и три 50-мегапиксельные камеры — 280 долларов. Представлен Realme 15 Pro
Realme сегодня представила смартфон Realme 15 Pro. Новинка построена на однокристальной системе Qualcomm Snapdragon 7 Gen 4 и уже в базовой версии имеет 12 ГБ ОЗУ и 256 ГБ флеш-памяти. Цена такого варианта — 280 долларов. Стоимость версии 16/512 ГБ — 380 долларов. Фото: Realme Смартфон оснащен экраном с диагональю 6,8 дюйма, разрешением 1,5К и кадровой частотой 144 Гц,...