Добро пожаловать на форум PHP программистов!
За последние 24 часа нас посетили 222564 программиста и 2172 робота. Сейчас ищут 1665 программистов ...
Последние
Популярные

OpenAI раскрыла причину ошибок ChatGPT. Но экономика мешает их исправлению

Дата: сегодня 15:45

Компания OpenAI опубликовала работу, в которой объяснила, почему даже самые мощные модели искусственного интеллекта, такие как ChatGPT, часто дают неверные ответы, «галлюцинируя». Авторы работы установили, что существующие методы оценки качества работы больших языковых моделей (LLM) поощряют «угадывание» вместо точного ответа. Проще говоря, создатели ИИ стимулируют модели догадываться, а не признавать своё незнание. Это может быть эффективной стратегией на экзамене, но крайне опасно при ответах на сложные вопросы, например, в медицине или юриспруденции.

OpenAI предложила решение: изменить систему оценки, начисляя больше штрафных баллов за уверенные, но неверные ответы и частично оценивая ответы, демонстрирующие неопределённость. Однако, как предупреждает эксперт по оптимизации ИИ Вэй Синг из Шеффилдского университета в своей статье для The Conversation, такой подход может быть экономически невыгоден.

Изменение системы оценки приведёт к значительному увеличению вычислительных затрат. Модели должны будут оценивать множество возможных ответов и рассчитывать уровни уверенности, что для систем, обрабатывающих миллионы запросов ежедневно, означает резкое повышение операционных расходов. Это особенно критично сейчас, когда компании вкладывают десятки миллиардов долларов в инфраструктуру для работы всё более ресурсоёмких моделей, а окупаемость инвестиций пока отстоит на многие годы, если не десятилетия.

Иллюстрация: Sora

Более того, постоянные заявления ИИ о неуверенности могут отпугнуть пользователей, привыкших к уверенным ответам, даже если они неверны. Синг утверждает, что даже если ChatGPT будет признавать своё незнание в 30% случаев, пользователи могут быстро разочароваться и перейти к другим системам.

Синг отмечает, что предложенные OpenAI исправления могут подойти для ИИ-систем, управляющих критическими бизнес-процессами или экономической инфраструктурой, где стоимость ошибок намного выше, чем затраты на оценку уровня неопределённости. Однако, приоритет в разработке ИИ по-прежнему отдаётся потребительским приложениям, где пользователи хотят получать уверенные ответы на любые вопросы. Более быстрый, но неопределённый ответ обходится компаниям дешевле, что может препятствовать переходу к более тщательному и уверенному подходу с меньшим количеством «галлюцинаций».

В долгосрочной перспективе ситуация неясна, поскольку рыночные силы продолжают меняться, и компании находят всё более эффективные способы работы своих моделей ИИ. Однако, по мнению Синга, «угадывание» останется более экономичным вариантом. Он подытожил: статья OpenAI, помимо прочего, высветила неудобную правду: экономические стимулы, движущие разработкой потребительского ИИ, остаются фундаментально несогласованными с задачей уменьшения «галлюцинаций». Пока эти стимулы не изменятся, «галлюцинации» будут сохраняться.



Подробнее на iXBT
 

Предыдущие новости

3Dnews.ru, сегодня 16:01
Samsung объявила большой список устройств Galaxy, которые получат OneUI 8 до конца года

На этой неделе компания Samsung объявила о запуске новой версии пользовательского интерфейса OneUI 8 для мобильных устройств семейства Galaxy, основой которого стала операционная система Android 16. Первыми обновление получили смартфоны серии Galaxy S25. Теперь же Samsung опубликовала список устройств, которые получат OneUI 8 до конца нынешнего года. Источник изображения:...

iXBT, сегодня 15:00
Не хватает аккумуляторов: Nissan сокращает план выпуска нового Leaf

Nissan сократила план производства новой модели электромобиля Leaf более чем наполовину на сентябрь-ноябрь из-за задержек с поставками аккумуляторов. Nikkei сообщил, что причиной стал более низкий, чем ожидалось, объем производства аккумуляторов на дочернем предприятии Nissan, добавив, что японский автопроизводитель планирует выпустить новую модель электромобиля к концу года. ...

iXBT, сегодня 15:06
Российский Solaris HS сняли с производства, возвращать модель на конвейер не планируют

Завод АГР в Санкт-Петербурге снял с производства седан Solaris HS, который является копией популярной корейской модели Hyundai Solaris), как и утверждали слухи. Об этом сообщает «Автостат» со ссылкой на свои источники в сбытовой сети АГР, при этом возвращать Solaris HS на конвейер не планируют. Фото Solaris Ранее сообщалось, что в автосалонах Санкт-Петербурга практически не...

iXBT, сегодня 15:12
7000 мАч, IP69, экран 1,5К 144 Гц и три 50-мегапиксельные камеры — 280 долларов. Представлен Realme 15 Pro

Realme сегодня представила смартфон Realme 15 Pro. Новинка построена на однокристальной системе Qualcomm Snapdragon 7 Gen 4 и уже в базовой версии имеет 12 ГБ ОЗУ и 256 ГБ флеш-памяти. Цена такого варианта — 280 долларов. Стоимость версии 16/512 ГБ — 380 долларов. Фото: Realme Смартфон оснащен экраном с диагональю 6,8 дюйма, разрешением 1,5К и кадровой частотой 144 Гц,...

© 2025 «PHP.RU — Сообщество PHP-Программистов»
Главная | Форум | Реклама на сайте | Контакты VIP Сувениры
Разработка компании ODware