- Скидки до 180 000 рублей и кредит под 0,01%... (71)
- Всё больше людей используют ИИ-чатботы для... (67)
- Повышение цен оправдано? УАЗ снова... (77)
- «Резкий запах бензина», «Блин, они в неё... (76)
- Продажи отечественных телевизоров выросли в... (156)
- Meizu возвращается: анонсированы Meizu Note... (142)
- Huawei анонсировала новую версию... (172)
- Rivian вложит $120 млн в парк поставщиков в... (185)
- Skoda Karoq 2025 поступили в продажу в... (171)
- IBM: миллиард приложений на генеративном ИИ... (168)
- 10 ГБ за 2,5 секунды: новый магнитный SSD... (164)
- Belgee, Solaris, «Москвич», Evolute,... (154)
- Задумка сработала: Belgee, Solaris,... (165)
- Задумка сработала: Belgee, Solaris,... (211)
- Hyundai закупает десятки тысяч... (201)
- Отказ OpenAI от перехода на коммерческие... (189)
OpenAI признала, что облажалась с тестированием «слишком подхалимского и раздражающего» обновления ChatGPT
Дата: сегодня 06:36
Генеральный директор OpenAI Сэм Альтман признал, что последние обновления GPT-4o сделали его «слишком подхалимским и раздражающим», а также объяснил, почему так вышло.
В последних обновлениях OpenAI начала использовать данные с кнопок «палец вверх» и «палец вниз» в ChatGPT в качестве «дополнительного сигнала вознаграждения». Однако OpenAI заявила, что это могло «ослабить влияние нашего основного сигнала вознаграждения, который сдерживал подхалимство». Компания отмечает, что отзывы пользователей «иногда могут благоприятствовать более приятным ответам», вероятно, усугубляя чрезмерно приятные высказывания чат-бота. Компания заявила, что память также может усиливать подхалимство.
OpenAI утверждает, что одна из «ключевых проблем» запуска связана с процессом тестирования. Хотя офлайн-оценки модели и A/B-тестирование дали положительные результаты, некоторые эксперты-тестировщики предположили, что обновление сделало чат-бот «слегка не таким». Несмотря на это, OpenAI все равно продолжила обновление.
_large.png)
Оглядываясь назад, качественные оценки намекали на что-то важное, и нам следовало бы обратить на это более пристальное внимание. Они уловили слепое пятно в наших других оценках и метриках. Наши офлайн-оценки не были достаточно широкими или глубокими, чтобы уловить подхалимское поведение… и наши A/B-тесты не имели правильных сигналов, чтобы показать, как модель работает на этом фронте с достаточной детализацией.
OpenAI
OpenAI заявляет, что собирается «формально рассмотреть поведенческие проблемы» как потенциально способные заблокировать запуски, а также создать новую фазу альфа-тестирования, которая позволит пользователям напрямую давать OpenAI обратную связь перед более широким развертыванием. OpenAI также планирует гарантировать, что пользователи будут знать об изменениях, которые она вносит в ChatGPT, даже если обновление будет небольшим.
На прошлой неделе Сэм Альтман заявил, что компания внесет исправления, чтобы устранить «льстивую и раздражающую» личность чат-бота, проявившуюся после апдейта.
Подробнее на iXBT
Предыдущие новости
Как выбрать ChatGPT под себя, объяснили в OpenAI: названы отличия и лимиты GPT-4o, GPT-4.5, o4-mini, o4-mini-high, o3 и o1-pro
Компания OpenAI опубликовала инструкцию по выбору подходящей модели чат-бота ChatGPT, которая доступна на официальном сайте. Разнообразие моделей, таких как GPT-4o, GPT-4.5, o4-mini, o4-mini-high, o3 и o1-pro, позволяет пользователям подбирать инструмент под конкретные задачи. Модель GPT-4o подходит для повседневных задач, требующих скорости и поддержки разных форматов:...
«После трех полётов в космос мне будет всего 89 лет», — ученый с мировым именем меняет представление о возрастном пределе для космических полетов
Эксперт по проектированию электросетей Ли Личэн подписал контракт с китайской частной коммерческой компанией, осуществляющей пилотируемые космические полеты, забронировав место в космическом туристическом путешествии — в возрасте 84 года. Ли, академик Китайской инженерной академии, забронировал место на первый полет, который запланирован на 2028 год. В заявлении говорится, что...
Быстро вернуться на Луну не получится? Пилотируемый корабль Orion могут запустить на ракете New Glenn вместо Space Launch System (SLS)
Пилотируемый космический корабль Orion, предназначенный для лунных миссий, может быть запущен с помощью тяжелой ракеты New Glenn вместо сверхтяжелой Space Launch System (SLS). По словам вице-президента по исследованию космоса и руководителя программы Orion в корпорации Lockheed Martin Кирк Ширемана (Kirk Shireman), использование Space Launch System с Orion является самым...
До конца следующего года Waymo удвоит количество роботакси и наладит производство минивэнов Zeekr RT
Планы компании Waymo по расширению парка роботизированных такси требуют наращивания профильных производственных мощностей, и в этом ей должно помочь совместное предприятие с Magna International, которое к концу следующего года выпустит ещё 2000 роботакси и выведет на рынок минивэн Zeekr RT до конца этого года. Источник изображения:...