- Учёные научили органическое стекло... (874)
- Физики впервые засняли «промежуточную» фазу... (938)
- Администрация США планирует ускорить... (702)
- AMD идёт по стопам Nvidia. HPE стала первым... (723)
- Межзвёздная комета 3I/ATLAS оказалась... (702)
- Владелец Chery Tiggo 4 обанкротил дилерский... (662)
- Других таких блоков питания в мире нет. Lian... (796)
- Учёные изобрели тактильный дисплей, который... (716)
- Экстремальный Tank 300 Polar Edition... (779)
- Американская компания Vantor опубликовала... (717)
- «Пузыря не будет»: глава AMD уверена, что... (696)
- Конкурент Monjaro с 2,0-литровым мотором,... (772)
- Это монитор с Mini-LED, HDR1400,... (706)
- Бывший партнёр Илона Маска берётся за... (694)
- Глобальный Honor Magic8 Pro существенно... (660)
- Быстрый монитор за 355 долларов. KTC... (770)
OpenAI устранила уязвимости безопасности в голосовом режиме ChatGPT
Дата: 2024-08-10 23:19
Компания OpenAI опубликовала отчёт о функциях безопасности GPT-4o, базовой модели, на которой основана последняя версия ChatGPT с голосовым режимом. В документе рассматриваются известные проблемы, возникающие при использовании модели, и описываются меры по их устранению.
Голосовой режим ChatGPT, доступный для избранной группы пользователей с подпиской ChatGPT Plus, имеет некоторые уязвимости безопасности. Среди них — стандартные риски, такие как подсказки модели с эротическими, жестокими или другими запрещёнными ответами, а также «необоснованные выводы» и «атрибуция чувствительных тем», которые могут быть дискриминационными или предвзятыми.
OpenAI заявляет, что обучила модель блокировать любые выходные данные, отмеченные в этих категориях.
Однако, в отчёте также говорится, что смягчения не включают «невербальные вокализации или другие звуковые эффекты», такие как эротические стоны, яростные крики и выстрелы. Таким образом, подсказки, включающие определённые чувствительные невербальные звуки, всё ещё могут быть получены в ответах.
Источник: Ismail Aslandag / Anadolu / Getty Images Дополнительные аспекты модели включают возможность вынудить GPT-4o выдавать себя за кого-то или имитировать голос пользователя. Чтобы бороться с этим, OpenAI допускает только предварительно авторизованные голоса. GPT-4o также может идентифицировать другие голоса, помимо голоса говорящего, что представляет собой проблему конфиденциальности. Но она была обучена отклонять эти запросы.
Члены команды также отметили, что GPT-4o можно заставить говорить убедительно или настойчиво, что может быть более вредно, чем текстовые сообщения, когда речь идёт о дезинформации и теориях заговора.
OpenAI также решила потенциальные проблемы с авторскими правами, которые мешали компании и общей разработке генеративного ИИ. GPT-4o обучен отклонять запросы на контент, защищённый авторским правом, и имеет дополнительные фильтры для блокировки выходных данных, содержащих музыку. В связи с этим, голосовому режиму ChatGPT было предписано «не петь ни при каких обстоятельствах».
Многочисленные меры по снижению рисков OpenAI, описанные в длинном документе, были реализованы до выпуска Voice Mode. Поэтому в отчёте говорится, что хотя GPT-4o способен на определённое некорректное поведение, «он этого не сделает».
Однако, OpenAI утверждает, что эти оценки измеряют только базовые знания моделей и не измеряют их полезность в реальных рабочих процессах. GPT-4o был протестирован в контролируемой среде, но когда более широкая общественность получит доступ, он может оказаться совсем другим в условиях широкого использования.
Подробнее на iXBT
Предыдущие новости
Стэнфордские исследователи успешно протестировали первую в истории автономную систему навигации роя спутников
Команда исследователей из Лаборатории космических сближений Стэнфордского университета совершила прорыв в области распределённой автономности в космосе, успешно проведя первое испытание на орбите прототипа системы, способной управлять роем спутников, используя только визуальную информацию, передаваемую по беспроводной сети. Тест Starling Formation-Flying Optical Experiment...
Новая статья: Gamesblender № 686: новый след Half-Life 3, ремейк «Готики» и российская консоль на «Эльбрусе»
С вами GamesBlender, еженедельный видеодайджест новостей игровой индустрии от 3DNews.ru. В этом выпуске расскажем, что показала на своей презентации THQ Nordic, чем удивит тактический шутер Spectre Divide от ветеранов жанра и какие игры предложат запускать на российской...
«Охотник за астероидами» NEOWISE завершил миссию и вскоре сгорит в атмосфере
Космический инфракрасный телескоп NEOWISE (Near-Earth Object Wide-field Infrared Survey Explorer) NASA завершил работу на орбите в рамках длившейся более 10 лет миссии по планетарной обороне, включавшей поиск и изучение астероидов и комет, в том числе тех, которые могут представлять угрозу для Земли. В минувший четверг специалисты NASA перевели космический аппарат в...
Новый стартап ProRata обещает покончить с массовым плагиатом генеративных моделей ИИ
Технологический предприниматель Билл Гросс представил свой новый стартап ProRata, который, по его словам, способен решить проблему массового плагиата, связанного с генеративными моделями ИИ. Компания уже привлекла $25 млн инвестиций и сотрудничает с крупными медиакомпаниями, включая Universal Music Group, The Atlantic, The Financial Times и Axel Springer. Гросс утверждает, что...