- Усиленные лонжероны, амортизаторы, пружины и... (984)
- Volkswagen Jetta возвращается в Россию как... (1535)
- Несмотря на риск землетрясений,... (2270)
- OpenAI блокирует аккаунты из Китая и... (541)
- Microsoft обучила ИИ Muse генерировать... (576)
- Федеральные служащие США могут остаться без... (1327)
- Xiaomi готовит бюджетный суперфлагман: Redmi... (1363)
- Китай запустил ChinaSat-10R: новый спутник... (2224)
- «Параллельный» Toyota RAV4 оказался дешевле... (636)
- Электромобили смогут отдавать энергию в... (619)
- Национальная ассоциация производителей... (634)
- «Прогрессу МС-30» провели авторский осмотр и... (316)
- Эксперты выявили критические уязвимости в... (513)
- Apple сокращает производство не только в... (426)
- Экс-директор OpenAI Мира Мурати создаёт... (397)
- SanDisk представила 3D Matrix Memory: новая... (502)
OpenAI представила инструмент, полноценно клонирующий голос: Voice Engine достаточно 15-секундного семпла
Дата: 2024-03-31 11:07
OpenAI объявила о запуске нового инструмента под названием Voice Engine. Это технология клонирования голоса, которая позволяет имитировать речь любого человека после анализа 15-секундного аудиосэмпла. Компания заявляет, что Voice Engine генерирует «естественно звучащую речь» с «эмоциональными и реалистичными голосами».

Основой для этой технологии послужило уже существующее API преобразования текста в речь, которое OpenAI разрабатывает с 2022 года. Компания уже использует этот инструмент для поддержки голосов, доступных в текущей версии API преобразования текста в речь, а также для функции чтения вслух. В официальном блоге компании можно найти множество примеров, которые звучат очень близко к реальным голосам.
OpenAI считает, что Voice Engine может быть полезным инструментом для чтения, языкового перевода и помощи людям с речевыми нарушениями. В рамках пилотного проекта совместно с Браунским Университетом компания использовала Voice Engine для помощи пациенту с проблемами речи, создав клон его голоса на основе аудиозаписей, сделанных для школьного проекта.
Тем не менее, возникают опасения относительно возможного злоупотребления этой технологией злоумышленниками. Поэтому Voice Engine пока не готов к запуску в широком масштабе, так как остаются вопросы конфиденциальности, которые требуется решить.
OpenAI признаёт, что эта технология несёт серьёзные риски, особенно в год выборов. Компания принимает обратную связь от «американских и международных партнёров, включая правительство, СМИ, сферу развлечений, образования и гражданское общество», чтобы минимизировать риски при запуске продукта. Все тестировщики прототипа согласились с политикой использования OpenAI, которая запрещает использование голоса без согласия или законного права.
Кроме того, пользователи этой технологии должны уведомлять свою аудиторию о том, что голоса генерируются искусственным интеллектом. OpenAI принимает меры безопасности, включая отслеживание происхождения звука и «превентивный мониторинг» для предотвращения нежелательного использования системы. После официального запуска Voice Engine будет представлен «список запрещённых голосов», он будет предотвращать появление голосов, созданных искусственным интеллектом, которые слишком похожи на голоса известных личностей.
Пока OpenAI не сообщает о точной дате запуска этой технологии. Из некоторых данных о ценах можно предположить, что Voice Engine может быть более доступным вариантом по сравнению с конкурирующими продуктами, такими как ElevenLabs. Voice Engine может стоить $15 долларов за миллион «символов», что составляет около 162 500 слов. Это примерно равно продолжительности книги «Сияние» Стивена Кинга. В маркетинговых материалах упоминается также версия HD, стоимость которой в два раза выше, хотя компания не уточнила, в чем заключается её преимущество.
На этой неделе OpenAI также заключила партнёрство с Microsoft для создания суперкомпьютера на базе искусственного интеллекта под названием «Звёздные врата». Проект стоит $100 миллиардов.
Подробнее на iXBT
Предыдущие новости
Япония и Евросоюз углубят сотрудничество в сфере разработки передовых материалов
Альтернативная энергетика, высокопроизводительные вычисления и электротранспорт — все эти сферы деятельности для сохранения своего прогресса нуждаются в новых материалах. Власти Евросоюза намерены найти взаимовыгодные точки соприкосновения с Японией в сфере материаловедения, и предлагают создать условия для сотрудничества в сфере профильных исследований между двумя...
Эксперимент 100-летней давности повторили на квантовом уровне, что впустит квантовые явления в наш мир
Науке давно известен туннельный эффект, когда частицы преодолевают энергетический барьер, не имея для этого энергетических оснований. Это явление из квантового мира, которое нашло широкое применение в электронике. Теперь учёные расширили возможности туннелирования до группового поведения частиц, что стало повторением опыта 100-летней давности на квантовом уровне....
AT&T подтвердила утечку данных 73 млн клиентов
Один из крупнейших американских операторов связи AT&T подтвердил утечку данных своих абонентов, хотя в течение нескольких недель отрицал этот факт. Пусть оператор и продолжает утверждать, что нет никаких свидетельств взлома его систем, теперь он раскрыл, что утёкшие данные принадлежат 73 млн его нынешних и бывших клиентов. Источник изображения:...
Игры с маркировкой «PS5 Pro Enhanced» предложат стабильные 60 FPS, увеличенное разрешение или улучшенную трассировку лучей
Компания Sony будет маркировать значком «PS5 Pro Enhanced» игры для будущей игровой приставки PlayStation 5 Pro, которые смогут предложить поддержку повышенной частоты кадров, более высокого разрешения или улучшенную трассировку лучей, сообщили источники журналиста Тома Хендерсона (Tom Henderson) с Insider Gaming. Источник изображения:...