- Это будет самая дорогая Lada Niva 2025.... (3346)
- The Sims и The Sims 2 вернулись из небытия с... (3135)
- ИИ-модели OpenAI и суперкомпьютер Venado... (3214)
- У Intel получается всё хуже. Компания... (2778)
- Стартап Hestus привлёк $1,5 млн на... (3317)
- Значительная часть европейских видеокарт... (2844)
- Стартап AscendArc привлёк $4 млн для... (3147)
- Смартфон Minimal Phone с физической... (3074)
- Спутники напрямую свяжутся со смартфонами в... (3016)
- iPhone — это почти половина всего мирового... (3205)
- Китайцы добыли кислород и ракетное топливо в... (2841)
- Вот и всё, ребята: мультяшный файтинг... (2911)
- Российский суд запретил Google пытаться... (2832)
- Технология ИИ-масштабирование видео RTX... (2632)
- Кооперативный хоррор-шутер Killing Floor 3... (3573)
- Asus показала флагманский смартфон с 3,5-мм... (3418)
Искусственный интеллект Microsoft VALL-E может имитировать любой человеческий голос, послушав оригинал всего три секунды
Дата: 2023-01-10 13:37
Компания Microsoft представила искусственный интеллект VALL-E, который способен имитировать любой человеческий голос на основе примера длительностью всего в три секунды. При этом голос имитируется очень достоверно, с сохранением как тембра, так и эмоциональной окраски оригинала.

Сама Microsoft называет VALL-E «языковой моделью нейронного кодека». Разработка опирается на технологии EnCodec. В отличие от других методов преобразования текста в речь, которые зачастую синтезируют речь, манипулируя формами сигналов, разработка Microsoft в основном анализирует, как именно звучит человек, разбивает эту информацию на отдельные «токены» и использует обучающие данные, чтобы сопоставить то, что он «знает» о том, как этот голос будет звучать, если ИИ произнесет другие фразы.

VALL-E обучали на библиотеке LibriLight, содержащей 60 000 часов англоязычной речи от более чем 7000 человек.
Google показала свой ИИ Duplex, который тоже может говорить практически неотличимо от человека, ещё в 2018 году, но суть разработки Microsoft не в самом ИИ, а именно в его обучаемости имитировать разные голоса.
На сайте проекта есть множество примеров работы ИИ, с которыми может ознакомиться любой желающий.
Подробнее на iXBT
Предыдущие новости
Google начнёт платить авторам коротких роликов YouTube Shorts с февраля
Компания Google раскрыла точные сроки запуска новой политики в отношении авторов коротких роликов YouTube Shorts. На официальном канале YouTube Creators объявлено, что новый контракт партнерской программы YouTube вступит в силу на этой неделе. Принятие нового соглашения требуется от всех авторов, получающих деньги в рамках партнерской программы, и должно быть подписано до...
Представлен очень доступный монитор с USB-C, RJ45, HDMI и USB-A и колонками. Unnocn 24C1F предлагают за 100 долларов в Китае
В Китае представлен недорогой монитор Unnocn 24C1F, который получил целый ряд портов, включая RJ-45. Монитор Unnocn 24C1F оснащен 23,8-дюймовой панелью IPS разрешением 1080p с частотой обновления 75 Гц. Яркостью панели достигает 300 кд/м2, контрастность составляет 1000:1, глубина цвета равна 8 бит. Экран охватывает 99% цветового пространства sRGB, 90% цветовой гаммы Adobe RGB...
Microsoft хочет инвестировать $10 млрд в разработчика ИИ-бота ChatGPT
Microsoft вступила в переговоры об инвестировании $10 млрд в разработавшую ИИ-бота ChatGPT и других ИИ-технологий компанию OpenAI, в результате чего стоимость последней вырастет до $29 млрд. Об этом сообщил ресурс Semafor. Источник изображения: efes /...
Volkswagen отзовёт больше тысячи электромобилей ID.4 из-за дефекта кабеля 12-вольтового аккумулятора
Не каждый обыватель в курсе, что электромобили используют не только тяговую литиевую батарею с высоковольтной сетью питания, но и традиционный аккумулятор с напряжением 12 В — нередко свинцово-кислотного типа. Партия электромобилей Volkswagen ID.4 пострадала от некачественного монтажа одного из питающих кабелей, и теперь подлежит отзыву для устранения дефекта, связанного...