- 10 моделей смартфонов Samsung будут... (2561)
- Супербатарейки будущего для электромобилей... (2924)
- Корни Toyota Hilux и Land Cruiser Prado,... (3191)
- Корни Toyota Hilux и Land Cruiser Prado,... (2719)
- Европа заказала разработку грузовика для... (2737)
- Россиянам продавали наушники по завышенным... (2342)
- Одни из самых надёжных внедорожников в мире.... (2661)
- Asus оценила самую мощную GeForce RTX 5090 в... (2455)
- Заявленная мощность мотора Lada Aura — 122... (2512)
- «Клубной сервис» раскритиковал... (2517)
- Метеозависимым не позавидуешь: с 31 января... (2194)
- Замена Toyota Corolla от Volkswagen резко... (2460)
- В Steam стартовало тестирование... (2460)
- Космический гигант Eutelsat берёт курс на... (2597)
- Российский кроссовер размером с Geely... (2035)
- Космический телескоп «Хаббл» помог... (2067)
Искусственный интеллект Microsoft VALL-E может имитировать любой человеческий голос, послушав оригинал всего три секунды
Дата: 2023-01-10 13:37
Компания Microsoft представила искусственный интеллект VALL-E, который способен имитировать любой человеческий голос на основе примера длительностью всего в три секунды. При этом голос имитируется очень достоверно, с сохранением как тембра, так и эмоциональной окраски оригинала.

Сама Microsoft называет VALL-E «языковой моделью нейронного кодека». Разработка опирается на технологии EnCodec. В отличие от других методов преобразования текста в речь, которые зачастую синтезируют речь, манипулируя формами сигналов, разработка Microsoft в основном анализирует, как именно звучит человек, разбивает эту информацию на отдельные «токены» и использует обучающие данные, чтобы сопоставить то, что он «знает» о том, как этот голос будет звучать, если ИИ произнесет другие фразы.

VALL-E обучали на библиотеке LibriLight, содержащей 60 000 часов англоязычной речи от более чем 7000 человек.
Google показала свой ИИ Duplex, который тоже может говорить практически неотличимо от человека, ещё в 2018 году, но суть разработки Microsoft не в самом ИИ, а именно в его обучаемости имитировать разные голоса.
На сайте проекта есть множество примеров работы ИИ, с которыми может ознакомиться любой желающий.
Подробнее на iXBT
Предыдущие новости
Google начнёт платить авторам коротких роликов YouTube Shorts с февраля
Компания Google раскрыла точные сроки запуска новой политики в отношении авторов коротких роликов YouTube Shorts. На официальном канале YouTube Creators объявлено, что новый контракт партнерской программы YouTube вступит в силу на этой неделе. Принятие нового соглашения требуется от всех авторов, получающих деньги в рамках партнерской программы, и должно быть подписано до...
Представлен очень доступный монитор с USB-C, RJ45, HDMI и USB-A и колонками. Unnocn 24C1F предлагают за 100 долларов в Китае
В Китае представлен недорогой монитор Unnocn 24C1F, который получил целый ряд портов, включая RJ-45. Монитор Unnocn 24C1F оснащен 23,8-дюймовой панелью IPS разрешением 1080p с частотой обновления 75 Гц. Яркостью панели достигает 300 кд/м2, контрастность составляет 1000:1, глубина цвета равна 8 бит. Экран охватывает 99% цветового пространства sRGB, 90% цветовой гаммы Adobe RGB...
Microsoft хочет инвестировать $10 млрд в разработчика ИИ-бота ChatGPT
Microsoft вступила в переговоры об инвестировании $10 млрд в разработавшую ИИ-бота ChatGPT и других ИИ-технологий компанию OpenAI, в результате чего стоимость последней вырастет до $29 млрд. Об этом сообщил ресурс Semafor. Источник изображения: efes /...
Volkswagen отзовёт больше тысячи электромобилей ID.4 из-за дефекта кабеля 12-вольтового аккумулятора
Не каждый обыватель в курсе, что электромобили используют не только тяговую литиевую батарею с высоковольтной сетью питания, но и традиционный аккумулятор с напряжением 12 В — нередко свинцово-кислотного типа. Партия электромобилей Volkswagen ID.4 пострадала от некачественного монтажа одного из питающих кабелей, и теперь подлежит отзыву для устранения дефекта, связанного...