- Возможности Xiaomi 17 Ultra наглядно... (1613)
- Аккумулятор на 9000 мАч с зарядкой 100 Вт и... (2103)
- Индия приближается к пилотируемым полётам:... (1975)
- Starlink снизит орбиты более 4 000... (2117)
- Китай в Совбезе ООН обвинил Starlink в... (2002)
- Гибридные клетки человека и растения... (2491)
- Tesla резко сократила на 99% закупки... (2250)
- «Москвичи» подорожали в России с 1 января... (2319)
- NASA Artemis II: первый пилотируемый полёт к... (1642)
- «Да, атомные электростанции 5090 всё ещё... (1791)
- Да, 7000 мАч и «телевик», но всё-таки уже... (1814)
- Новая статья: Лучшие игры 2025 года: выбор... (1669)
- Норвежская компания готовит к запуску в 2026... (2338)
- Япония готовит миссию MMX к спутникам Марса:... (2526)
- Новый тип ветрогенераторов для питания... (2381)
- США тестируют «заряжающее» шоссе: во Флориде... (2081)
Искусственный интеллект Microsoft VALL-E может имитировать любой человеческий голос, послушав оригинал всего три секунды
Дата: 2023-01-10 13:37
Компания Microsoft представила искусственный интеллект VALL-E, который способен имитировать любой человеческий голос на основе примера длительностью всего в три секунды. При этом голос имитируется очень достоверно, с сохранением как тембра, так и эмоциональной окраски оригинала.
Сама Microsoft называет VALL-E «языковой моделью нейронного кодека». Разработка опирается на технологии EnCodec. В отличие от других методов преобразования текста в речь, которые зачастую синтезируют речь, манипулируя формами сигналов, разработка Microsoft в основном анализирует, как именно звучит человек, разбивает эту информацию на отдельные «токены» и использует обучающие данные, чтобы сопоставить то, что он «знает» о том, как этот голос будет звучать, если ИИ произнесет другие фразы.
VALL-E обучали на библиотеке LibriLight, содержащей 60 000 часов англоязычной речи от более чем 7000 человек.
Google показала свой ИИ Duplex, который тоже может говорить практически неотличимо от человека, ещё в 2018 году, но суть разработки Microsoft не в самом ИИ, а именно в его обучаемости имитировать разные голоса.
На сайте проекта есть множество примеров работы ИИ, с которыми может ознакомиться любой желающий.
Подробнее на iXBT
Предыдущие новости
Google начнёт платить авторам коротких роликов YouTube Shorts с февраля
Компания Google раскрыла точные сроки запуска новой политики в отношении авторов коротких роликов YouTube Shorts. На официальном канале YouTube Creators объявлено, что новый контракт партнерской программы YouTube вступит в силу на этой неделе. Принятие нового соглашения требуется от всех авторов, получающих деньги в рамках партнерской программы, и должно быть подписано до...
Представлен очень доступный монитор с USB-C, RJ45, HDMI и USB-A и колонками. Unnocn 24C1F предлагают за 100 долларов в Китае
В Китае представлен недорогой монитор Unnocn 24C1F, который получил целый ряд портов, включая RJ-45. Монитор Unnocn 24C1F оснащен 23,8-дюймовой панелью IPS разрешением 1080p с частотой обновления 75 Гц. Яркостью панели достигает 300 кд/м2, контрастность составляет 1000:1, глубина цвета равна 8 бит. Экран охватывает 99% цветового пространства sRGB, 90% цветовой гаммы Adobe RGB...
Microsoft хочет инвестировать $10 млрд в разработчика ИИ-бота ChatGPT
Microsoft вступила в переговоры об инвестировании $10 млрд в разработавшую ИИ-бота ChatGPT и других ИИ-технологий компанию OpenAI, в результате чего стоимость последней вырастет до $29 млрд. Об этом сообщил ресурс Semafor. Источник изображения: efes /...
Volkswagen отзовёт больше тысячи электромобилей ID.4 из-за дефекта кабеля 12-вольтового аккумулятора
Не каждый обыватель в курсе, что электромобили используют не только тяговую литиевую батарею с высоковольтной сетью питания, но и традиционный аккумулятор с напряжением 12 В — нередко свинцово-кислотного типа. Партия электромобилей Volkswagen ID.4 пострадала от некачественного монтажа одного из питающих кабелей, и теперь подлежит отзыву для устранения дефекта, связанного...