- Tenet Plus — это Lepas. Стало известно,... (2620)
- Конкурент «Москвичу 8» и Tenet 8: в России... (1123)
- Пора начинать копить на PS6: журналисты... (1817)
- Электромобиль Xiaomi SU7 после рестайлинга... (1525)
- У активных пользователей ИИ обнаружили... (1562)
- Власти России начали ограничивать работу... (1957)
- Неубиваемая классика: укреплённый кнопочный... (1401)
- Группа пятен, устроившая радиационный шторм... (1968)
- 100 евро, чтобы защитить свою GeForce RTX 50... (2122)
- Samsung начнет избавляться от платформы... (2234)
- iPhone по Wi-Fi против iPhone по 5G.... (1528)
- Пиковое потребление следующего флагманского... (1824)
- Слухи: владелец Arc Raiders приступил к... (1492)
- Американский стиль, возможность буксировки... (2049)
- Адаптированные для России Haval не... (1549)
- В России появился новый отечественный... (2108)
Искусственный интеллект Microsoft VALL-E может имитировать любой человеческий голос, послушав оригинал всего три секунды
Дата: 2023-01-10 13:37
Компания Microsoft представила искусственный интеллект VALL-E, который способен имитировать любой человеческий голос на основе примера длительностью всего в три секунды. При этом голос имитируется очень достоверно, с сохранением как тембра, так и эмоциональной окраски оригинала.
Сама Microsoft называет VALL-E «языковой моделью нейронного кодека». Разработка опирается на технологии EnCodec. В отличие от других методов преобразования текста в речь, которые зачастую синтезируют речь, манипулируя формами сигналов, разработка Microsoft в основном анализирует, как именно звучит человек, разбивает эту информацию на отдельные «токены» и использует обучающие данные, чтобы сопоставить то, что он «знает» о том, как этот голос будет звучать, если ИИ произнесет другие фразы.
VALL-E обучали на библиотеке LibriLight, содержащей 60 000 часов англоязычной речи от более чем 7000 человек.
Google показала свой ИИ Duplex, который тоже может говорить практически неотличимо от человека, ещё в 2018 году, но суть разработки Microsoft не в самом ИИ, а именно в его обучаемости имитировать разные голоса.
На сайте проекта есть множество примеров работы ИИ, с которыми может ознакомиться любой желающий.
Подробнее на iXBT
Предыдущие новости
Google начнёт платить авторам коротких роликов YouTube Shorts с февраля
Компания Google раскрыла точные сроки запуска новой политики в отношении авторов коротких роликов YouTube Shorts. На официальном канале YouTube Creators объявлено, что новый контракт партнерской программы YouTube вступит в силу на этой неделе. Принятие нового соглашения требуется от всех авторов, получающих деньги в рамках партнерской программы, и должно быть подписано до...
Представлен очень доступный монитор с USB-C, RJ45, HDMI и USB-A и колонками. Unnocn 24C1F предлагают за 100 долларов в Китае
В Китае представлен недорогой монитор Unnocn 24C1F, который получил целый ряд портов, включая RJ-45. Монитор Unnocn 24C1F оснащен 23,8-дюймовой панелью IPS разрешением 1080p с частотой обновления 75 Гц. Яркостью панели достигает 300 кд/м2, контрастность составляет 1000:1, глубина цвета равна 8 бит. Экран охватывает 99% цветового пространства sRGB, 90% цветовой гаммы Adobe RGB...
Microsoft хочет инвестировать $10 млрд в разработчика ИИ-бота ChatGPT
Microsoft вступила в переговоры об инвестировании $10 млрд в разработавшую ИИ-бота ChatGPT и других ИИ-технологий компанию OpenAI, в результате чего стоимость последней вырастет до $29 млрд. Об этом сообщил ресурс Semafor. Источник изображения: efes /...
Volkswagen отзовёт больше тысячи электромобилей ID.4 из-за дефекта кабеля 12-вольтового аккумулятора
Не каждый обыватель в курсе, что электромобили используют не только тяговую литиевую батарею с высоковольтной сетью питания, но и традиционный аккумулятор с напряжением 12 В — нередко свинцово-кислотного типа. Партия электромобилей Volkswagen ID.4 пострадала от некачественного монтажа одного из питающих кабелей, и теперь подлежит отзыву для устранения дефекта, связанного...