- ИИ-пузырь лопнул: стоимость Nvidia рухнула... (1104)
- Новая статья: Первые впечатления от... (1387)
- Люди живут в палатках перед магазином в... (1323)
- ИИ-пузырь лопнул: стоимость Nvidia... (1174)
- От Nvidia другого и не ждали? GeForce RTX... (1601)
- S.T.A.L.K.E.R. 2: Heart of Chornobyl... (1106)
- Microsoft подключила к разработке Gears of... (1168)
- Нашумевший стартап DeepSeek выпустил Janus... (1214)
- Южная Каролина заинтересовалась достройкой... (1090)
- Южная Каролина заинтересовалась достройкой... (1008)
- Последний крупный патч для Baldur's Gate 3... (1273)
- Большой полноприводный кроссовер Volkswagen... (1037)
- Календарь релизов — 27 января – 2 февраля:... (1151)
- Пользователям блокировщиков рекламы YouTube... (989)
- Фил Спенсер не смог гарантировать, что... (1128)
- 15 лет назад Стив Джобс представил первый... (980)
Искусственный интеллект Microsoft VALL-E может имитировать любой человеческий голос, послушав оригинал всего три секунды
Дата: 2023-01-10 13:37
Компания Microsoft представила искусственный интеллект VALL-E, который способен имитировать любой человеческий голос на основе примера длительностью всего в три секунды. При этом голос имитируется очень достоверно, с сохранением как тембра, так и эмоциональной окраски оригинала.
Сама Microsoft называет VALL-E «языковой моделью нейронного кодека». Разработка опирается на технологии EnCodec. В отличие от других методов преобразования текста в речь, которые зачастую синтезируют речь, манипулируя формами сигналов, разработка Microsoft в основном анализирует, как именно звучит человек, разбивает эту информацию на отдельные «токены» и использует обучающие данные, чтобы сопоставить то, что он «знает» о том, как этот голос будет звучать, если ИИ произнесет другие фразы.
VALL-E обучали на библиотеке LibriLight, содержащей 60 000 часов англоязычной речи от более чем 7000 человек.
Google показала свой ИИ Duplex, который тоже может говорить практически неотличимо от человека, ещё в 2018 году, но суть разработки Microsoft не в самом ИИ, а именно в его обучаемости имитировать разные голоса.
На сайте проекта есть множество примеров работы ИИ, с которыми может ознакомиться любой желающий.
Подробнее на iXBT
Предыдущие новости
Google начнёт платить авторам коротких роликов YouTube Shorts с февраля
Компания Google раскрыла точные сроки запуска новой политики в отношении авторов коротких роликов YouTube Shorts. На официальном канале YouTube Creators объявлено, что новый контракт партнерской программы YouTube вступит в силу на этой неделе. Принятие нового соглашения требуется от всех авторов, получающих деньги в рамках партнерской программы, и должно быть подписано до...
Представлен очень доступный монитор с USB-C, RJ45, HDMI и USB-A и колонками. Unnocn 24C1F предлагают за 100 долларов в Китае
В Китае представлен недорогой монитор Unnocn 24C1F, который получил целый ряд портов, включая RJ-45. Монитор Unnocn 24C1F оснащен 23,8-дюймовой панелью IPS разрешением 1080p с частотой обновления 75 Гц. Яркостью панели достигает 300 кд/м2, контрастность составляет 1000:1, глубина цвета равна 8 бит. Экран охватывает 99% цветового пространства sRGB, 90% цветовой гаммы Adobe RGB...
Microsoft хочет инвестировать $10 млрд в разработчика ИИ-бота ChatGPT
Microsoft вступила в переговоры об инвестировании $10 млрд в разработавшую ИИ-бота ChatGPT и других ИИ-технологий компанию OpenAI, в результате чего стоимость последней вырастет до $29 млрд. Об этом сообщил ресурс Semafor. Источник изображения: efes /...
Volkswagen отзовёт больше тысячи электромобилей ID.4 из-за дефекта кабеля 12-вольтового аккумулятора
Не каждый обыватель в курсе, что электромобили используют не только тяговую литиевую батарею с высоковольтной сетью питания, но и традиционный аккумулятор с напряжением 12 В — нередко свинцово-кислотного типа. Партия электромобилей Volkswagen ID.4 пострадала от некачественного монтажа одного из питающих кабелей, и теперь подлежит отзыву для устранения дефекта, связанного...