- Первая в мире миниатюрная рабочая станция с... (3998)
- Дизайн как у Audi, размеры как у Geely... (3573)
- В сервисе «VK Видео» обновился детский... (3720)
- Календарь релизов 10 – 16 ноября: CoD: Black... (3707)
- 7000 мАч, 90 Вт, 200 Мп и 30-кратный зум,... (4542)
- Toyota предлагает 40 лет на одном... (3923)
- Живой Илон Маск или обманка? В Wildberries... (3837)
- Foxconn и Nvidia запускают фабрику будущего... (4262)
- Это крошечный поезд, который ездит прямо по... (3453)
- От громоздких систем к прибору «на ладони»:... (5288)
- «Магический угол» в действии: физики увидели... (5601)
- Энтузиаст превратил 500 вейпов в... (3404)
- Micron задержит строительство мегафабрик... (5049)
- Чудовищно огромные и сложные GPU Nvidia Vera... (3431)
- Один из уволенных Intel сотрудников решил... (3829)
- «Ведомости»: российские операторы связи... (6230)
Яндекс запустил многоголосый закадровый перевод для видео на YouTube
Дата: 2022-10-12 10:58
Команда Яндекса объявила о запуске очень удобной функции для пользователей «Яндекс Браузера» — возможность смотреть ролики с многоголосым закадровым переводом.
Изначально «Браузер» использовал два синтезированных голоса для перевода речи: один мужской и один женский. Теперь пользователям стал доступен многоголосый перевод видео — голосов стало двенадцать, шесть мужских и шесть женских. Как отмечают разработчики, благодаря улучшенным алгоритмам воспринимать видео с большим количеством говорящих участников стало намного легче.
«Браузер» «раздаёт» голоса разным спикерам и «запоминает» их с помощью нейросетевых технологий Яндекса. Сначала одна нейросеть переводит речь в текст, восстанавливает пунктуацию и определяет границы предложений. Затем уже другая нейросеть анализирует спектрограмму голоса и отмечает фрагменты, сказанные разными людьми. Так и становится ясно, кто из спикеров что произнес.
Напомним, год назад, в сентябре 2021 года команда Яндекса запустила для массового использования возможность смотреть англоязычные ролики на многих популярных платформах, включая YouTube и Vimeo, с автоматической русскоязычной озвучкой.
Подробнее на iXBT
Предыдущие новости
«Выглядит круто», — Xiaomi Civi 2 и iPhone 14 Pro впервые сравнили на одном фото
Блогер Сахил Карул разместил в социальных сетях фотографию, на которой вместе показаны новые смартфоны iPhone 14 Pro и Xiaomi Civi 2. Смартфоны имеют немного похожие по расположению и форме вырезы в центральной верхней части экрана. Отличается только размер. Напомним, у iPhone 14 Pro этот вырез называется Dynamic Island, в нам располагается одинарная фронтальная камера...
Ещё на 10-20% быстрее, чем GeForce RTX 4090. RTX 4090 Ti может получить не только полный GPU AD102, но и частоту ядра почти в 3 ГГц
Nvidia действительно может выпустить видеокарту GeForce RTX 4090 Ti с GPU AD102 в полной конфигурации. Согласно свежим данным, такая карта получит графический процессор со всеми 18 176 активными ядрами CUDA. Более того, частота в режиме Boost будет поднята на 200 МГц относительно текущей карты, до 2,75 ГГц, а реальная частота в играх может подниматься до 2,95 ГГц. Частоту...
SpaceX намерена запустить Starlink в Индии — компания готовит заявки на нужные лицензии
Компания SpaceX планирует заняться оформлением разрешительной документации для запуска сервиса спутникового интернета Starlink в Индии — она станет уже третьей компанией в стране, подавшей такую заявку. Об этом сообщило индийское издание Economic Times со ссылкой на собственные источники. Источник изображения:...
Набор аксессуаров Quest 2 Active Pack для занятий спортом в виртуальной реальности выйдет 25 октября
Компания M**a объявила в ходе мероприятия M**a Connect о предстоящем выходе комплекта аксессуаров M**a Quest 2 Active Pack, предназначенного для занятий спортом с использованием VR-гарнитуры M**a Quest 2. Комплект аксессуаров был анонсирован почти год назад на конференции F******k Connect 2021, но компании, по всей видимости, потребовалось время, чтобы доработать отдельные...