- На Луне обнаружена недавняя тектоническая... (2973)
- Новый лунный скафандр завершил заводские... (2588)
- Китай вывел гуманоидных роботов на сцену... (2523)
- ИИ-ассистент OpenClaw стал мишенью для... (2169)
- Минцифры наметило масштабную замену «меди»... (2326)
- В Антарктиде получен рекордный керн донных... (2556)
- Unity пообещала ИИ, который позволит... (2154)
- Хакеры применили поддельные страницы CAPTCHA... (2777)
- «Достигли дна, но тут снизу постучали»:... (2324)
- SK hynix предложила неоригинальный костыль... (2719)
- У крупнейшего японского производителя... (2674)
- Российский бизнес распробовал ИИ от... (2143)
- Samsung зачем-то прорекламировала камеру... (2885)
- Физики создали нанофотонный чип с... (2115)
- Обломки индийской ракеты обнаружены... (2060)
- Microsoft подтвердила релиз Kingdom Come:... (2888)
Яндекс запустил многоголосый закадровый перевод для видео на YouTube
Дата: 2022-10-12 10:58
Команда Яндекса объявила о запуске очень удобной функции для пользователей «Яндекс Браузера» — возможность смотреть ролики с многоголосым закадровым переводом.
Изначально «Браузер» использовал два синтезированных голоса для перевода речи: один мужской и один женский. Теперь пользователям стал доступен многоголосый перевод видео — голосов стало двенадцать, шесть мужских и шесть женских. Как отмечают разработчики, благодаря улучшенным алгоритмам воспринимать видео с большим количеством говорящих участников стало намного легче.
«Браузер» «раздаёт» голоса разным спикерам и «запоминает» их с помощью нейросетевых технологий Яндекса. Сначала одна нейросеть переводит речь в текст, восстанавливает пунктуацию и определяет границы предложений. Затем уже другая нейросеть анализирует спектрограмму голоса и отмечает фрагменты, сказанные разными людьми. Так и становится ясно, кто из спикеров что произнес.
Напомним, год назад, в сентябре 2021 года команда Яндекса запустила для массового использования возможность смотреть англоязычные ролики на многих популярных платформах, включая YouTube и Vimeo, с автоматической русскоязычной озвучкой.
Подробнее на iXBT
Предыдущие новости
«Выглядит круто», — Xiaomi Civi 2 и iPhone 14 Pro впервые сравнили на одном фото
Блогер Сахил Карул разместил в социальных сетях фотографию, на которой вместе показаны новые смартфоны iPhone 14 Pro и Xiaomi Civi 2. Смартфоны имеют немного похожие по расположению и форме вырезы в центральной верхней части экрана. Отличается только размер. Напомним, у iPhone 14 Pro этот вырез называется Dynamic Island, в нам располагается одинарная фронтальная камера...
Ещё на 10-20% быстрее, чем GeForce RTX 4090. RTX 4090 Ti может получить не только полный GPU AD102, но и частоту ядра почти в 3 ГГц
Nvidia действительно может выпустить видеокарту GeForce RTX 4090 Ti с GPU AD102 в полной конфигурации. Согласно свежим данным, такая карта получит графический процессор со всеми 18 176 активными ядрами CUDA. Более того, частота в режиме Boost будет поднята на 200 МГц относительно текущей карты, до 2,75 ГГц, а реальная частота в играх может подниматься до 2,95 ГГц. Частоту...
SpaceX намерена запустить Starlink в Индии — компания готовит заявки на нужные лицензии
Компания SpaceX планирует заняться оформлением разрешительной документации для запуска сервиса спутникового интернета Starlink в Индии — она станет уже третьей компанией в стране, подавшей такую заявку. Об этом сообщило индийское издание Economic Times со ссылкой на собственные источники. Источник изображения:...
Набор аксессуаров Quest 2 Active Pack для занятий спортом в виртуальной реальности выйдет 25 октября
Компания M**a объявила в ходе мероприятия M**a Connect о предстоящем выходе комплекта аксессуаров M**a Quest 2 Active Pack, предназначенного для занятий спортом с использованием VR-гарнитуры M**a Quest 2. Комплект аксессуаров был анонсирован почти год назад на конференции F******k Connect 2021, но компании, по всей видимости, потребовалось время, чтобы доработать отдельные...