- Rocket Lab запустила демонстрационный... (2086)
- Новый Audi Q5L засняли у дилера: такой же... (1918)
- Марс мог потерять один из своих спутников,... (2259)
- В Китае представлен Audi A5L Sportback Red... (2000)
- Samsung рассчитывает договориться с AMD о... (2449)
- Тактическая ролевая игра Solasta 2 с... (1962)
- Представлен совершенно новый флагманский... (2253)
- «Китайский УАЗ» получил дизельный мотор... (1858)
- «Паук» на Европе: необычная трещина во льду... (2233)
- 2025 год ещё не закончился, а SpaceX уже... (2336)
- Почти терминатор: в Китае патрульные... (1944)
- Урезанный PCIe 5.0 и разъём питания в очень... (1738)
- Межзвёздная комета 3I/ATLAS засветилась в... (1719)
- Стиль, 200 Мп и аккумулятор 7000 мАч с... (2725)
- В России начнут выпускать клон Iveco Fidato:... (1780)
- 53-летний интерфейс GPIB наконец-то получил... (1897)
Яндекс запустил многоголосый закадровый перевод для видео на YouTube
Дата: 2022-10-12 10:58
Команда Яндекса объявила о запуске очень удобной функции для пользователей «Яндекс Браузера» — возможность смотреть ролики с многоголосым закадровым переводом.
Изначально «Браузер» использовал два синтезированных голоса для перевода речи: один мужской и один женский. Теперь пользователям стал доступен многоголосый перевод видео — голосов стало двенадцать, шесть мужских и шесть женских. Как отмечают разработчики, благодаря улучшенным алгоритмам воспринимать видео с большим количеством говорящих участников стало намного легче.
«Браузер» «раздаёт» голоса разным спикерам и «запоминает» их с помощью нейросетевых технологий Яндекса. Сначала одна нейросеть переводит речь в текст, восстанавливает пунктуацию и определяет границы предложений. Затем уже другая нейросеть анализирует спектрограмму голоса и отмечает фрагменты, сказанные разными людьми. Так и становится ясно, кто из спикеров что произнес.
Напомним, год назад, в сентябре 2021 года команда Яндекса запустила для массового использования возможность смотреть англоязычные ролики на многих популярных платформах, включая YouTube и Vimeo, с автоматической русскоязычной озвучкой.
Подробнее на iXBT
Предыдущие новости
«Выглядит круто», — Xiaomi Civi 2 и iPhone 14 Pro впервые сравнили на одном фото
Блогер Сахил Карул разместил в социальных сетях фотографию, на которой вместе показаны новые смартфоны iPhone 14 Pro и Xiaomi Civi 2. Смартфоны имеют немного похожие по расположению и форме вырезы в центральной верхней части экрана. Отличается только размер. Напомним, у iPhone 14 Pro этот вырез называется Dynamic Island, в нам располагается одинарная фронтальная камера...
Ещё на 10-20% быстрее, чем GeForce RTX 4090. RTX 4090 Ti может получить не только полный GPU AD102, но и частоту ядра почти в 3 ГГц
Nvidia действительно может выпустить видеокарту GeForce RTX 4090 Ti с GPU AD102 в полной конфигурации. Согласно свежим данным, такая карта получит графический процессор со всеми 18 176 активными ядрами CUDA. Более того, частота в режиме Boost будет поднята на 200 МГц относительно текущей карты, до 2,75 ГГц, а реальная частота в играх может подниматься до 2,95 ГГц. Частоту...
SpaceX намерена запустить Starlink в Индии — компания готовит заявки на нужные лицензии
Компания SpaceX планирует заняться оформлением разрешительной документации для запуска сервиса спутникового интернета Starlink в Индии — она станет уже третьей компанией в стране, подавшей такую заявку. Об этом сообщило индийское издание Economic Times со ссылкой на собственные источники. Источник изображения:...
Набор аксессуаров Quest 2 Active Pack для занятий спортом в виртуальной реальности выйдет 25 октября
Компания M**a объявила в ходе мероприятия M**a Connect о предстоящем выходе комплекта аксессуаров M**a Quest 2 Active Pack, предназначенного для занятий спортом с использованием VR-гарнитуры M**a Quest 2. Комплект аксессуаров был анонсирован почти год назад на конференции F******k Connect 2021, но компании, по всей видимости, потребовалось время, чтобы доработать отдельные...