- Подготовка миссии Artemis 2 к Луне... (3020)
- «Хаббл» прислал первое за четыре месяца... (2189)
- SpaceX и Amazon получат малую часть... (2526)
- Xiaomi представила один из самых доступных... (2385)
- Получены первые прямые снимки термоядерных... (2345)
- Внедорожник Kia, который не оценили. Kia... (2510)
- До 245 Тбайт, PCIe 5.0 и QLC NAND: DapuStor... (2224)
- Руководитель подразделения ИИ-инфраструктуры... (2548)
- Китай временно остался без аварийного... (2272)
- Northrop Grumman испытывает новый... (2850)
- Первые тесты AMD Ryzen 7 9850X3D с огромным... (3703)
- 32 дюйма, QLED, Google TV — всего 150... (3049)
- Альтернатива iPhone и Android-смартфонам.... (3027)
- M**a отложила выпуск очков смешанной... (2996)
- Sony выпустит новые Mini LED-телевизоры... (3048)
- Subaru представила Trailseeker 2026 года с... (2847)
Яндекс запустил многоголосый закадровый перевод для видео на YouTube
Дата: 2022-10-12 10:58
Команда Яндекса объявила о запуске очень удобной функции для пользователей «Яндекс Браузера» — возможность смотреть ролики с многоголосым закадровым переводом.
Изначально «Браузер» использовал два синтезированных голоса для перевода речи: один мужской и один женский. Теперь пользователям стал доступен многоголосый перевод видео — голосов стало двенадцать, шесть мужских и шесть женских. Как отмечают разработчики, благодаря улучшенным алгоритмам воспринимать видео с большим количеством говорящих участников стало намного легче.
«Браузер» «раздаёт» голоса разным спикерам и «запоминает» их с помощью нейросетевых технологий Яндекса. Сначала одна нейросеть переводит речь в текст, восстанавливает пунктуацию и определяет границы предложений. Затем уже другая нейросеть анализирует спектрограмму голоса и отмечает фрагменты, сказанные разными людьми. Так и становится ясно, кто из спикеров что произнес.
Напомним, год назад, в сентябре 2021 года команда Яндекса запустила для массового использования возможность смотреть англоязычные ролики на многих популярных платформах, включая YouTube и Vimeo, с автоматической русскоязычной озвучкой.
Подробнее на iXBT
Предыдущие новости
«Выглядит круто», — Xiaomi Civi 2 и iPhone 14 Pro впервые сравнили на одном фото
Блогер Сахил Карул разместил в социальных сетях фотографию, на которой вместе показаны новые смартфоны iPhone 14 Pro и Xiaomi Civi 2. Смартфоны имеют немного похожие по расположению и форме вырезы в центральной верхней части экрана. Отличается только размер. Напомним, у iPhone 14 Pro этот вырез называется Dynamic Island, в нам располагается одинарная фронтальная камера...
Ещё на 10-20% быстрее, чем GeForce RTX 4090. RTX 4090 Ti может получить не только полный GPU AD102, но и частоту ядра почти в 3 ГГц
Nvidia действительно может выпустить видеокарту GeForce RTX 4090 Ti с GPU AD102 в полной конфигурации. Согласно свежим данным, такая карта получит графический процессор со всеми 18 176 активными ядрами CUDA. Более того, частота в режиме Boost будет поднята на 200 МГц относительно текущей карты, до 2,75 ГГц, а реальная частота в играх может подниматься до 2,95 ГГц. Частоту...
SpaceX намерена запустить Starlink в Индии — компания готовит заявки на нужные лицензии
Компания SpaceX планирует заняться оформлением разрешительной документации для запуска сервиса спутникового интернета Starlink в Индии — она станет уже третьей компанией в стране, подавшей такую заявку. Об этом сообщило индийское издание Economic Times со ссылкой на собственные источники. Источник изображения:...
Набор аксессуаров Quest 2 Active Pack для занятий спортом в виртуальной реальности выйдет 25 октября
Компания M**a объявила в ходе мероприятия M**a Connect о предстоящем выходе комплекта аксессуаров M**a Quest 2 Active Pack, предназначенного для занятий спортом с использованием VR-гарнитуры M**a Quest 2. Комплект аксессуаров был анонсирован почти год назад на конференции F******k Connect 2021, но компании, по всей видимости, потребовалось время, чтобы доработать отдельные...