- Физики научились «картографировать»... (2148)
- У умной туалетной камеры Kohler Dekoda со... (2823)
- В России запустили автоматизированное... (2874)
- 5100 мА·ч, IP68/IP69, MIL-STD-810H, 50 Мп,... (3481)
- Частота выросла со 100 до 144 Гц,... (3359)
- В России представлен новый Geely Monjaro с... (3753)
- Астрономов ждёт спутниковый апокалипсис —... (3021)
- Глава Anthropic тонко намекнул, что OpenAI... (3089)
- Gemini 3 Pro может рассказать, как создать... (2500)
- Новая версия Motorola Edge 70 получит... (2655)
- ИИ-агент Kiro от Amazon Web Services обещает... (2803)
- Blue Origin назвала экипаж суборбитального... (2719)
- DeepSeek бросает вызов GPT-5 и Gemini 3 Pro:... (2935)
- Российские Kia и Hyundai (Solaris) быстро... (2856)
- iPhone 17 теряет антибликовую способность,... (3146)
- Крысы распробовали быстрый интернет: жители... (4022)
Яндекс запустил многоголосый закадровый перевод для видео на YouTube
Дата: 2022-10-12 10:58
Команда Яндекса объявила о запуске очень удобной функции для пользователей «Яндекс Браузера» — возможность смотреть ролики с многоголосым закадровым переводом.
Изначально «Браузер» использовал два синтезированных голоса для перевода речи: один мужской и один женский. Теперь пользователям стал доступен многоголосый перевод видео — голосов стало двенадцать, шесть мужских и шесть женских. Как отмечают разработчики, благодаря улучшенным алгоритмам воспринимать видео с большим количеством говорящих участников стало намного легче.
«Браузер» «раздаёт» голоса разным спикерам и «запоминает» их с помощью нейросетевых технологий Яндекса. Сначала одна нейросеть переводит речь в текст, восстанавливает пунктуацию и определяет границы предложений. Затем уже другая нейросеть анализирует спектрограмму голоса и отмечает фрагменты, сказанные разными людьми. Так и становится ясно, кто из спикеров что произнес.
Напомним, год назад, в сентябре 2021 года команда Яндекса запустила для массового использования возможность смотреть англоязычные ролики на многих популярных платформах, включая YouTube и Vimeo, с автоматической русскоязычной озвучкой.
Подробнее на iXBT
Предыдущие новости
«Выглядит круто», — Xiaomi Civi 2 и iPhone 14 Pro впервые сравнили на одном фото
Блогер Сахил Карул разместил в социальных сетях фотографию, на которой вместе показаны новые смартфоны iPhone 14 Pro и Xiaomi Civi 2. Смартфоны имеют немного похожие по расположению и форме вырезы в центральной верхней части экрана. Отличается только размер. Напомним, у iPhone 14 Pro этот вырез называется Dynamic Island, в нам располагается одинарная фронтальная камера...
Ещё на 10-20% быстрее, чем GeForce RTX 4090. RTX 4090 Ti может получить не только полный GPU AD102, но и частоту ядра почти в 3 ГГц
Nvidia действительно может выпустить видеокарту GeForce RTX 4090 Ti с GPU AD102 в полной конфигурации. Согласно свежим данным, такая карта получит графический процессор со всеми 18 176 активными ядрами CUDA. Более того, частота в режиме Boost будет поднята на 200 МГц относительно текущей карты, до 2,75 ГГц, а реальная частота в играх может подниматься до 2,95 ГГц. Частоту...
SpaceX намерена запустить Starlink в Индии — компания готовит заявки на нужные лицензии
Компания SpaceX планирует заняться оформлением разрешительной документации для запуска сервиса спутникового интернета Starlink в Индии — она станет уже третьей компанией в стране, подавшей такую заявку. Об этом сообщило индийское издание Economic Times со ссылкой на собственные источники. Источник изображения:...
Набор аксессуаров Quest 2 Active Pack для занятий спортом в виртуальной реальности выйдет 25 октября
Компания M**a объявила в ходе мероприятия M**a Connect о предстоящем выходе комплекта аксессуаров M**a Quest 2 Active Pack, предназначенного для занятий спортом с использованием VR-гарнитуры M**a Quest 2. Комплект аксессуаров был анонсирован почти год назад на конференции F******k Connect 2021, но компании, по всей видимости, потребовалось время, чтобы доработать отдельные...