- Нет худа без добра: дефицит памяти из-за ИИ... (8527)
- На фоне дефицита памяти разработчики игр... (7163)
- Современный перископ и устаревшее решение:... (6918)
- Эксперимент на МКС пошёл не по плану:... (7511)
- Россия обновит орбитальную группировку: к... (6473)
- Российский космический корабль завершил... (6553)
- Samsung опасается падения спроса на память с... (6942)
- Игровая индустрия сильно пострадала из-за... (6152)
- Новая статья: Гид по выбору OLED-монитора в... (5985)
- Рассекречен совершенно новый Tank 300:... (6252)
- Ультракомпактный корпус, 16-ядерный Intel... (6942)
- Популярные кроссоверы Changan CS75 Plus и... (7115)
- Оригинальную Xbox One 2013 года наконец... (6085)
- Pixel 10 Pro XL проиграл Samsung Galaxy S26... (6960)
- Разработчики ИИ привлекают актёров... (7261)
- Новый рекорд: вычислено 314 триллионов... (6486)
«VK Видео», «VK Клипы», «Учи.ру» и «ВКонтакте»: VK «прокачала» ИИ для расшифровки голоса в роликах и «кружочках»
Дата: 2025-12-08 16:36
Специалисты VK по искусственному интеллекту усовершенствовали технологию автоматического распознавания речи (ASR), основанную на моделях машинного обучения. Как рассказали в пресс-службе, новая версия распознаёт речь на 20% точнее, чем предыдущая, что повышает качество субтитров, расшифровок голосовых сообщений и «кружочков» в продуктах VK.
Сгенерировано нейросетью Midjourney Технология ASR преобразует голос в текст, переводя звук в цифровой формат, очищая запись от шума и анализируя особенности звучания. Нейросетевые модели и LLM помогают системе понимать контекст, смысловые связи и устойчивые выражения.
Как рассказали в VK, новая версия ASR-технологий дообучена на расширенном датасете аудиодорожек из публично доступных видеороликов «VK Видео», что позволяет точнее понимать темп и манеру речи. По итогам внутренних тестов, модель превосходит зарубежные аналоги и сервисы по качеству распознавания (WER) звуковых дорожек видео на русском языке.
ASR-технологии VK используются в создании субтитров в «VK Видео», «VK Клипах», Учи.ру и голосовых сообщениях мессенджера «ВКонтакте». Обновлённая версия уже работает в «VK Видео» и «VK Клипах», а также во внутренних сервисах команды VK. В планах — повышение точности распознавания голосовых сообщений, расширение поддержки языков и добавление диаризации (разделения по спикерам).
Подробнее на iXBT
Предыдущие новости
«Мелодия» возобновила производство виниловых пластинок: Disco Alliance и «Аутогенная тренировка для лиц, злоупотребляющих алкоголем» вошли в первую партию
«Мелодия» сообщила о начале выпуска виниловых пластинок на новом заводе в Новосибирске — интерес слушателей к аналоговому звуку оказался настолько высоким, что компания решила возродить полноценное производство. В продажу уже поступили первые релизы: работы Давида Тухманова, культовый альбом Disco Alliance группы Zodiac и альбом ВИА «Дос-Мукасан». Генеральный директор Андрей...
Флагманский представительский седан Audi A8 Horch 2025 подешевел в России — у официального дилера появилась более доступная версия с 3,0-литровым мотором
В Россию приехали флагманские седаны Audi A8 Horch 2025 с 3,0-литровым бензиновым мотором. Машины в комплектации Legendary появились у официального дилера в Москве по цене 32,8 млн рублей, однако с учётом дилерских программ реальная стоимость снижается до 32,2 млн рублей. Фото: Audi Фото: Audi Audi A8 Horch отличается от обычной версии A8 максимально богатым оснащением и...
Помимо циклических сделок NVIDIA теперь раздаёт партнёрам и «кредиты доверия»
Несмотря на растущую критику стратегии NVIDIA по финансированию своих клиентов, компания продолжает поддерживать своих партнёров и заказчиков всё новыми способами. Как пишет Data Center Dynamics, в своём недавнем отчёте по форме 10-Q NVIDIA сообщила, что выступила в качестве гаранта своего партнёра, что позволило последнему «обеспечить аренду объекта с ограниченной...
В Telegram добавили авторизацию через ключи доступа как альтернативу SMS
В обновлённых версиях приложения Telegram для iOS и Android появилась возможность авторизации с использованием ключа доступа (Passkey) вместо SMS, пишет ресурс РБК. О появлении этой функции в бета-версии мессенджера для Android сообщал неделю назад «Код Дурова». Источник изображения: Eyestetix...