- «Мы достигли AGI»: Хуанг заявил о создании... (6534)
- Xiaomi ускоряет глобальный запуск HyperOS... (6633)
- Geely показала обновленный кроссовер Atlas... (6344)
- Microsoft закрыла доступ к функции, которая... (6361)
- M**a переманила команду ИИ-стартапа Dreamer... (7345)
- Новая статья: Обзор Apple MacBook Neo:... (6024)
- Новая статья: Обзор смартфона realme 16... (8939)
- В России готовят ограничения связи для... (7551)
- Samsung Galaxy A37 — 445 долларов, Samsung... (8340)
- Apple намерена добавить рекламу в «Карты»... (8398)
- Налоговая служба Великобритании уличила... (7444)
- Такими будут Honor 600 и Honor 600 Pro, и... (7759)
- Apple объявила даты конференции WWDC 2026,... (7553)
- В России готовятся к созданию собственного... (8210)
- А говорили iPhone Air никому не нужен.... (7502)
- Европейское космическое агентство впервые... (7193)
«VK Видео», «VK Клипы», «Учи.ру» и «ВКонтакте»: VK «прокачала» ИИ для расшифровки голоса в роликах и «кружочках»
Дата: 2025-12-08 16:36
Специалисты VK по искусственному интеллекту усовершенствовали технологию автоматического распознавания речи (ASR), основанную на моделях машинного обучения. Как рассказали в пресс-службе, новая версия распознаёт речь на 20% точнее, чем предыдущая, что повышает качество субтитров, расшифровок голосовых сообщений и «кружочков» в продуктах VK.
Сгенерировано нейросетью Midjourney Технология ASR преобразует голос в текст, переводя звук в цифровой формат, очищая запись от шума и анализируя особенности звучания. Нейросетевые модели и LLM помогают системе понимать контекст, смысловые связи и устойчивые выражения.
Как рассказали в VK, новая версия ASR-технологий дообучена на расширенном датасете аудиодорожек из публично доступных видеороликов «VK Видео», что позволяет точнее понимать темп и манеру речи. По итогам внутренних тестов, модель превосходит зарубежные аналоги и сервисы по качеству распознавания (WER) звуковых дорожек видео на русском языке.
ASR-технологии VK используются в создании субтитров в «VK Видео», «VK Клипах», Учи.ру и голосовых сообщениях мессенджера «ВКонтакте». Обновлённая версия уже работает в «VK Видео» и «VK Клипах», а также во внутренних сервисах команды VK. В планах — повышение точности распознавания голосовых сообщений, расширение поддержки языков и добавление диаризации (разделения по спикерам).
Подробнее на iXBT
Предыдущие новости
«Мелодия» возобновила производство виниловых пластинок: Disco Alliance и «Аутогенная тренировка для лиц, злоупотребляющих алкоголем» вошли в первую партию
«Мелодия» сообщила о начале выпуска виниловых пластинок на новом заводе в Новосибирске — интерес слушателей к аналоговому звуку оказался настолько высоким, что компания решила возродить полноценное производство. В продажу уже поступили первые релизы: работы Давида Тухманова, культовый альбом Disco Alliance группы Zodiac и альбом ВИА «Дос-Мукасан». Генеральный директор Андрей...
Флагманский представительский седан Audi A8 Horch 2025 подешевел в России — у официального дилера появилась более доступная версия с 3,0-литровым мотором
В Россию приехали флагманские седаны Audi A8 Horch 2025 с 3,0-литровым бензиновым мотором. Машины в комплектации Legendary появились у официального дилера в Москве по цене 32,8 млн рублей, однако с учётом дилерских программ реальная стоимость снижается до 32,2 млн рублей. Фото: Audi Фото: Audi Audi A8 Horch отличается от обычной версии A8 максимально богатым оснащением и...
Помимо циклических сделок NVIDIA теперь раздаёт партнёрам и «кредиты доверия»
Несмотря на растущую критику стратегии NVIDIA по финансированию своих клиентов, компания продолжает поддерживать своих партнёров и заказчиков всё новыми способами. Как пишет Data Center Dynamics, в своём недавнем отчёте по форме 10-Q NVIDIA сообщила, что выступила в качестве гаранта своего партнёра, что позволило последнему «обеспечить аренду объекта с ограниченной...
В Telegram добавили авторизацию через ключи доступа как альтернативу SMS
В обновлённых версиях приложения Telegram для iOS и Android появилась возможность авторизации с использованием ключа доступа (Passkey) вместо SMS, пишет ресурс РБК. О появлении этой функции в бета-версии мессенджера для Android сообщал неделю назад «Код Дурова». Источник изображения: Eyestetix...