- Новейший робот Tesla Optimus упал на спину... (1185)
- 192 Arm-ядра в одном процессоре. Представлен... (1134)
- Роскомнадзор не увидел причин для... (1239)
- В работе российского мессенджера Max... (862)
- В «Яндекс Лавке» запустили голосовое общение... (1240)
- Маленькая белая невзрачная коробочка, но... (1102)
- Три камеры по 50 Мп, увеличенный... (1159)
- Lada Iskra SW получила новую... (1136)
- На 3DNews началось голосование за лучшую... (1153)
- BT.2020 (Rec. 2020) запустили в 2012 году,... (1398)
- Core Ultra 7 270K Plus действительно... (1753)
- Новый бестселлер Huawei Mate 80, который... (1338)
- Xbox провалила «Чёрную пятницу» — даже... (1218)
- Взлетевшие цены на память больнее всего... (1755)
- Geely пересмотрела скидки на седан Preface в... (883)
- Перископическая камера Sony, IP68/69,... (1088)
«VK Видео», «VK Клипы», «Учи.ру» и «ВКонтакте»: VK «прокачала» ИИ для расшифровки голоса в роликах и «кружочках»
Дата: 2025-12-08 16:36
Специалисты VK по искусственному интеллекту усовершенствовали технологию автоматического распознавания речи (ASR), основанную на моделях машинного обучения. Как рассказали в пресс-службе, новая версия распознаёт речь на 20% точнее, чем предыдущая, что повышает качество субтитров, расшифровок голосовых сообщений и «кружочков» в продуктах VK.
Сгенерировано нейросетью Midjourney Технология ASR преобразует голос в текст, переводя звук в цифровой формат, очищая запись от шума и анализируя особенности звучания. Нейросетевые модели и LLM помогают системе понимать контекст, смысловые связи и устойчивые выражения.
Как рассказали в VK, новая версия ASR-технологий дообучена на расширенном датасете аудиодорожек из публично доступных видеороликов «VK Видео», что позволяет точнее понимать темп и манеру речи. По итогам внутренних тестов, модель превосходит зарубежные аналоги и сервисы по качеству распознавания (WER) звуковых дорожек видео на русском языке.
ASR-технологии VK используются в создании субтитров в «VK Видео», «VK Клипах», Учи.ру и голосовых сообщениях мессенджера «ВКонтакте». Обновлённая версия уже работает в «VK Видео» и «VK Клипах», а также во внутренних сервисах команды VK. В планах — повышение точности распознавания голосовых сообщений, расширение поддержки языков и добавление диаризации (разделения по спикерам).
Подробнее на iXBT
Предыдущие новости
«Мелодия» возобновила производство виниловых пластинок: Disco Alliance и «Аутогенная тренировка для лиц, злоупотребляющих алкоголем» вошли в первую партию
«Мелодия» сообщила о начале выпуска виниловых пластинок на новом заводе в Новосибирске — интерес слушателей к аналоговому звуку оказался настолько высоким, что компания решила возродить полноценное производство. В продажу уже поступили первые релизы: работы Давида Тухманова, культовый альбом Disco Alliance группы Zodiac и альбом ВИА «Дос-Мукасан». Генеральный директор Андрей...
Флагманский представительский седан Audi A8 Horch 2025 подешевел в России — у официального дилера появилась более доступная версия с 3,0-литровым мотором
В Россию приехали флагманские седаны Audi A8 Horch 2025 с 3,0-литровым бензиновым мотором. Машины в комплектации Legendary появились у официального дилера в Москве по цене 32,8 млн рублей, однако с учётом дилерских программ реальная стоимость снижается до 32,2 млн рублей. Фото: Audi Фото: Audi Audi A8 Horch отличается от обычной версии A8 максимально богатым оснащением и...
Помимо циклических сделок NVIDIA теперь раздаёт партнёрам и «кредиты доверия»
Несмотря на растущую критику стратегии NVIDIA по финансированию своих клиентов, компания продолжает поддерживать своих партнёров и заказчиков всё новыми способами. Как пишет Data Center Dynamics, в своём недавнем отчёте по форме 10-Q NVIDIA сообщила, что выступила в качестве гаранта своего партнёра, что позволило последнему «обеспечить аренду объекта с ограниченной...
В Telegram добавили авторизацию через ключи доступа как альтернативу SMS
В обновлённых версиях приложения Telegram для iOS и Android появилась возможность авторизации с использованием ключа доступа (Passkey) вместо SMS, пишет ресурс РБК. О появлении этой функции в бета-версии мессенджера для Android сообщал неделю назад «Код Дурова». Источник изображения: Eyestetix...