- «Становится только хуже»: инсайдер... (7288)
- Раньше это могла быть новая Nokia. В Сети... (6839)
- Windows 11 теперь будет поддерживать... (7988)
- Представлен флагман Vivo X300s с камерой... (7813)
- Apple оштрафовали в Великобритании за... (9326)
- Bethesda подтвердила дату смерти The Elder... (7905)
- «Я знал, что подобная чушь рано или поздно... (7247)
- «Я знал, что подобная чушь рано или поздно... (7217)
- Apple хочет выпустить iMac OLED, но проблема... (7946)
- Великобритания оштрафовала Apple на £390 000... (6535)
- Слепой тест аудиокабелей за $4250 и $7... (6571)
- Microsoft завалила рекламой ИИ тысячи... (6481)
- Ещё одна жертва ситуации на рынке памяти.... (7629)
- Третий год Google будет использовать всё тот... (7351)
- Microsoft анонсировала крупную игровую... (6930)
- Microsoft серьёзно улучшит поиск в Windows... (8158)
«VK Видео», «VK Клипы», «Учи.ру» и «ВКонтакте»: VK «прокачала» ИИ для расшифровки голоса в роликах и «кружочках»
Дата: 2025-12-08 16:36
Специалисты VK по искусственному интеллекту усовершенствовали технологию автоматического распознавания речи (ASR), основанную на моделях машинного обучения. Как рассказали в пресс-службе, новая версия распознаёт речь на 20% точнее, чем предыдущая, что повышает качество субтитров, расшифровок голосовых сообщений и «кружочков» в продуктах VK.
Сгенерировано нейросетью Midjourney Технология ASR преобразует голос в текст, переводя звук в цифровой формат, очищая запись от шума и анализируя особенности звучания. Нейросетевые модели и LLM помогают системе понимать контекст, смысловые связи и устойчивые выражения.
Как рассказали в VK, новая версия ASR-технологий дообучена на расширенном датасете аудиодорожек из публично доступных видеороликов «VK Видео», что позволяет точнее понимать темп и манеру речи. По итогам внутренних тестов, модель превосходит зарубежные аналоги и сервисы по качеству распознавания (WER) звуковых дорожек видео на русском языке.
ASR-технологии VK используются в создании субтитров в «VK Видео», «VK Клипах», Учи.ру и голосовых сообщениях мессенджера «ВКонтакте». Обновлённая версия уже работает в «VK Видео» и «VK Клипах», а также во внутренних сервисах команды VK. В планах — повышение точности распознавания голосовых сообщений, расширение поддержки языков и добавление диаризации (разделения по спикерам).
Подробнее на iXBT
Предыдущие новости
«Мелодия» возобновила производство виниловых пластинок: Disco Alliance и «Аутогенная тренировка для лиц, злоупотребляющих алкоголем» вошли в первую партию
«Мелодия» сообщила о начале выпуска виниловых пластинок на новом заводе в Новосибирске — интерес слушателей к аналоговому звуку оказался настолько высоким, что компания решила возродить полноценное производство. В продажу уже поступили первые релизы: работы Давида Тухманова, культовый альбом Disco Alliance группы Zodiac и альбом ВИА «Дос-Мукасан». Генеральный директор Андрей...
Флагманский представительский седан Audi A8 Horch 2025 подешевел в России — у официального дилера появилась более доступная версия с 3,0-литровым мотором
В Россию приехали флагманские седаны Audi A8 Horch 2025 с 3,0-литровым бензиновым мотором. Машины в комплектации Legendary появились у официального дилера в Москве по цене 32,8 млн рублей, однако с учётом дилерских программ реальная стоимость снижается до 32,2 млн рублей. Фото: Audi Фото: Audi Audi A8 Horch отличается от обычной версии A8 максимально богатым оснащением и...
Помимо циклических сделок NVIDIA теперь раздаёт партнёрам и «кредиты доверия»
Несмотря на растущую критику стратегии NVIDIA по финансированию своих клиентов, компания продолжает поддерживать своих партнёров и заказчиков всё новыми способами. Как пишет Data Center Dynamics, в своём недавнем отчёте по форме 10-Q NVIDIA сообщила, что выступила в качестве гаранта своего партнёра, что позволило последнему «обеспечить аренду объекта с ограниченной...
В Telegram добавили авторизацию через ключи доступа как альтернативу SMS
В обновлённых версиях приложения Telegram для iOS и Android появилась возможность авторизации с использованием ключа доступа (Passkey) вместо SMS, пишет ресурс РБК. О появлении этой функции в бета-версии мессенджера для Android сообщал неделю назад «Код Дурова». Источник изображения: Eyestetix...