- «Сделаем не игру, а шедевр»: разработчики... (6379)
- Исследование MIT: искусственный интеллект... (5391)
- С ChatGPT теперь можно общаться голосом в... (5844)
- Китай испытал самый тяжёлый в мире... (5343)
- С доставкой в Россию уже можно заказать... (5611)
- Иранский кризис подорвёт усилия Индии по... (5262)
- Telegram получил огромное обновление:... (5539)
- TSMC собирается развернуть производство 3-нм... (5912)
- Апрель 2026 обещает космическое шоу: яркая... (5951)
- Продажи Crimson Desert превысили четыре... (6364)
- Официально: Oppo Find X10 Ultra не выйдет в... (5839)
- «На пути к Земле где-то потерялось... (6153)
- Обновление Anthropic Claude случайно... (6123)
- LTE с аэростата: МТС подключает летательные... (6426)
- Все 5 ведущих производителей... (6110)
- Microsoft заменит приложение «Удалённый... (5535)
«VK Видео», «VK Клипы», «Учи.ру» и «ВКонтакте»: VK «прокачала» ИИ для расшифровки голоса в роликах и «кружочках»
Дата: 2025-12-08 16:36
Специалисты VK по искусственному интеллекту усовершенствовали технологию автоматического распознавания речи (ASR), основанную на моделях машинного обучения. Как рассказали в пресс-службе, новая версия распознаёт речь на 20% точнее, чем предыдущая, что повышает качество субтитров, расшифровок голосовых сообщений и «кружочков» в продуктах VK.
Сгенерировано нейросетью Midjourney Технология ASR преобразует голос в текст, переводя звук в цифровой формат, очищая запись от шума и анализируя особенности звучания. Нейросетевые модели и LLM помогают системе понимать контекст, смысловые связи и устойчивые выражения.
Как рассказали в VK, новая версия ASR-технологий дообучена на расширенном датасете аудиодорожек из публично доступных видеороликов «VK Видео», что позволяет точнее понимать темп и манеру речи. По итогам внутренних тестов, модель превосходит зарубежные аналоги и сервисы по качеству распознавания (WER) звуковых дорожек видео на русском языке.
ASR-технологии VK используются в создании субтитров в «VK Видео», «VK Клипах», Учи.ру и голосовых сообщениях мессенджера «ВКонтакте». Обновлённая версия уже работает в «VK Видео» и «VK Клипах», а также во внутренних сервисах команды VK. В планах — повышение точности распознавания голосовых сообщений, расширение поддержки языков и добавление диаризации (разделения по спикерам).
Подробнее на iXBT
Предыдущие новости
«Мелодия» возобновила производство виниловых пластинок: Disco Alliance и «Аутогенная тренировка для лиц, злоупотребляющих алкоголем» вошли в первую партию
«Мелодия» сообщила о начале выпуска виниловых пластинок на новом заводе в Новосибирске — интерес слушателей к аналоговому звуку оказался настолько высоким, что компания решила возродить полноценное производство. В продажу уже поступили первые релизы: работы Давида Тухманова, культовый альбом Disco Alliance группы Zodiac и альбом ВИА «Дос-Мукасан». Генеральный директор Андрей...
Флагманский представительский седан Audi A8 Horch 2025 подешевел в России — у официального дилера появилась более доступная версия с 3,0-литровым мотором
В Россию приехали флагманские седаны Audi A8 Horch 2025 с 3,0-литровым бензиновым мотором. Машины в комплектации Legendary появились у официального дилера в Москве по цене 32,8 млн рублей, однако с учётом дилерских программ реальная стоимость снижается до 32,2 млн рублей. Фото: Audi Фото: Audi Audi A8 Horch отличается от обычной версии A8 максимально богатым оснащением и...
Помимо циклических сделок NVIDIA теперь раздаёт партнёрам и «кредиты доверия»
Несмотря на растущую критику стратегии NVIDIA по финансированию своих клиентов, компания продолжает поддерживать своих партнёров и заказчиков всё новыми способами. Как пишет Data Center Dynamics, в своём недавнем отчёте по форме 10-Q NVIDIA сообщила, что выступила в качестве гаранта своего партнёра, что позволило последнему «обеспечить аренду объекта с ограниченной...
В Telegram добавили авторизацию через ключи доступа как альтернативу SMS
В обновлённых версиях приложения Telegram для iOS и Android появилась возможность авторизации с использованием ключа доступа (Passkey) вместо SMS, пишет ресурс РБК. О появлении этой функции в бета-версии мессенджера для Android сообщал неделю назад «Код Дурова». Источник изображения: Eyestetix...