- Главный китайский поисковик интегрирует... (323)
- Россияне массово пожаловались на сбои в... (294)
- «Google Документы» научились кратко... (388)
- Культовый шутер Unreal Tournament 2004... (413)
- Читатель установил рекорд ИИ-пересказа уже... (471)
- Глава NASA приедет на Байконур на запуск... (595)
- Nvidia похвалилась, что Blackwell удешевили... (431)
- Не страшны мороз и бездорожье: iCaur... (438)
- «Юнона» уточнила форму Юпитера: он оказался... (444)
- Житель Германии отправился в Африку за 5000... (647)
- Intel оштрафовали в Индии на 30 миллионов... (522)
- Компания Tachyum, анонсировавшая... (736)
- Будущие флагманские процессоры Intel Nova... (654)
- Хакеры-пираты Anna’s Archive начали... (503)
- Вирусы научились напрямую обращаться к ИИ в... (704)
- ИИ-агент впервые попытался публично очернить... (545)
«ВКонтакте» открыла свои технологии распознавания речи
Дата: 2022-09-22 11:25
Команда «ВКонтакте» сообщила хорошую новость для сторонних разработчиков. Теперь разработчики смогут бесплатно использовать в своих проектах технологию «ВКонтакте», которая считывает голос и переводит его в текст.
Об этом рассказал технический директор «ВКонтакте» Александр Тоболь на открытии конференции Saint HighLoad++. Технология распознавания речи, или ASR, Automatic Speech Recognition, внедряется в несколько нажатий. Нейросети хорошо справляются с аудио с посторонними шумами, большим количеством сленга и сокращений.
Для распознавания можно выбрать одну из двух моделей. Нейтральная подойдёт для разборчивой речи, как в телешоу или интервью, а спонтанная поможет, когда нужно обработать более обыденную речь со сленгом и ненормативной лексикой. Нейросети «ВКонтакте» обрабатывают файлы за несколько секунд, умеют удалять из расшифровки шумы и паузы, понимают неразборчивую речь и даже отдельный звук «ъ».
Технологию можно попробовать через веб-интерфейс на специальной странице или интегрировать через публичный API «ВКонтакте». На портале доступен широкий набор методов, с помощью которых можно создавать мини-приложения «ВКонтакте» или использовать в сторонних проектах. Версию с обработкой аудио до 100 минут в сутки можно применять для любых целей. А для безлимитного использования технологии можно отправить заявку на электронную почту.
Подробнее на iXBT
Предыдущие новости
Робот-пылесос Redroad G10 для сухой и влажной уборки с автоматической очисткой швабры сейчас продаётся со скидкой более 16 тыс. рублей
В настоящее время на рынке есть несколько популярных моделей роботов-пылесосов с функциями сухой и влажной уборки, а также самоочистки, таких как Redroad G10, Ecovacs N9, Roborock G10, которые позволяют пользователям решить проблему уборки помещения без ручного труда. Однако для большинства потребителей категория роботов-уборщиков с функциями сухой и влажной уборки пола...
Лунная ракета NASA SLS прошла проверку заправкой топливом — пуск может состояться уже 27 сентября
Национальное управление по аэронавтике и исследованию космического пространства (NASA) США стало на шаг ближе к проведению первого орбитального полёта сверхтяжёлой двухступенчатой ракеты Space Launch System с кораблём Orion в рамках миссии Artemis I. На этой неделе ракета-носитель успешно прошла критически важный тест заправкой топливом. Благодаря этому велика вероятность,...
Представлены накладные беспроводные наушники Logitech G Astro A30 для игр и музыки
Компания Logitech под игровым брендом Logitech G анонсировала беспроводные наушники Logitech G Astro A30, подходящие не только для прослушивания музыки, но и для игр. Новинку можно использовать с консолями PlayStation 4, PlayStation 5, Xbox One, Xbox Series X и Series S, Nintendo Switch, компьютерами, а также гаджетами под управлением операционных систем Android и iOS....
Навеянный Dark Souls сатирический экшен The Last Hero of Nostalgaia откроет свои двери 19 октября
Издательство Coatsink и разработчики из канадской студии Over The Moon, известной по дилогии экшен-платформеров The Fall, объявили дату выхода своего сатирического боевика The Last Hero of Nostalgaia в духе Dark Souls. Источник изображения:...