- Корейцы натравят ИИ на пиратские кинотеатры... (12)
- Geely готовит конкурента Li Auto L9 и Aito... (12)
- Открыт метастабильный материал для будущих... (35)
- Новая реальность: успех S.T.A.L.K.E.R. 2:... (36)
- «Недостаточно слов, чтобы выразить... (89)
- ИИ научили генерировать тысячи модификаций... (120)
- В Epic Games Store стартовала новая раздача... (142)
- Новые открытия телескопа «Джеймс Уэбб»:... (138)
- На российском заводе Haval произошёл... (147)
- Новый год россияне встретят под «чёрной»... (143)
- За 2024 год в Steam вышло на 30 % больше... (144)
- 224 л.с., 8-ступенчатый «автомат» и полный... (136)
- Лампа накаливания снова в деле — физики... (124)
- xAI привлекла $6 млрд... (124)
- «Яндекс» закрыл почти все международные... (130)
- ASRock выпустит 14 моделей Socket... (133)
В России разрабатывают «электронное ухо», которое позволит намного лучше распознавать речь
Дата: 2022-11-02 00:20
Разработчики из Томского государственного университета систем управления и радиоэлектроники (ТУСУР) создали математическую модель для компьютерного распознавания речи, которая превосходит другие аналоги. Она позволяет определять пользователя по голосу и даёт возможность управлять «умной» техникой.
«Наш математический аппарат отличается от аналогов детальным соответствием устройству внутреннего уха человека при распознавании критических частот речи. Вероятностные механизмы, на которых построены существующие системы распознавания речи, у нас играют только вспомогательную роль», — рассказал Антон Конев, заместитель директора ЦК НТИ «Технологии доверенного взаимодействия» ТУСУР.
Утверждается, что новая система даёт погрешность вчетверо меньше, чем у лучших мировых аналогов. Новая система лучше распознаёт основной тон, может фиксировать спонтанный разговор или даже пение.
По словам создателей математической модели, это позволит общаться с «умными» системами как с живыми собеседниками, не прибегая к формальным командам.
«Наша разработка особенно эффективна при распознавании различных аббревиатур, редко встречающихся слов и фраз. Отдельное направление – выделение ключевых слов из речи, распознавание которых может стать заменой формальных команд при управлении «умной» техникой», – подчеркнул Конев.
Разработчики уточнили, что их разработка может лечь в основу системы продлённой аутентификации, которая будет идентифицировать пользователя в течение всего сеанса, а не однократно. В будущем планируется создать ПО, которое будет отслеживать присутствие конкретного абонента в чате или в видеоконференции.
Помимо этого, разработчики создают нейросеть для проверки текста, которая сможет определять авторство материалов или исходного кода программы.
Подробнее на iXBT
Предыдущие новости
Новая статья: Обзор умного браслета Amazfit Band 7: максимум умений за три тысячи
Бренд Amazfit зарекомендовала себя в первую очередь большим ассортиментом очень интересных по сочетанию цены и характеристик умных часов. Но смежная область фитнес-браслетов (умных браслетов) тоже находится во внимании Amazfit — пусть и с куда меньшей активностью. Сегодня мы поговорим о новейшем представителе — Amazfit Band...
В ЕС закусили удила: новые требования заставят Apple допустить сторонние магазины приложений на iPhone
Летом в ЕС приняли Закон о цифровых рынках, который сегодня вступил в силу. Эта инициатива, судя по всему, заставит Apple открыть доступ для сторонних магазинов приложений и многого другого на iPhone. Об этом заявил один из авторов закона Жерар де Грааф. Этот комментарий появился сразу после того, как Совет министров Европейского парламента ратифицировал голосование, по...
Microsoft сделает обмен файлами в браузере Edge ещё лучше
В мае этого года компания Microsoft добавила в раннюю версию браузера Edge для Windows 11 и Windows 10 функцию Drop. Эта возможность позволяет обмениваться файлами между своими устройствами. Само собой, для этого они должны иметь установленный браузер, который привязан к единой учётной записи. Для хранения файлов используется облако OneDrive. Но теперь появилось обновление,...
HPE представила серверы ProLiant Gen11 на базе AMD EPYC Genoa
Компания HPE анонсировала серверы ProLiant Gen11, предназначенные для решения задач, связанных с ИИ, машинным обучением, аналитикой данных, виртуализацией и облачными нагрузками. В основу решений легла аппаратная платформа AMD EPYC Genoa. Представлены четыре модели: ProLiant DL325 Gen11 и ProLiant DL365 Gen11 формата 1U, а также ProLiant DL345 Gen11 и ProLiant DL385 Gen11...