- Смартфон Realme GT 8 Pro поступил в продажу... (682)
- 7000 мАч, 120 Вт, экран 2K 144 Гц,... (403)
- Нет, новейший Samsung Galaxy Z TriFold не... (406)
- Samsung показала, как производится и... (349)
- Яндекс запустил ИИ-помощника для авторов... (387)
- В мире насчитывается около 1 млрд ПК с... (548)
- Формат Micro-ATX, но тут сразу четыре слота... (463)
- Создатели возрождённой ролевой песочницы... (527)
- Intel выборола себе целый 1% на рынке... (463)
- Первый смартфон Honor с аккумулятором на 10... (624)
- Ноутбучная видеокарта возглавила рейтинг... (660)
- 9000 мАч, 100 Вт и «большая... (440)
- AMD поднимет цены на все свои процессоры уже... (503)
- Новая камера для флагманских смартфонов... (584)
- Руководство Ford: системы дизайна и САПР... (567)
- В России продают идеальные «Жигули» —... (390)
Сбер представил модели ИИ, способные распознавать русский жестовый язык
Дата: 2023-11-23 13:55
Команда Сбербанка на международной конференции по искусственному интеллекту AI Journey представила нейросетевые модели, позволяющие распознавать русский жестовый язык.
Фото: Nic Rosenau / Unsplash Команда Vision RnD в SberDevices, разрабатывающая одно из таких решений, первой в мире представила прототип общения с генеративной языковой моделью при помощи жестового языка в открытом доступе. Это стало возможно благодаря использованию GigaChat API, программного интерфейса доступа к сервису GigaChat.
Генеративная модель GigaChat сама, без дополнительных преобразований, понимает контекст распознанных жестов. Например, распознанные отдельные слова: «Я Идти Улица Гулять» сервис сам преобразовывает в корректную фразу: «Я пошел гулять на улицу», сохраняя контекст передачи информации.
Текущая версия модели позволяет распознавать более 2500 жестов, включая понимание дактиля (произношение слов по буквам) и возможность распознавать составные жесты. Кроме того, модель понимает терминологию по темам банковской сферы, транспорта, животных, и даже несколько слов из сферы медицины и образования. Этот объем покрывает существенную часть словаря русского жестового языка, позволяя создавать сервисы с нужным прикладным применением.
Другая команда исследователей разработала и опубликовала в открытом доступе легкую модель распознавания жестового языка, не требовательную к вычислительным ресурсам. Модель работает на CPU, что снижает себестоимость решений, создаваемых на ее основе. Это дает возможность широкому кругу разработчиков проектировать инклюзивное программное обеспечение, например, продукты и сервисы для коммуникации или инструменты для изучения жестового языка. На сегодняшний день алгоритм распознает 1600 жестов и преобразовывает в слова до трёх жестов в секунду на стандартных персональных компьютерах. В 2024 году планируется тестирование и внедрение модели распознавания русского жестового языка и решений на ее основе в ряде регионов России.
Подробнее на iXBT
Предыдущие новости
Instagram✴ разрешил пользователям скачивать короткие ролики Reels, но с ограничениями
Пользователи Instagram✴ по всему миру теперь могут скачивать короткие ролики Reels для последующего просмотра на своих устройствах, сообщил глава платформы Адам Моссери (Adam Mosseri). Ранее сохранять и просматривать ролики можно было только в самом приложении Instagram✴. Источник изображения: Kirill Averianov /...
Rockstar откажется от Social Club — признаки этого появились на сайте студии в преддверии первого трейлера GTA VI
Платформа Social Club, похоже, доживает последние дни в своём нынешнем виде. В преддверии первого трейлера следующей Grand Theft Auto студия Rockstar Games (GTA V, RDR 2) начала удалять упоминания площадки со своих сайтов. Источник изображения: Rockstar...
В DNS стартовали продажи новейших MacBook Pro на SoC Apple М3
В конце октября компания Apple представила новое поколение ноутбуков MacBook Pro. И хотя официальных поставок продукции Apple в Россию нет, российские ретейлеры начали продавать новые MacBook Pro в рамках параллельного импорта. В частности, о поступлении в продажу MacBook Pro на основе SoC Apple М3 объявил крупный ретейлер DNS. Российским пользователям у DNS предлагаются...
Сбер представил новую версию GigaChat - на основе самой сильной модели для русского языка
На международной конференции по искусственному интеллекту AI Journey разработчики Сбера анонсировали новую версию сервиса GigaChat, в основе которого лежит одна из наиболее продвинутых моделей для русского языка с 29 миллиардами параметров. Иллюстрация: Сбер В числе первых доступ к API новинки вскоре получат бизнес-клиенты Сбера — для реализации собственных решений, а также...