- Комета-невидимка: объект (139359) 2001... (535)
- Samsung Galaxy S26, Galaxy S26 Plus и Galaxy... (374)
- Учёные нашли способ превращения испорченного... (367)
- Обнаружен самый «вёрткий» астероид Солнечной... (389)
- В ближайшее время SSD подорожают ещё больше:... (350)
- Представлен Peugeot 408 нового поколения —... (524)
- Складной iPhone с экраном без складки выйдет... (433)
- Американская атомная батарейка готова:... (513)
- Asus представила игровой ноутбук TUF Gaming... (601)
- M**a забронировала 6,6 ГВт атомных мощностей... (537)
- Иск Илона Маска к OpenAI дошёл до суда... (588)
- Новая статья: Итоги 2025 года:... (445)
- NASA: телескоп Nancy Grace Roman стартует в... (494)
- Батареи CATL показали рекордно низкую... (539)
- Первый запуск года Falcon 9 с 29 спутниками... (477)
- Первый запуск года Falcon 9 с 29 спутниками... (489)
В Сбере представили GigaAM – семейство моделей машинного обучения для распознавания речи и эмоций
Дата: 2024-04-08 15:52
Команды разработки сервисов GigaChat и SaluteSpeech в SberDevices представили GigaAM (Giga Acoustic Model) — семейство акустических моделей для русского языка, которые позволяют корректно распознавать речь и эмоции.
Сгенерировано нейросетью Dall-E GigaAM — Audio Foundation Model, предобученная на разнообразной русской речи. Она подходит для адаптации под различные задачи работы со звуком, включая распознавание речи и эмоций, определение диктора и другие.
GigaAM-CTC — открытая модель для распознавания русскоязычных запросов. Как показала оценка качества на 7 срезах данных (от запросов в умные колонки до записей из телефонного канала), модель допускает в коротких запросах на 20–35% меньше ошибок в словах по сравнению с такими популярными решениями, как NeMo-Conformer-RNNT и Whisper-Large-v3.
GigaAM-Emo — акустическая модель для определения эмоций. Она продемонстрировала лучший результат на крупнейшем датасете Dusha среди известных моделей. Все модели размещены в открытом доступе с некоммерческой лицензией и могут быть использованы для подготовки дипломных работ и научных статей.
Подробнее на iXBT
Предыдущие новости
TSMC расширит сотрудничество с японскими вузами, иначе её предприятиям не хватит кадров
Тайваньская компания TSMC собирается построить в Японии как минимум два предприятия по контрактному производству чипов, но даже сейчас на местном рынке труда чувствуется нехватка квалифицированных кадров, а потому контрактному производителю приходится сотрудничать в этой сфере с японскими вузами, как отмечает Nikkei Asian Review. Источник изображения:...
Удивительно, но самыми выгодными видеокартами на сегодня являются адаптеры Intel. AMD отстаёт несильно, а вот карты GeForce ощутимо хуже
Авторы портала 3DCenter опубликовали свежий индекс производительности видеокарт с учётом актуальных цен. Цены они берут в Германии и Польше, но в целом они довольно близки к показателям по всему Евросоюзу и к ценам в США с поправкой на налоги. создано DALL-E Данные были сведены в диаграммы для трёх основных разрешений. Также важно отметить, что эти данные учитывают только...
В России резко подешевели машины BAIC
Цены на автомобили BAIC в России резко снизились за счет прямых скидок на некоторые модели 2023 года выпуска, которые стали доступнее на 6,8-9,1%. Как сообщают «Автоновости дня», прямые скидки предлагаются для четырех моделей BAIC, включая седан BAIC U5 Plus и кроссоверы X3, X55, X7. Сильнее всего упали в цене BAIC X55 и X7, скидка на которые достигает 250 000 рублей. BAIC...
Первую ракету «Ангара-А5» допустили к пуску на Восточном
Сегодня, 8 пареля 2024 года, на космодроме Восточный государственная комиссия разрешила заправку топливом первой ракеты-носителя «Ангара-А5». Об этом сообщила пресс-служба Роскосмоса. «Ангара-А5» несёт разгонный блок «Орион» и испытательную полезную нагрузку. Её запуск с площадки 1А запланирован на 9 апреля в 12:00:00 по московскому времени. Чуть больше чем через 12 минут...