- Ремейк «Готики» вышел на ПК и консолях —... (1285)
- В российской части МКС обнаружены две утечки... (1901)
- Google исправила рекордные 429 уязвимостей в... (1607)
- Google исправила рекордные 429 уязвимости в... (1483)
- Аша Шарма подтвердила, что Xbox нужны... (1632)
- Межзвёздная комета 3I/ATLAS заинтриговала... (1240)
- Thermal Grizzly показала водоблок для... (1486)
- Google начала экспериментировать с показом... (1807)
- Следующая ИИ-модель OpenAI разрабатывается... (1829)
- Вредоносный мод для Minecraft заразил 116... (1274)
- Роботакси Waymo показало себя как неожиданно... (1503)
- «Магия современных веб-технологий»:... (3703)
- Репортаж со стенда Apacer на Computex 2026:... (2674)
- Илон Маск заговорил о 100 000 аппаратов... (1513)
- OpenAI согласилась предоставлять властям США... (1673)
- ИИ-агент OpenAI Codex помог раскрыть атаку... (1974)
В Сбере представили GigaAM – семейство моделей машинного обучения для распознавания речи и эмоций
Дата: 2024-04-08 15:52
Команды разработки сервисов GigaChat и SaluteSpeech в SberDevices представили GigaAM (Giga Acoustic Model) — семейство акустических моделей для русского языка, которые позволяют корректно распознавать речь и эмоции.
Сгенерировано нейросетью Dall-E GigaAM — Audio Foundation Model, предобученная на разнообразной русской речи. Она подходит для адаптации под различные задачи работы со звуком, включая распознавание речи и эмоций, определение диктора и другие.
GigaAM-CTC — открытая модель для распознавания русскоязычных запросов. Как показала оценка качества на 7 срезах данных (от запросов в умные колонки до записей из телефонного канала), модель допускает в коротких запросах на 20–35% меньше ошибок в словах по сравнению с такими популярными решениями, как NeMo-Conformer-RNNT и Whisper-Large-v3.
GigaAM-Emo — акустическая модель для определения эмоций. Она продемонстрировала лучший результат на крупнейшем датасете Dusha среди известных моделей. Все модели размещены в открытом доступе с некоммерческой лицензией и могут быть использованы для подготовки дипломных работ и научных статей.
Подробнее на iXBT
Предыдущие новости
TSMC расширит сотрудничество с японскими вузами, иначе её предприятиям не хватит кадров
Тайваньская компания TSMC собирается построить в Японии как минимум два предприятия по контрактному производству чипов, но даже сейчас на местном рынке труда чувствуется нехватка квалифицированных кадров, а потому контрактному производителю приходится сотрудничать в этой сфере с японскими вузами, как отмечает Nikkei Asian Review. Источник изображения:...
Удивительно, но самыми выгодными видеокартами на сегодня являются адаптеры Intel. AMD отстаёт несильно, а вот карты GeForce ощутимо хуже
Авторы портала 3DCenter опубликовали свежий индекс производительности видеокарт с учётом актуальных цен. Цены они берут в Германии и Польше, но в целом они довольно близки к показателям по всему Евросоюзу и к ценам в США с поправкой на налоги. создано DALL-E Данные были сведены в диаграммы для трёх основных разрешений. Также важно отметить, что эти данные учитывают только...
В России резко подешевели машины BAIC
Цены на автомобили BAIC в России резко снизились за счет прямых скидок на некоторые модели 2023 года выпуска, которые стали доступнее на 6,8-9,1%. Как сообщают «Автоновости дня», прямые скидки предлагаются для четырех моделей BAIC, включая седан BAIC U5 Plus и кроссоверы X3, X55, X7. Сильнее всего упали в цене BAIC X55 и X7, скидка на которые достигает 250 000 рублей. BAIC...
Первую ракету «Ангара-А5» допустили к пуску на Восточном
Сегодня, 8 пареля 2024 года, на космодроме Восточный государственная комиссия разрешила заправку топливом первой ракеты-носителя «Ангара-А5». Об этом сообщила пресс-служба Роскосмоса. «Ангара-А5» несёт разгонный блок «Орион» и испытательную полезную нагрузку. Её запуск с площадки 1А запланирован на 9 апреля в 12:00:00 по московскому времени. Чуть больше чем через 12 минут...