- Заставить ИИ выдавать запрещённую информацию... (165)
- SanDisk: момент, когда SSD станут угрозой... (407)
- Gartner: расходы в сфере ИИ в 2026 году... (403)
- «МойОфис» начал массовые увольнения — под... (252)
- Эффект Subnautica 2: спустя восемь лет после... (491)
- Китай поставит на учёт всех человекоподобных... (618)
- BYD: машины с её автопилотом в шесть раз... (342)
- Пентагон опубликовал 64 новых файла о НЛО и... (672)
- Несмотря ни на что: в ответ на геймплейные... (647)
- Инсайдер раскрыл, когда ждать The Elder... (966)
- Китай доставил новый экипаж на орбитальную... (1107)
- Энтузиасты разогнали дрон до рекордных 733... (955)
- Учёные выяснили, что у большинства планет в... (774)
- Российские телевизоры захватили 31,5 %... (763)
- Realme выпустит в России доступные смартфоны... (908)
- Epic Games показала первую игру на Unreal... (1146)
Обгоняет GigaAM и Whisper: «Т-Банк» опубликовал T-one, потоковую модель распознавания речи на русском языке
Дата: 2025-07-22 17:37
Компания «Т-Технологии», технологическое подразделение «Т-Банка» (ранее — «Тинькофф Банка»), выложила в открытый доступ модель распознавания речи T-one.
Сгенерировано нейросетью Midjourney Разработчики заявили:
Это потоковая ASR-модель при сравнительно небольшом размере в 70 млн параметров лидирует среди других открытых моделей по качеству распознавания на русском языке на шумных и сжатых записях из колл-центров — именно там, где бизнес теряет деньги из-за ошибок распознавания.
Модель изначально спроектирована для работы в реальном времени с аудиопотоком произвольной длины. Она уже используется во внутренних продуктах «Т-Технологий», включая службу поддержки «Т-Банка», мобильного секретаря в «Т-Мобайле», инструментах защиты от спам-звонков и так далее.
В «Т-Технологиях» подчеркнули:
Общепринятых валидационных датасетов для телефонии на русском в открытом доступе с должным качеством разметки не существует, но по внутренним бенчмаркам* по качеству распознавания на русском в телефонии Т-one обгоняет большие открытые ASR-модели: GigaAM v2 на 242–243 млн параметров и Whisper Large-v3 на 1,5 млрд параметров.
Кроме того, T-one достаточно компактна, чтобы запускать эту модель без необходимости закупать дорогостоящее оборудование. T-one распространяется по лицензии Apache 2.0, разрешающей свободное коммерческое использование и модификацию.
Иллюстрация: «Т-Технологии»
Подробнее на iXBT
Предыдущие новости
Lada Iskra оказалась дешевле седана Logan, причем обе машины оснащаются 90-сильными моторами
«Автопоток» сравнил стоимость Lada Iskra и Dacia Logan третьего поколения (напомним, машины делят одну платформу), и оказалось, что Iskra даже немного дешевле. В Румынии базовый седан Logan Essential стоит 14 250 евро, то есть 1,3 млн руб. Стоимость Lada Iskra в России — от 1,25 млн рублей. Фото: Lada/Dacia В плане комплектаций единственный плюс Logan Essential состоит в том,...
Дикторов в московском метро дополнит ИИ — тестирование уже началось
На Сокольнической линии столичного метро стартовали испытания системы искусственного интеллекта, которая будет зачитывать аудиосообщения, сообщил заммэра Москвы Максим Ликсутов. Источник изображения:...
Elgato представила карту видеозахвата Game Capture 4K S с поддержкой 4K при 60 FPS по цене $160
Компания Elgato представила новое устройство видеозахвата Game Capture 4K S, предназначенное для записи игрового процесса с ПК, а также консолей Xbox Series S/X, PlayStation 5 и Switch 2 в разрешении 4K при частоте 60 кадров в секунду. Новинка позиционируется как более доступная альтернатива предыдущим моделям и, как сообщает The Verge, уже поступила в продажу по цене...
Samsung теряет рынок складных смартфонов — в этом году её доля почти сравняется с Huawei
По данным TrendForce, глобальный рынок складных смартфонов продолжит расти «умеренными темпами». Причины, по которым направление не развивается быстрее, остаются прежними — опасения по поводу долговечности таких устройств и их высокая розничная стоимость. Аналитики прогнозируют, что в этом году по всему миру будет реализовано 19,8 млн складных устройств, что составит 1,6 %...