- M**a без лишнего шума собирает команду... (24)
- Новая статья: Компьютер месяца — апрель 2026... (27)
- Для тех, кому ездить много и дешево:... (50)
- Роботы Maximo установили 100 мегаватт... (40)
- Aston Martin представила гибридный суперкар... (43)
- OpenAI купила популярное шоу TBPN и выходит... (26)
- OpenAI купила популярное тех-шоу TBPN и... (46)
- В Европе создали Euro-Office — пакет офисных... (25)
- Стартап Stardust Solutions привлёк рекордные... (44)
- Geely Atlas впервые получил автопилот. В... (42)
- Магнитное поле Сатурна оказалось... (42)
- Телескоп «Джеймс Уэбб» показал скрытое... (101)
- Лунный аппарат Blue Ghost от Firefly... (91)
- Нержавеющие машины и самолеты можно будет... (210)
- Новый пульт дистанционного управления Xiaomi... (141)
- В Минцифры признают: выявить работу сервисов... (176)
Microsoft представила собственную линейку моделей для речи, голоса и изображений
Дата: 2026-04-05 21:03
Microsoft анонсировала три новые ИИ-модели: MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2. Эти модели, разработанные полностью внутри компании, направлены на преобразование речи в текст, генерацию голоса и создание изображений. Они уже доступны через платформы Microsoft Foundry и MAI Playground.
MAI-Transcribe-1 — система преобразования речи в текст, которая достигает минимального среднего уровня ошибок слов (Word Error Rate) на тесте FLEURS для 25 языков. Модель превосходит OpenAI Whisper-large-v3 и Google Gemini 3.1 Flash по большинству языков. Она поддерживает форматы MP3, WAV и FLAC и работает в 2,5 раза быстрее предыдущих решений Microsoft.
MAI-Voice-1 — модель, преобразующая текст в речь и способная генерировать 60 секунд естественного звучания за одну секунду. Она поддерживает создание пользовательских голосов на основе нескольких секунд аудио. Стоимость использования составляет $22 за 1 миллион символов.
MAI-Image-2 — обновлённая модель генерации изображений, которая работает в два раза быстрее предыдущей версии. Она уже используется в Bing и PowerPoint. Стоимость составляет $5 за 1 миллион токенов текста и $33 за 1 миллион токенов изображений.
Иллюстрация: Nano Banana Эти модели стали возможны благодаря пересмотру контракта с OpenAI, который позволил Microsoft самостоятельно разрабатывать модели. Несмотря на это, партнёрство с OpenAI остаётся в силе до 2032 года.
Модели были разработаны небольшими командами: каждая из них насчитывает менее 10 человек.
Компания позиционирует свои модели как доступные и эффективные решения для предприятий. MAI-Transcribe-1 уже тестируется в Microsoft Teams и Copilot, а MAI-Image-2 используется в рекламных кампаниях крупных компаний, таких как WPP.
В будущем Microsoft планирует разработку универсальных языковых моделей, способных конкурировать с ChatGPT. Компания стремится к полной независимости в ИИ, создавая собственные вычислительные кластеры и инфраструктуру для поддержки суперинтеллекта.
Подробнее на iXBT
Предыдущие новости
Apple одобрила драйвер Tiny Corp, так что теперь к Mac можно подключать дискретные видеокарты AMD и Nvidia. Но не для игр
Компания Tiny Corp, которая год назад смогла создать первую в мире внешнюю видеокарту, подключаемую к современным Mac по USB, сообщила о том, что Apple одобрила её драйверы для дискретных GPU, что позволяет создавать такие связки всем желающим. Драйвер Tiny Corp подходит как для карт AMD, так и для карт Nvidia (вероятно, это два разных драйвера), однако, к сожалению, речь тут...
Обсерватория имени Веры Рубин обнаружила более 11 000 новых астероидов
Научная команда обсерватории имени Веры Рубин сообщила об открытии более 11 000 новых астероидов благодаря возможностям телескопа Simonyi Survey и программному обеспечению, разработанному в Вашингтонском университете. Новые объекты включают также около 380 транснептуновых объектов (TNO) и 33 ранее неизвестных околоземных объекта (NEO), ни один из которых не представляет угрозы...
Intel показала технологию нейронного сжатия текстур TSNC, которая сжимает текстуры в 9-18 раз
Компания Nvidia на днях показала, как нейронный рендеринг может помочь сжимать текстуры в играх, а теперь аналогичную технологию показала Intel. Её решение позволяет сжимать текстуры почти в 20 раз. Технология Texture Set Neural Compression (TSNC), которую впервые показывали в прошлом году, представляет собой нейронное сжатие текстур. Фото Videocardz Компания показала две...
6 апреля 2026 года будет побит рекорд по удаленности человека от Земли: космический корабль Orion окажется на расстоянии 406 773 километра от Земли
Астронавты миссии Artemis II, летящие к Луне на корабле Orion, в ближайшие сутки должны установить новый рекорд максимального удаления человека от Земли. Об этом сообщил глава NASA Джаред Айзекман. Изображение: NASA По его словам, во время пролета у обратной стороны Луны экипаж окажется на расстоянии 406 773 километра от Земли. Это более чем на 6 тысяч километров превышает...