- Первое изменение логотипа Google за 10 лет:... (4619)
- «Робот делает робота», — Мишустин рассказал... (5083)
- Президент OpenAI: человечеству потребуется... (5250)
- Президент OpenAI убеждён, что в будущем за... (5261)
- Наш ответ Hummer: представлен бронированный... (5685)
- Выпущено уже несколько сотен новых... (5715)
- США упростили процесс выявления подставных... (5041)
- В трекерах Tile нашли уязвимость,... (5380)
- В трекерах Tile выявили изъян, который... (5198)
- MSI показала GeForce RTX 5070 Ti Ventus 3X... (4719)
- Вздувшаяся батарея Galaxy Ring зажала палец... (5713)
- Раздувшаяся батарея Galaxy Ring сдавила... (5087)
- Новая статья: Обзор материнской платы Maxsun... (5379)
- Новая статья: Обзор блока питания Zalman... (5654)
- Геймер собрал внутри Minecraft рабочий... (6156)
- Градиентная «G» станет единым символом... (5817)
Гонка токенов: Meta* и Cerebras Systems запускают Llama API с рекордной скоростью обработки
Дата: 2025-05-01 09:46
Meta* объявила о стратегическом партнёрстве с Cerebras Systems для запуска Llama API — сервиса, который обеспечивает вывод данных ИИ со скоростью до 18 раз выше, чем у традиционных GPU-решений. Анонс сделан на первой конференции для разработчиков LlamaCon и знаменует выход Meta в рынок коммерческого инференса, где доминируют OpenAI, Google и Anthropic. Для компании это первый опыт сотрудничества с гиперскалером, подтверждающий эффективность их wafer-scale чипов.
Тесты Artificial Analysis показали, что система Cerebras обрабатывает свыше 2600 токенов в секунду для модели Llama 4 Scout — в 20 раз быстрее ChatGPT (~130 токенов/с) и на два порядка выше DeepSeek (~25 токенов/с).
Иллюстрация: VentureBeat / Midjourney До сих пор Meta ограничивалась открытым распространением моделей Llama (более 1 млрд загрузок), не предоставляя облачной инфраструктуры. Теперь компания трансформирует их в коммерческий продукт, напрямую конкурируя за рынок токенов. «Разработчики покупают их миллиардами, как инструкции для AI-приложений, — пояснил Джеймс Ванг из Cerebras. — Скорость в 100 токенов/с, как у GPT, подходит для чатов, но неприемлема для многошагового анализа или голосовых систем».
Новый API открывает возможности для приложений, требующих минимальных задержек: интерактивной генерации кода, многоуровневого анализа за секунды вместо минут, голосовых интерфейсов с реакцией в реальном времени. Сервис поддерживает тонкую настройку моделей (начиная с Llama 3.3 8B) и предоставляет инструменты оценки их качества. Meta гарантирует, что данные разработчиков не будут использоваться для обучения собственных моделей, а готовые решения можно переносить на другие платформы — в отличие от закрытых систем конкурентов.
Llama API уже доступен в ограниченном превью. Для подключения разработчикам достаточно в настройках SDK Meta выбрать Cerebras и получить API-ключ. Массовый запуск ожидается в ближайшие месяцы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Компания Astrostrom представила план создания солнечных панелей из реголита и лунной фабрики на солнечной энергии
С момента первых концепций 1970-х годов космическая солнечная энергетика (Space-Based Solar Power, SBSP) оставалась теоретической перспективой из-за гигантских затрат на доставку материалов с Земли. Однако швейцарская компания Astrostrom предложила многоэтапный план, который может изменить правила игры, используя Луну как источник ресурсов. Основная идея заключается в переносе...
Точь-в-точь как настоящие смартфоны, но без начинки. Черные и белые макеты iPhone 17, iPhone 17 Air, iPhone 17 Pro и iPhone 17 Pro Max показали на фото
Качественные фотографии макетов грядущих смартфонов iPhone 17, iPhone 17 Air, iPhone 17 Pro и iPhone 17 Pro Max, которые выставлены в китайских магазинах, опубликовал инсайдер Majin Bu. Фото Majin Bu Согласно утечкам, iPhone 17 Air получит толщину всего 5,5 мм, что сделает его самым тонким смартфоном Apple на данный момент. Устройство получит экран размером 6,9 дюйма с узкой...
Лучше, больше и безумнее, чем раньше: Gearbox показала новый трейлер и много геймплея Borderlands 4
Как и было обещано, в ночь с 30 апреля на 1 мая студия Gearbox Software в рамках специального выпуска презентации State of Play устроила полноценную геймплейную демонстрацию своего амбициозного лутер-шутера Borderlands 4. Источник изображений: Gearbox...
Зонд «Психея» аварийно отключил двигатели — в NASA пока не знают, что случилось
На днях стало известно, что зонд NASA Psyche («Психея») аварийно отключил главные двигатели. Это произошло ещё 1 апреля, но агентство не афишировало проблему до последних дней. В NASA считают, что ситуация далека от критической, однако после середины июня дело может принять неблагоприятный оборот. Источник изображений:...