- Конференция OS DAY 2026 «Встроенные... (1932)
- «Захотелось теперь отцом стать»:... (2075)
- Warhammer 40,000: Space Marine 2 превзошла... (2018)
- МТС Exolve: как ставка на self-service за... (1606)
- Xiaomi представила телевизоры Redmi TV A Pro... (2065)
- Российскую криптобиржу Grinex взломали и... (2155)
- Лояльность к iPhone превысила 96 % —... (2123)
- Ветеран Apple, который выводил на рынок... (2029)
- Смартфон Huawei Mate 80 Pro с продвинутыми... (2141)
- Надёжный инсайдер подтвердил дату выхода... (2127)
- Одноплатный компьютер Orange Pi Zero 3W... (2287)
- Intel наняла руководителя для своего... (2171)
- Tesla уже ищет на Тайване инженеров для... (3591)
- OnePlus покинет ключевые рынки и... (2233)
- Акции ASML и TSMC упали в цене на фоне... (2177)
- ИИ-агент OpenAI Codex получил многие... (2401)
Гонка токенов: Meta* и Cerebras Systems запускают Llama API с рекордной скоростью обработки
Дата: 2025-05-01 09:46
Meta* объявила о стратегическом партнёрстве с Cerebras Systems для запуска Llama API — сервиса, который обеспечивает вывод данных ИИ со скоростью до 18 раз выше, чем у традиционных GPU-решений. Анонс сделан на первой конференции для разработчиков LlamaCon и знаменует выход Meta в рынок коммерческого инференса, где доминируют OpenAI, Google и Anthropic. Для компании это первый опыт сотрудничества с гиперскалером, подтверждающий эффективность их wafer-scale чипов.
Тесты Artificial Analysis показали, что система Cerebras обрабатывает свыше 2600 токенов в секунду для модели Llama 4 Scout — в 20 раз быстрее ChatGPT (~130 токенов/с) и на два порядка выше DeepSeek (~25 токенов/с).
Иллюстрация: VentureBeat / Midjourney До сих пор Meta ограничивалась открытым распространением моделей Llama (более 1 млрд загрузок), не предоставляя облачной инфраструктуры. Теперь компания трансформирует их в коммерческий продукт, напрямую конкурируя за рынок токенов. «Разработчики покупают их миллиардами, как инструкции для AI-приложений, — пояснил Джеймс Ванг из Cerebras. — Скорость в 100 токенов/с, как у GPT, подходит для чатов, но неприемлема для многошагового анализа или голосовых систем».
Новый API открывает возможности для приложений, требующих минимальных задержек: интерактивной генерации кода, многоуровневого анализа за секунды вместо минут, голосовых интерфейсов с реакцией в реальном времени. Сервис поддерживает тонкую настройку моделей (начиная с Llama 3.3 8B) и предоставляет инструменты оценки их качества. Meta гарантирует, что данные разработчиков не будут использоваться для обучения собственных моделей, а готовые решения можно переносить на другие платформы — в отличие от закрытых систем конкурентов.
Llama API уже доступен в ограниченном превью. Для подключения разработчикам достаточно в настройках SDK Meta выбрать Cerebras и получить API-ключ. Массовый запуск ожидается в ближайшие месяцы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Компания Astrostrom представила план создания солнечных панелей из реголита и лунной фабрики на солнечной энергии
С момента первых концепций 1970-х годов космическая солнечная энергетика (Space-Based Solar Power, SBSP) оставалась теоретической перспективой из-за гигантских затрат на доставку материалов с Земли. Однако швейцарская компания Astrostrom предложила многоэтапный план, который может изменить правила игры, используя Луну как источник ресурсов. Основная идея заключается в переносе...
Точь-в-точь как настоящие смартфоны, но без начинки. Черные и белые макеты iPhone 17, iPhone 17 Air, iPhone 17 Pro и iPhone 17 Pro Max показали на фото
Качественные фотографии макетов грядущих смартфонов iPhone 17, iPhone 17 Air, iPhone 17 Pro и iPhone 17 Pro Max, которые выставлены в китайских магазинах, опубликовал инсайдер Majin Bu. Фото Majin Bu Согласно утечкам, iPhone 17 Air получит толщину всего 5,5 мм, что сделает его самым тонким смартфоном Apple на данный момент. Устройство получит экран размером 6,9 дюйма с узкой...
Лучше, больше и безумнее, чем раньше: Gearbox показала новый трейлер и много геймплея Borderlands 4
Как и было обещано, в ночь с 30 апреля на 1 мая студия Gearbox Software в рамках специального выпуска презентации State of Play устроила полноценную геймплейную демонстрацию своего амбициозного лутер-шутера Borderlands 4. Источник изображений: Gearbox...
Зонд «Психея» аварийно отключил двигатели — в NASA пока не знают, что случилось
На днях стало известно, что зонд NASA Psyche («Психея») аварийно отключил главные двигатели. Это произошло ещё 1 апреля, но агентство не афишировало проблему до последних дней. В NASA считают, что ситуация далека от критической, однако после середины июня дело может принять неблагоприятный оборот. Источник изображений:...