- ФСБ сможет отключать интернет и сотовую... (751)
- Kawasaki выпустила на рынок первый в мире... (1039)
- Финишная прямая: «гигафабрика» аккумуляторов... (721)
- Telegram заблокировал 7,5 млн каналов с... (701)
- Индийские NeevCloud и Agnikul Cosmos тоже... (813)
- Индийские NeevCloud и Agnikul Cosmos тоже... (664)
- Учёные научились «консервировать» солнечное... (710)
- Геймер купил сломанную материнскую плату за... (688)
- 6300 мАч вместо 10 000 мАч, но зато более... (693)
- Всё тайное становится явным: инсайдер... (1216)
- В Android появится автоматическое резервное... (848)
- В этом году AMD не сможет нормально... (1058)
- Экраны с антибликовым покрытием, защита... (837)
- Первое солнечное затмение 2026 года: эффект... (723)
- «Яндекс» захватил 69 % поискового рынка... (1263)
- Новый Skoda Kylaq станет злее, экономичнее и... (1219)
Гонка токенов: Meta* и Cerebras Systems запускают Llama API с рекордной скоростью обработки
Дата: 2025-05-01 09:46
Meta* объявила о стратегическом партнёрстве с Cerebras Systems для запуска Llama API — сервиса, который обеспечивает вывод данных ИИ со скоростью до 18 раз выше, чем у традиционных GPU-решений. Анонс сделан на первой конференции для разработчиков LlamaCon и знаменует выход Meta в рынок коммерческого инференса, где доминируют OpenAI, Google и Anthropic. Для компании это первый опыт сотрудничества с гиперскалером, подтверждающий эффективность их wafer-scale чипов.
Тесты Artificial Analysis показали, что система Cerebras обрабатывает свыше 2600 токенов в секунду для модели Llama 4 Scout — в 20 раз быстрее ChatGPT (~130 токенов/с) и на два порядка выше DeepSeek (~25 токенов/с).
Иллюстрация: VentureBeat / Midjourney До сих пор Meta ограничивалась открытым распространением моделей Llama (более 1 млрд загрузок), не предоставляя облачной инфраструктуры. Теперь компания трансформирует их в коммерческий продукт, напрямую конкурируя за рынок токенов. «Разработчики покупают их миллиардами, как инструкции для AI-приложений, — пояснил Джеймс Ванг из Cerebras. — Скорость в 100 токенов/с, как у GPT, подходит для чатов, но неприемлема для многошагового анализа или голосовых систем».
Новый API открывает возможности для приложений, требующих минимальных задержек: интерактивной генерации кода, многоуровневого анализа за секунды вместо минут, голосовых интерфейсов с реакцией в реальном времени. Сервис поддерживает тонкую настройку моделей (начиная с Llama 3.3 8B) и предоставляет инструменты оценки их качества. Meta гарантирует, что данные разработчиков не будут использоваться для обучения собственных моделей, а готовые решения можно переносить на другие платформы — в отличие от закрытых систем конкурентов.
Llama API уже доступен в ограниченном превью. Для подключения разработчикам достаточно в настройках SDK Meta выбрать Cerebras и получить API-ключ. Массовый запуск ожидается в ближайшие месяцы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Компания Astrostrom представила план создания солнечных панелей из реголита и лунной фабрики на солнечной энергии
С момента первых концепций 1970-х годов космическая солнечная энергетика (Space-Based Solar Power, SBSP) оставалась теоретической перспективой из-за гигантских затрат на доставку материалов с Земли. Однако швейцарская компания Astrostrom предложила многоэтапный план, который может изменить правила игры, используя Луну как источник ресурсов. Основная идея заключается в переносе...
Точь-в-точь как настоящие смартфоны, но без начинки. Черные и белые макеты iPhone 17, iPhone 17 Air, iPhone 17 Pro и iPhone 17 Pro Max показали на фото
Качественные фотографии макетов грядущих смартфонов iPhone 17, iPhone 17 Air, iPhone 17 Pro и iPhone 17 Pro Max, которые выставлены в китайских магазинах, опубликовал инсайдер Majin Bu. Фото Majin Bu Согласно утечкам, iPhone 17 Air получит толщину всего 5,5 мм, что сделает его самым тонким смартфоном Apple на данный момент. Устройство получит экран размером 6,9 дюйма с узкой...
Лучше, больше и безумнее, чем раньше: Gearbox показала новый трейлер и много геймплея Borderlands 4
Как и было обещано, в ночь с 30 апреля на 1 мая студия Gearbox Software в рамках специального выпуска презентации State of Play устроила полноценную геймплейную демонстрацию своего амбициозного лутер-шутера Borderlands 4. Источник изображений: Gearbox...
Зонд «Психея» аварийно отключил двигатели — в NASA пока не знают, что случилось
На днях стало известно, что зонд NASA Psyche («Психея») аварийно отключил главные двигатели. Это произошло ещё 1 апреля, но агентство не афишировало проблему до последних дней. В NASA считают, что ситуация далека от критической, однако после середины июня дело может принять неблагоприятный оборот. Источник изображений:...