- Kia Sorento Hybrid 2026 получил версию... (6279)
- Yakuza Kiwami 3 выйдет с переводом на... (5759)
- Названы смартфоны с лучшими экранами,... (5357)
- Сотни пользователей iPhone 17, iPhone 17... (5494)
- Финальная One UI 8.0 с Android 16 пришла на... (5805)
- Microsoft испытала охлаждение чипов через... (4666)
- Honda в России отмечает 77 лет. «СберАвто»... (5654)
- Microsoft также предлагает охлаждать чипы... (5281)
- OnePlus 11 получил улучшенную анимацию,... (5766)
- Компактный и очень мощный адаптер для... (5406)
- Как снимает «Бог ночи»: опубликованы примеры... (5633)
- Toyota RAV4 в России: машины в наличии... (5563)
- Советский ВАЗ-2106 1990 года в заводском... (6263)
- Выручка Micron взлетела на 46 % благодаря... (5216)
- Прогноз по выручке Micron на текущий квартал... (6188)
- Эта модель обошла DeepSeek-V3.1 и GPT-5 в... (5557)
Гонка токенов: Meta* и Cerebras Systems запускают Llama API с рекордной скоростью обработки
Дата: 2025-05-01 09:46
Meta* объявила о стратегическом партнёрстве с Cerebras Systems для запуска Llama API — сервиса, который обеспечивает вывод данных ИИ со скоростью до 18 раз выше, чем у традиционных GPU-решений. Анонс сделан на первой конференции для разработчиков LlamaCon и знаменует выход Meta в рынок коммерческого инференса, где доминируют OpenAI, Google и Anthropic. Для компании это первый опыт сотрудничества с гиперскалером, подтверждающий эффективность их wafer-scale чипов.
Тесты Artificial Analysis показали, что система Cerebras обрабатывает свыше 2600 токенов в секунду для модели Llama 4 Scout — в 20 раз быстрее ChatGPT (~130 токенов/с) и на два порядка выше DeepSeek (~25 токенов/с).
Иллюстрация: VentureBeat / Midjourney До сих пор Meta ограничивалась открытым распространением моделей Llama (более 1 млрд загрузок), не предоставляя облачной инфраструктуры. Теперь компания трансформирует их в коммерческий продукт, напрямую конкурируя за рынок токенов. «Разработчики покупают их миллиардами, как инструкции для AI-приложений, — пояснил Джеймс Ванг из Cerebras. — Скорость в 100 токенов/с, как у GPT, подходит для чатов, но неприемлема для многошагового анализа или голосовых систем».
Новый API открывает возможности для приложений, требующих минимальных задержек: интерактивной генерации кода, многоуровневого анализа за секунды вместо минут, голосовых интерфейсов с реакцией в реальном времени. Сервис поддерживает тонкую настройку моделей (начиная с Llama 3.3 8B) и предоставляет инструменты оценки их качества. Meta гарантирует, что данные разработчиков не будут использоваться для обучения собственных моделей, а готовые решения можно переносить на другие платформы — в отличие от закрытых систем конкурентов.
Llama API уже доступен в ограниченном превью. Для подключения разработчикам достаточно в настройках SDK Meta выбрать Cerebras и получить API-ключ. Массовый запуск ожидается в ближайшие месяцы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Компания Astrostrom представила план создания солнечных панелей из реголита и лунной фабрики на солнечной энергии
С момента первых концепций 1970-х годов космическая солнечная энергетика (Space-Based Solar Power, SBSP) оставалась теоретической перспективой из-за гигантских затрат на доставку материалов с Земли. Однако швейцарская компания Astrostrom предложила многоэтапный план, который может изменить правила игры, используя Луну как источник ресурсов. Основная идея заключается в переносе...
Точь-в-точь как настоящие смартфоны, но без начинки. Черные и белые макеты iPhone 17, iPhone 17 Air, iPhone 17 Pro и iPhone 17 Pro Max показали на фото
Качественные фотографии макетов грядущих смартфонов iPhone 17, iPhone 17 Air, iPhone 17 Pro и iPhone 17 Pro Max, которые выставлены в китайских магазинах, опубликовал инсайдер Majin Bu. Фото Majin Bu Согласно утечкам, iPhone 17 Air получит толщину всего 5,5 мм, что сделает его самым тонким смартфоном Apple на данный момент. Устройство получит экран размером 6,9 дюйма с узкой...
Лучше, больше и безумнее, чем раньше: Gearbox показала новый трейлер и много геймплея Borderlands 4
Как и было обещано, в ночь с 30 апреля на 1 мая студия Gearbox Software в рамках специального выпуска презентации State of Play устроила полноценную геймплейную демонстрацию своего амбициозного лутер-шутера Borderlands 4. Источник изображений: Gearbox...
Зонд «Психея» аварийно отключил двигатели — в NASA пока не знают, что случилось
На днях стало известно, что зонд NASA Psyche («Психея») аварийно отключил главные двигатели. Это произошло ещё 1 апреля, но агентство не афишировало проблему до последних дней. В NASA считают, что ситуация далека от критической, однако после середины июня дело может принять неблагоприятный оборот. Источник изображений:...