- У лимитированной и очень дорогой Asus ROG... (3468)
- Моддер создал самую маленькую PlayStation 1... (3728)
- Вышел первый обзор ПК на двухчиповых... (3765)
- Культовый журнал «Игромания» возвращается... (3366)
- Культовый журнал «Игромания» возвращается... (3574)
- AMD и Intel, похоже, передумали выпускать... (3593)
- Nebius предрекла взрывной рост... (3200)
- Samsung собирает новую команду для... (3680)
- Micron предала потребителей ради ИИ: выпуск... (3529)
- В образцах с астероида Бенну нашли... (2760)
- Asus приостановила поставки дорогущей... (3455)
- «Величие не терпит спешки»: амбициозный мод... (2611)
- Samsung и SK hynix угодили в цугцванг:... (2603)
- «У Microsoft никогда ничего не получается с... (3145)
- Все ИИ-гиганты провалили проверку на... (2624)
- Обновление опять сломало Windows 11 — в этот... (3338)
Гонка токенов: Meta* и Cerebras Systems запускают Llama API с рекордной скоростью обработки
Дата: 2025-05-01 09:46
Meta* объявила о стратегическом партнёрстве с Cerebras Systems для запуска Llama API — сервиса, который обеспечивает вывод данных ИИ со скоростью до 18 раз выше, чем у традиционных GPU-решений. Анонс сделан на первой конференции для разработчиков LlamaCon и знаменует выход Meta в рынок коммерческого инференса, где доминируют OpenAI, Google и Anthropic. Для компании это первый опыт сотрудничества с гиперскалером, подтверждающий эффективность их wafer-scale чипов.
Тесты Artificial Analysis показали, что система Cerebras обрабатывает свыше 2600 токенов в секунду для модели Llama 4 Scout — в 20 раз быстрее ChatGPT (~130 токенов/с) и на два порядка выше DeepSeek (~25 токенов/с).
Иллюстрация: VentureBeat / Midjourney До сих пор Meta ограничивалась открытым распространением моделей Llama (более 1 млрд загрузок), не предоставляя облачной инфраструктуры. Теперь компания трансформирует их в коммерческий продукт, напрямую конкурируя за рынок токенов. «Разработчики покупают их миллиардами, как инструкции для AI-приложений, — пояснил Джеймс Ванг из Cerebras. — Скорость в 100 токенов/с, как у GPT, подходит для чатов, но неприемлема для многошагового анализа или голосовых систем».
Новый API открывает возможности для приложений, требующих минимальных задержек: интерактивной генерации кода, многоуровневого анализа за секунды вместо минут, голосовых интерфейсов с реакцией в реальном времени. Сервис поддерживает тонкую настройку моделей (начиная с Llama 3.3 8B) и предоставляет инструменты оценки их качества. Meta гарантирует, что данные разработчиков не будут использоваться для обучения собственных моделей, а готовые решения можно переносить на другие платформы — в отличие от закрытых систем конкурентов.
Llama API уже доступен в ограниченном превью. Для подключения разработчикам достаточно в настройках SDK Meta выбрать Cerebras и получить API-ключ. Массовый запуск ожидается в ближайшие месяцы.
* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена
Подробнее на iXBT
Предыдущие новости
Компания Astrostrom представила план создания солнечных панелей из реголита и лунной фабрики на солнечной энергии
С момента первых концепций 1970-х годов космическая солнечная энергетика (Space-Based Solar Power, SBSP) оставалась теоретической перспективой из-за гигантских затрат на доставку материалов с Земли. Однако швейцарская компания Astrostrom предложила многоэтапный план, который может изменить правила игры, используя Луну как источник ресурсов. Основная идея заключается в переносе...
Точь-в-точь как настоящие смартфоны, но без начинки. Черные и белые макеты iPhone 17, iPhone 17 Air, iPhone 17 Pro и iPhone 17 Pro Max показали на фото
Качественные фотографии макетов грядущих смартфонов iPhone 17, iPhone 17 Air, iPhone 17 Pro и iPhone 17 Pro Max, которые выставлены в китайских магазинах, опубликовал инсайдер Majin Bu. Фото Majin Bu Согласно утечкам, iPhone 17 Air получит толщину всего 5,5 мм, что сделает его самым тонким смартфоном Apple на данный момент. Устройство получит экран размером 6,9 дюйма с узкой...
Лучше, больше и безумнее, чем раньше: Gearbox показала новый трейлер и много геймплея Borderlands 4
Как и было обещано, в ночь с 30 апреля на 1 мая студия Gearbox Software в рамках специального выпуска презентации State of Play устроила полноценную геймплейную демонстрацию своего амбициозного лутер-шутера Borderlands 4. Источник изображений: Gearbox...
Зонд «Психея» аварийно отключил двигатели — в NASA пока не знают, что случилось
На днях стало известно, что зонд NASA Psyche («Психея») аварийно отключил главные двигатели. Это произошло ещё 1 апреля, но агентство не афишировало проблему до последних дней. В NASA считают, что ситуация далека от критической, однако после середины июня дело может принять неблагоприятный оборот. Источник изображений:...