- Власти США инициировали расследование из-за... (2711)
- Все GeForce RTX 50 раскупили за 20 минут.... (2525)
- Королева всех GeForce RTX 5080. Galax HOF OC... (2827)
- Март будет за AMD? Ожидается, что видеокарты... (2351)
- В России начнётся серийный выпуск... (2670)
- Google предложила сотрудникам подразделения... (2866)
- Орбиту МКС скорректировали перед прилётом... (2418)
- Microsoft организовала подразделение для... (2967)
- Астрономы ошибочно приняли останки... (3060)
- Европейское космическое агентство заключило... (2979)
- Apple открыла доступ к Starlink: акции... (2390)
- 155-сильный мотор и классический «автомат» —... (2790)
- Lada Iskra Sport получила отечественную... (2396)
- SpaceX стала чаще сжигать свои спутники... (2595)
- DeepSeek обещает прорыв в управлении... (2126)
- Сэм Альтман: OpenAI перешла на «неправильную... (2760)
Одна эта микросхема размером с iPad быстрее второго по мощности суперкомпьютера в мире. Cerebras похвасталась мощью WSE-3
Дата: 2024-11-20 21:59
Исполинские микросхемы Cerebras WSE-3 размером с iPad способны запускать самую быструю на сегодня нейросеть на скорости на порядок выше, чем лучшие облачные серверы на основе GPU.

Как рассказала компания Cerebras, она запустила клиентскую рабочую нагрузку на новой модели Llama 3.1 405B со скоростью 969 токенов/с, и это новый рекорд для модели Frontier.
Llama 3.1 405B на Cerebras — самая быстрая модель Frontier в мире — в 12 раз быстрее, чем GPT-4o, и в 18 раз быстрее, чем Claude 3.5 Sonnet.

Модель была запущена на облачном сервисе Cerebras Inference, который использует те самые гигантские микросхемы WSE-3. Cerebras всегда заявляла, что её сервис Inference является самым быстрым в генерации токенов больших языковых моделей.
Когда он был впервые запущен в августе, было заявлено, что Cerebras Inference примерно в 20 раз быстрее, чем графические процессоры Nvidia, работающие через облачных провайдеров, таких как Amazon Web Services, если оценивать на моделях Llama 3.1 8B и Llama 3.1 70B. Теперь же мы имеем результат на гигантской модели Llama 3.1 405B с 405 млрд параметров.



Чтобы проиллюстрировать, насколько это быстро, Cerebras поручила своему сервису создать шахматную программу на языке Python. Cerebras Inference справился примерно за 3 секунды, а Fireworks — самый быстрый облачный сервис ИИ, оснащенный графическими процессорами — за 20 секунд.
Также компания похвасталась, что всего лишь одна микросхема WSE-2 превзошла суперкомпьютер Frontier в 768 раз в моделировании молекулярной динамики. А Frontier с 2021 года был самым быстрым суперкомпьютером в мире, и лишь сейчас его сместил El Capitan.
Напомним, Cerebras WSE-3 содержит 4 трлн транзисторов, 900 000 ядер и 44 ГБ памяти с пропускной способностью 21 ПБ/с.
Подробнее на iXBT
Предыдущие новости
Это как если бы Apple после M1 выпустила сразу M3. Следующие платформы Snapdragon X для ПК получат сразу ядра Oryon 3
Компания Qualcomm собирается перепрыгнуть через поколение в своих будущих платформах Snapdragon X для ПК. фото: Qualcomm Как сообщается, второе поколение SoC Snapdragon X будет опираться на процессорные ядра Oryon 3, а не Oryon 2. Последние будут доступны только в мобильных SoC Snapdragon 8 Elite. Вероятно, как раз в 8 Lite Gen 2 в следующем году. Насколько велика разница...
S.T.A.L.K.E.R. 2: Heart of Chornobyl получилась прожорливой. В 4K в режиме Epic желательно иметь RTX 4090, а в Full HD на минимуме подойдёт и RTX 3060 Ti
S.T.A.L.K.E.R. 2: Heart of Chornobyl вышла несколько часов назад на Xbox и ПК. Многие пока только скачивают игру, так как занимает она более 150 ГБ, но ресурс PC Gamer первым опубликовал обзор, посвящённый производительности, а не игре в целом. фото: PCGamer Напомним, игра основана на Unreal Engine 5, хотя разработчики его заметно переработали. Требования у игры достаточно...
Определена точная форма фотона
Новая теория, разработанная исследователями из Университета Бирмингема, впервые позволила определить точную форму отдельного фотона, что может привести к значительным прорывам в квантовой физике и материаловедении. Результаты исследования, опубликованные в Physical Review Letters, предоставляют беспрецедентный уровень детализации о природе фотонов и их взаимодействии с...
Зона снова зовёт: вышла S.T.A.L.K.E.R. 2: Heart of Chornobyl
После 15 лет ожиданий, одной отмены и нескольких переносов студия GSC Game World всё-таки выпустила амбициозный постапокалиптический шутер с открытым миром S.T.A.L.K.E.R. 2: Heart of Chornobyl. Источник изображений: GSC Game