- Corsair представила сверхбыстрый внешний SSD... (1352)
- Такого в России ещё не было: первая... (1963)
- Подскочившие цены уронили продажи... (958)
- OpenAI наняла руководителя цепочки поставок... (1134)
- Вышла первая публичная бета-версия Android... (907)
- Новые Chevrolet дешевле «пустой» Lada Vesta.... (1070)
- В Рунете — новый (986)
- В России снова наблюдаются массовые проблемы... (932)
- Lada Aura — в феврале, Lada Iskra — в мае.... (1195)
- В России представили уникальную версию... (1049)
- В России представили уникальные версии... (1061)
- Сверхпопулярный в России Jetour Dashing... (1014)
- Выходцы из ZA/UM анонсировали смесь Disco... (957)
- В России снова наблюдаются массовые проблемы... (999)
- Perplexity выпустила более функциональный... (892)
- «Россияне не должны нести такие риски», — на... (896)
Одна эта микросхема размером с iPad быстрее второго по мощности суперкомпьютера в мире. Cerebras похвасталась мощью WSE-3
Дата: 2024-11-20 21:59
Исполинские микросхемы Cerebras WSE-3 размером с iPad способны запускать самую быструю на сегодня нейросеть на скорости на порядок выше, чем лучшие облачные серверы на основе GPU.
![](https://www.ixbt.com/img//x780/n1/news/2024/10/3/Cerebras-WSE-3-Wafer-Scale-Engine-Chip-For-AI-_1-1-scaled_large_large.jpg)
Как рассказала компания Cerebras, она запустила клиентскую рабочую нагрузку на новой модели Llama 3.1 405B со скоростью 969 токенов/с, и это новый рекорд для модели Frontier.
Llama 3.1 405B на Cerebras — самая быстрая модель Frontier в мире — в 12 раз быстрее, чем GPT-4o, и в 18 раз быстрее, чем Claude 3.5 Sonnet.
![](https://www.ixbt.com/img//x780/n1/news/2024/10/3/Screenshot_1_2_large.jpg)
Модель была запущена на облачном сервисе Cerebras Inference, который использует те самые гигантские микросхемы WSE-3. Cerebras всегда заявляла, что её сервис Inference является самым быстрым в генерации токенов больших языковых моделей.
Когда он был впервые запущен в августе, было заявлено, что Cerebras Inference примерно в 20 раз быстрее, чем графические процессоры Nvidia, работающие через облачных провайдеров, таких как Amazon Web Services, если оценивать на моделях Llama 3.1 8B и Llama 3.1 70B. Теперь же мы имеем результат на гигантской модели Llama 3.1 405B с 405 млрд параметров.
![](https://www.ixbt.com/img/x257/n1/news/2024/10/3/1-speed_large.png)
![](https://www.ixbt.com/img/x257/n1/news/2024/10/3/2-long-context-speed_large.png)
![](https://www.ixbt.com/img/x257/n1/news/2024/10/3/3-latency_large.png)
Чтобы проиллюстрировать, насколько это быстро, Cerebras поручила своему сервису создать шахматную программу на языке Python. Cerebras Inference справился примерно за 3 секунды, а Fireworks — самый быстрый облачный сервис ИИ, оснащенный графическими процессорами — за 20 секунд.
Также компания похвасталась, что всего лишь одна микросхема WSE-2 превзошла суперкомпьютер Frontier в 768 раз в моделировании молекулярной динамики. А Frontier с 2021 года был самым быстрым суперкомпьютером в мире, и лишь сейчас его сместил El Capitan.
Напомним, Cerebras WSE-3 содержит 4 трлн транзисторов, 900 000 ядер и 44 ГБ памяти с пропускной способностью 21 ПБ/с.
Подробнее на iXBT
Предыдущие новости
Это как если бы Apple после M1 выпустила сразу M3. Следующие платформы Snapdragon X для ПК получат сразу ядра Oryon 3
Компания Qualcomm собирается перепрыгнуть через поколение в своих будущих платформах Snapdragon X для ПК. фото: Qualcomm Как сообщается, второе поколение SoC Snapdragon X будет опираться на процессорные ядра Oryon 3, а не Oryon 2. Последние будут доступны только в мобильных SoC Snapdragon 8 Elite. Вероятно, как раз в 8 Lite Gen 2 в следующем году. Насколько велика разница...
S.T.A.L.K.E.R. 2: Heart of Chornobyl получилась прожорливой. В 4K в режиме Epic желательно иметь RTX 4090, а в Full HD на минимуме подойдёт и RTX 3060 Ti
S.T.A.L.K.E.R. 2: Heart of Chornobyl вышла несколько часов назад на Xbox и ПК. Многие пока только скачивают игру, так как занимает она более 150 ГБ, но ресурс PC Gamer первым опубликовал обзор, посвящённый производительности, а не игре в целом. фото: PCGamer Напомним, игра основана на Unreal Engine 5, хотя разработчики его заметно переработали. Требования у игры достаточно...
Определена точная форма фотона
Новая теория, разработанная исследователями из Университета Бирмингема, впервые позволила определить точную форму отдельного фотона, что может привести к значительным прорывам в квантовой физике и материаловедении. Результаты исследования, опубликованные в Physical Review Letters, предоставляют беспрецедентный уровень детализации о природе фотонов и их взаимодействии с...
Зона снова зовёт: вышла S.T.A.L.K.E.R. 2: Heart of Chornobyl
После 15 лет ожиданий, одной отмены и нескольких переносов студия GSC Game World всё-таки выпустила амбициозный постапокалиптический шутер с открытым миром S.T.A.L.K.E.R. 2: Heart of Chornobyl. Источник изображений: GSC Game