- AMD объяснила, почему отложила запуск... (1047)
- AMD объяснила решение отложить запуск серии... (1162)
- Всему виной «отвратительная репутация... (1235)
- Скидка 500 тыс. рублей и комплект шин в... (1355)
- «Рольф» отказался от дилерства Kaiyi, BAIC и... (1552)
- Две «ультры» в одной руке. Samsung Galaxy... (1383)
- Экран 6,2 дюйма Full HD+, 4000 мАч, 25 Вт,... (1448)
- Старая игровая мышь Gigabyte чуть не сожгла... (1520)
- Новая статья: Обзор смартфона HUAWEI nova 13... (1009)
- Европа зачастит на Марс: два ровера ЕКА... (1379)
- Анонсирован ультратонкий флагман Samsung... (1353)
- Samsung S Pen стал заурядным стилусом... (1492)
- YouTube запустила новые эксперименты на... (1600)
- Нелинейное приключение Lost Records: Bloom &... (1421)
- Samsung объявила о разработке очков... (1433)
- Японская компания Astroscale выбрана для... (1552)
Одна эта микросхема размером с iPad быстрее второго по мощности суперкомпьютера в мире. Cerebras похвасталась мощью WSE-3
Дата: 2024-11-20 21:59
Исполинские микросхемы Cerebras WSE-3 размером с iPad способны запускать самую быструю на сегодня нейросеть на скорости на порядок выше, чем лучшие облачные серверы на основе GPU.
![](https://www.ixbt.com/img//x780/n1/news/2024/10/3/Cerebras-WSE-3-Wafer-Scale-Engine-Chip-For-AI-_1-1-scaled_large_large.jpg)
Как рассказала компания Cerebras, она запустила клиентскую рабочую нагрузку на новой модели Llama 3.1 405B со скоростью 969 токенов/с, и это новый рекорд для модели Frontier.
Llama 3.1 405B на Cerebras — самая быстрая модель Frontier в мире — в 12 раз быстрее, чем GPT-4o, и в 18 раз быстрее, чем Claude 3.5 Sonnet.
![](https://www.ixbt.com/img//x780/n1/news/2024/10/3/Screenshot_1_2_large.jpg)
Модель была запущена на облачном сервисе Cerebras Inference, который использует те самые гигантские микросхемы WSE-3. Cerebras всегда заявляла, что её сервис Inference является самым быстрым в генерации токенов больших языковых моделей.
Когда он был впервые запущен в августе, было заявлено, что Cerebras Inference примерно в 20 раз быстрее, чем графические процессоры Nvidia, работающие через облачных провайдеров, таких как Amazon Web Services, если оценивать на моделях Llama 3.1 8B и Llama 3.1 70B. Теперь же мы имеем результат на гигантской модели Llama 3.1 405B с 405 млрд параметров.
![](https://www.ixbt.com/img/x257/n1/news/2024/10/3/1-speed_large.png)
![](https://www.ixbt.com/img/x257/n1/news/2024/10/3/2-long-context-speed_large.png)
![](https://www.ixbt.com/img/x257/n1/news/2024/10/3/3-latency_large.png)
Чтобы проиллюстрировать, насколько это быстро, Cerebras поручила своему сервису создать шахматную программу на языке Python. Cerebras Inference справился примерно за 3 секунды, а Fireworks — самый быстрый облачный сервис ИИ, оснащенный графическими процессорами — за 20 секунд.
Также компания похвасталась, что всего лишь одна микросхема WSE-2 превзошла суперкомпьютер Frontier в 768 раз в моделировании молекулярной динамики. А Frontier с 2021 года был самым быстрым суперкомпьютером в мире, и лишь сейчас его сместил El Capitan.
Напомним, Cerebras WSE-3 содержит 4 трлн транзисторов, 900 000 ядер и 44 ГБ памяти с пропускной способностью 21 ПБ/с.
Подробнее на iXBT
Предыдущие новости
Это как если бы Apple после M1 выпустила сразу M3. Следующие платформы Snapdragon X для ПК получат сразу ядра Oryon 3
Компания Qualcomm собирается перепрыгнуть через поколение в своих будущих платформах Snapdragon X для ПК. фото: Qualcomm Как сообщается, второе поколение SoC Snapdragon X будет опираться на процессорные ядра Oryon 3, а не Oryon 2. Последние будут доступны только в мобильных SoC Snapdragon 8 Elite. Вероятно, как раз в 8 Lite Gen 2 в следующем году. Насколько велика разница...
S.T.A.L.K.E.R. 2: Heart of Chornobyl получилась прожорливой. В 4K в режиме Epic желательно иметь RTX 4090, а в Full HD на минимуме подойдёт и RTX 3060 Ti
S.T.A.L.K.E.R. 2: Heart of Chornobyl вышла несколько часов назад на Xbox и ПК. Многие пока только скачивают игру, так как занимает она более 150 ГБ, но ресурс PC Gamer первым опубликовал обзор, посвящённый производительности, а не игре в целом. фото: PCGamer Напомним, игра основана на Unreal Engine 5, хотя разработчики его заметно переработали. Требования у игры достаточно...
Определена точная форма фотона
Новая теория, разработанная исследователями из Университета Бирмингема, впервые позволила определить точную форму отдельного фотона, что может привести к значительным прорывам в квантовой физике и материаловедении. Результаты исследования, опубликованные в Physical Review Letters, предоставляют беспрецедентный уровень детализации о природе фотонов и их взаимодействии с...
Зона снова зовёт: вышла S.T.A.L.K.E.R. 2: Heart of Chornobyl
После 15 лет ожиданий, одной отмены и нескольких переносов студия GSC Game World всё-таки выпустила амбициозный постапокалиптический шутер с открытым миром S.T.A.L.K.E.R. 2: Heart of Chornobyl. Источник изображений: GSC Game