- Microsoft вступила в гонку за покупку... (1182)
- Смартфон, который не боится падений, со... (1272)
- Гоночная Lada Iskra со 173-сильным мотором... (1153)
- «Надеемся завершить к 2030 году», — в России... (1109)
- «Автотор» намеревается и дальше выпускать... (1261)
- Так выглядит Lada Iskra SW: опубликовано... (1547)
- «Каждый спутник станет глазами, ушами или... (1609)
- Видеокарты и процессоры могут резко... (1169)
- Российский рамный внедорожник с корнями... (1181)
- Россияне покупали Renault, чтобы вообще не... (1296)
- 560 л.с., новые коробка передач, раздаточная... (1570)
- Haval Jolion, Geely Monjaro, Chery Tiggo 7... (1504)
- X на грани? Илон Маск опровергает сообщения... (1323)
- В чате «ВКонтакте» теперь можно писать... (1982)
- Учёные создали робота-медузу и робота-червя... (1233)
- В «Яндекс Путешествиях» появилась «копилка»... (1413)
Одна эта микросхема размером с iPad быстрее второго по мощности суперкомпьютера в мире. Cerebras похвасталась мощью WSE-3
Дата: 2024-11-20 21:59
Исполинские микросхемы Cerebras WSE-3 размером с iPad способны запускать самую быструю на сегодня нейросеть на скорости на порядок выше, чем лучшие облачные серверы на основе GPU.
![](https://www.ixbt.com/img//x780/n1/news/2024/10/3/Cerebras-WSE-3-Wafer-Scale-Engine-Chip-For-AI-_1-1-scaled_large_large.jpg)
Как рассказала компания Cerebras, она запустила клиентскую рабочую нагрузку на новой модели Llama 3.1 405B со скоростью 969 токенов/с, и это новый рекорд для модели Frontier.
Llama 3.1 405B на Cerebras — самая быстрая модель Frontier в мире — в 12 раз быстрее, чем GPT-4o, и в 18 раз быстрее, чем Claude 3.5 Sonnet.
![](https://www.ixbt.com/img//x780/n1/news/2024/10/3/Screenshot_1_2_large.jpg)
Модель была запущена на облачном сервисе Cerebras Inference, который использует те самые гигантские микросхемы WSE-3. Cerebras всегда заявляла, что её сервис Inference является самым быстрым в генерации токенов больших языковых моделей.
Когда он был впервые запущен в августе, было заявлено, что Cerebras Inference примерно в 20 раз быстрее, чем графические процессоры Nvidia, работающие через облачных провайдеров, таких как Amazon Web Services, если оценивать на моделях Llama 3.1 8B и Llama 3.1 70B. Теперь же мы имеем результат на гигантской модели Llama 3.1 405B с 405 млрд параметров.
![](https://www.ixbt.com/img/x257/n1/news/2024/10/3/1-speed_large.png)
![](https://www.ixbt.com/img/x257/n1/news/2024/10/3/2-long-context-speed_large.png)
![](https://www.ixbt.com/img/x257/n1/news/2024/10/3/3-latency_large.png)
Чтобы проиллюстрировать, насколько это быстро, Cerebras поручила своему сервису создать шахматную программу на языке Python. Cerebras Inference справился примерно за 3 секунды, а Fireworks — самый быстрый облачный сервис ИИ, оснащенный графическими процессорами — за 20 секунд.
Также компания похвасталась, что всего лишь одна микросхема WSE-2 превзошла суперкомпьютер Frontier в 768 раз в моделировании молекулярной динамики. А Frontier с 2021 года был самым быстрым суперкомпьютером в мире, и лишь сейчас его сместил El Capitan.
Напомним, Cerebras WSE-3 содержит 4 трлн транзисторов, 900 000 ядер и 44 ГБ памяти с пропускной способностью 21 ПБ/с.
Подробнее на iXBT
Предыдущие новости
Это как если бы Apple после M1 выпустила сразу M3. Следующие платформы Snapdragon X для ПК получат сразу ядра Oryon 3
Компания Qualcomm собирается перепрыгнуть через поколение в своих будущих платформах Snapdragon X для ПК. фото: Qualcomm Как сообщается, второе поколение SoC Snapdragon X будет опираться на процессорные ядра Oryon 3, а не Oryon 2. Последние будут доступны только в мобильных SoC Snapdragon 8 Elite. Вероятно, как раз в 8 Lite Gen 2 в следующем году. Насколько велика разница...
S.T.A.L.K.E.R. 2: Heart of Chornobyl получилась прожорливой. В 4K в режиме Epic желательно иметь RTX 4090, а в Full HD на минимуме подойдёт и RTX 3060 Ti
S.T.A.L.K.E.R. 2: Heart of Chornobyl вышла несколько часов назад на Xbox и ПК. Многие пока только скачивают игру, так как занимает она более 150 ГБ, но ресурс PC Gamer первым опубликовал обзор, посвящённый производительности, а не игре в целом. фото: PCGamer Напомним, игра основана на Unreal Engine 5, хотя разработчики его заметно переработали. Требования у игры достаточно...
Определена точная форма фотона
Новая теория, разработанная исследователями из Университета Бирмингема, впервые позволила определить точную форму отдельного фотона, что может привести к значительным прорывам в квантовой физике и материаловедении. Результаты исследования, опубликованные в Physical Review Letters, предоставляют беспрецедентный уровень детализации о природе фотонов и их взаимодействии с...
Зона снова зовёт: вышла S.T.A.L.K.E.R. 2: Heart of Chornobyl
После 15 лет ожиданий, одной отмены и нескольких переносов студия GSC Game World всё-таки выпустила амбициозный постапокалиптический шутер с открытым миром S.T.A.L.K.E.R. 2: Heart of Chornobyl. Источник изображений: GSC Game