- Nvidia, а как так вышло? GeForce RTX 5080 не... (1049)
- Lada Largus за 730 тыс., Kia Rio за 1,2 млн... (1191)
- Samsung Galaxy S25 Ultra сравнили с iPhone... (1343)
- Настолько лучше? Samsung Galaxy S25 Ultra... (955)
- Один из самых долговечных кроссоверов Honda... (1072)
- Японский конкурент Lada Largus: в России... (1082)
- За всю историю российского авторынка так... (1012)
- Целую партию новеньких Skoda Karoq привезли... (1102)
- Такой отлично подойдёт для наших дорог и... (871)
- К российским дилерам приехали бюджетные... (1241)
- Lada Niva Bronto начали красить в новый... (1657)
- Это экстремальный универсал BMW M3... (1057)
- «Мы увеличили мощность на 70% и придали... (1002)
- Гигантской объединённой компании Honda,... (1203)
- Самые богатые россияне выбирают не... (1076)
- Большой кроссовер Chevrolet дешевле... (1217)
Одна эта микросхема размером с iPad быстрее второго по мощности суперкомпьютера в мире. Cerebras похвасталась мощью WSE-3
Дата: 2024-11-20 21:59
Исполинские микросхемы Cerebras WSE-3 размером с iPad способны запускать самую быструю на сегодня нейросеть на скорости на порядок выше, чем лучшие облачные серверы на основе GPU.
![](https://www.ixbt.com/img//x780/n1/news/2024/10/3/Cerebras-WSE-3-Wafer-Scale-Engine-Chip-For-AI-_1-1-scaled_large_large.jpg)
Как рассказала компания Cerebras, она запустила клиентскую рабочую нагрузку на новой модели Llama 3.1 405B со скоростью 969 токенов/с, и это новый рекорд для модели Frontier.
Llama 3.1 405B на Cerebras — самая быстрая модель Frontier в мире — в 12 раз быстрее, чем GPT-4o, и в 18 раз быстрее, чем Claude 3.5 Sonnet.
![](https://www.ixbt.com/img//x780/n1/news/2024/10/3/Screenshot_1_2_large.jpg)
Модель была запущена на облачном сервисе Cerebras Inference, который использует те самые гигантские микросхемы WSE-3. Cerebras всегда заявляла, что её сервис Inference является самым быстрым в генерации токенов больших языковых моделей.
Когда он был впервые запущен в августе, было заявлено, что Cerebras Inference примерно в 20 раз быстрее, чем графические процессоры Nvidia, работающие через облачных провайдеров, таких как Amazon Web Services, если оценивать на моделях Llama 3.1 8B и Llama 3.1 70B. Теперь же мы имеем результат на гигантской модели Llama 3.1 405B с 405 млрд параметров.
![](https://www.ixbt.com/img/x257/n1/news/2024/10/3/1-speed_large.png)
![](https://www.ixbt.com/img/x257/n1/news/2024/10/3/2-long-context-speed_large.png)
![](https://www.ixbt.com/img/x257/n1/news/2024/10/3/3-latency_large.png)
Чтобы проиллюстрировать, насколько это быстро, Cerebras поручила своему сервису создать шахматную программу на языке Python. Cerebras Inference справился примерно за 3 секунды, а Fireworks — самый быстрый облачный сервис ИИ, оснащенный графическими процессорами — за 20 секунд.
Также компания похвасталась, что всего лишь одна микросхема WSE-2 превзошла суперкомпьютер Frontier в 768 раз в моделировании молекулярной динамики. А Frontier с 2021 года был самым быстрым суперкомпьютером в мире, и лишь сейчас его сместил El Capitan.
Напомним, Cerebras WSE-3 содержит 4 трлн транзисторов, 900 000 ядер и 44 ГБ памяти с пропускной способностью 21 ПБ/с.
Подробнее на iXBT
Предыдущие новости
Это как если бы Apple после M1 выпустила сразу M3. Следующие платформы Snapdragon X для ПК получат сразу ядра Oryon 3
Компания Qualcomm собирается перепрыгнуть через поколение в своих будущих платформах Snapdragon X для ПК. фото: Qualcomm Как сообщается, второе поколение SoC Snapdragon X будет опираться на процессорные ядра Oryon 3, а не Oryon 2. Последние будут доступны только в мобильных SoC Snapdragon 8 Elite. Вероятно, как раз в 8 Lite Gen 2 в следующем году. Насколько велика разница...
S.T.A.L.K.E.R. 2: Heart of Chornobyl получилась прожорливой. В 4K в режиме Epic желательно иметь RTX 4090, а в Full HD на минимуме подойдёт и RTX 3060 Ti
S.T.A.L.K.E.R. 2: Heart of Chornobyl вышла несколько часов назад на Xbox и ПК. Многие пока только скачивают игру, так как занимает она более 150 ГБ, но ресурс PC Gamer первым опубликовал обзор, посвящённый производительности, а не игре в целом. фото: PCGamer Напомним, игра основана на Unreal Engine 5, хотя разработчики его заметно переработали. Требования у игры достаточно...
Определена точная форма фотона
Новая теория, разработанная исследователями из Университета Бирмингема, впервые позволила определить точную форму отдельного фотона, что может привести к значительным прорывам в квантовой физике и материаловедении. Результаты исследования, опубликованные в Physical Review Letters, предоставляют беспрецедентный уровень детализации о природе фотонов и их взаимодействии с...
Зона снова зовёт: вышла S.T.A.L.K.E.R. 2: Heart of Chornobyl
После 15 лет ожиданий, одной отмены и нескольких переносов студия GSC Game World всё-таки выпустила амбициозный постапокалиптический шутер с открытым миром S.T.A.L.K.E.R. 2: Heart of Chornobyl. Источник изображений: GSC Game