- Китайские астрономы исследовали аномальную... (2)
- Четыре субземли у звезды Барнарда: первый в... (2)
- Electronic Arts добавила в новую Skate... (2)
- Японская Mazda 3 с автоматом за 1,79 млн... (13)
- Volkswagen сообщил о резком падении прибыли... (12)
- Учёные обнаружили самую маленькую галактику... (25)
- VideoCardz узнали, когда Nvidia представит... (26)
- УАЗы стали более российскими: машины на 96%... (26)
- В Россию привезли партию дешёвых Hyundai... (31)
- С дизайном как у Porsche Cayenne, платформой... (29)
- С дизайном как у Porsche Cayenne, платформой... (40)
- Илон Маск пообещал удвоить выпуск... (43)
- Марс уже близко: Китай создал... (43)
- Проект ALMAGAL представил крупнейший в мире... (41)
- Марс уже близко: Китай создал... (60)
- Из раннего доступа Steam скоро выйдет Vivat... (57)
Cerebras развернёт инфраструктуру на более чем 1000 ускорителей CS-3 в пяти штатах США, Канаде и Франции
Дата: сегодня 10:14
Калифорнийский стартап Cerebras Systems приступил к масштабному развёртыванию своих ускорителей CS-3 для AI-инференса, планируя создать одну из крупнейших инфраструктур в Северной Америке и Европе.
Как сообщили на конференции HumanX AI в Лас-Вегасе, к концу года компания запустит новые дата-центры в Техасе, Миннесоте, Оклахоме и Джорджии, а также первые объекты в Монреале (Канада) и Франции. Из них Cerebras полностью владеет центрами в Оклахома-Сити и Монреале, остальные строятся совместно с облачным подразделением эмиратского холдинга G42.
Самый мощный объект в Миннеаполисе (Миннесота), который заработает во втором квартале 2025 года, будет оснащён 512 ускорителями CS-3, обеспечивающими 64 экзафлопс вычислений в формате FP16. В отличие от большинства AI-суперкомпьютеров, Cerebras использует собственные процессоры размером 46 225 мм2, каждый из которых содержит 4 трлн транзисторов, 900 000 ядер и 44 ГБ SRAM-памяти.

Хотя тысяча CS-3 кажется скромной на фоне сотен тысяч GPU от гигантов вроде Nvidia, каждый такой ускоритель выдаёт 125 петафлопс в разрежённых FP-вычислениях — в 25 раз больше, чем H100, и в 25 раз превосходя Blackwell. Для инференса модели Llama 3.1 70B система Cerebras демонстрирует скорость до 2100 токенов в секунду. Ключевым преимуществом стала пропускная способность памяти — 21 петабайт/с против 3,35 ТБ/с у H100.
Однако основной прирост скорости (до 6×) достигается за счёт спекулятивного декодирования: меньшая модель генерирует черновик ответа, а крупная проверяет его точность. Этот подход важен для «рассуждающих» моделей, таких как DeepSeek-R1 и QwQ, где цепочки размышлений могут занимать тысячи токенов.
Слабым местом Cerebras остаётся ограниченный объём памяти: для работы Llama 3.3 70B в 16-битной точности требуется минимум четыре CS-3, а Llama 3.1 405B — свыше 20 ускорителей. Тем не менее, стартап уже привлёк клиентов вроде Mistral AI, Perplexity и AlphaSense, последний из которых переходит с проприетарных моделей на открытые, работающие на CS-3.
Дополнительный импульс Cerebras получил благодаря интеграции с Hugging Face: через единый API разработчики теперь могут подключаться к его инфраструктуре наряду с SambaNova и Together.ai. Это расширяет доступ к экосистеме, где скорость генерации токенов становится ключевым аргументом в условиях растущего спроса на сложные AI-расчёты.
Подробнее на iXBT
Предыдущие новости
Такого в истории Range Rover ещё не было. Представлен новый Range Rover Sport с 4,4-литровым V8 и особым дизайном
Компания Land Rover представила новую «зимнюю» версию внедорожника Range Rover Sport, за которой наверняка будут охотиться коллекционеры, поскольку тираж составит всего три экземпляра. Фото Land Rover Автомобиль оснащён мотором V8 объёмом 4,4 литра с 48-вольтовым стартер-генератором, которые выдают 635 л.с. и 750 Нм крутящего момента. Стоимость такого Range Rover Sport...
Доставка «по клику» в «Яндекс Маркете» заработала в 11 городах
Команда «Яндекс Маркета» сообщила о запуске полезного сервиса в маркетплейсе с большим охватом. Покупатели из 11 городов России теперь могут попросить курьера «Яндекс Лавки» привезти их заказ «по клику» из пункта выдачи заказов. Иллюстрация: Яндекс К такой посылке можно добавить продукты и другие товары из «Яндекс Лавки». Оформить доставку «по клику» из ПВЗ можно в часы...
Не получается: новый УАЗ «Патриот» 2025 не порадует «автоматом». Такую коробку ждут не раньше 2026 года
Гендиректор завода Алексей Спирин намекнул, что автоматическая коробка передач вернётся на «Патриот» не раньше 2026 года. 6-ступенчатый американский автомат Punch Powerglide 6L50 начали устанавливать на «Патриот» с 2019 года, но 2022 году поставки прекратились. Это была лицензионная копия коробки от GM. Фото УАЗ Да, в планах действительно есть появление такого типа...
Дешёвых Nvidia GeForce RTX 5050 за 200-250 долларов пока нет в продаже, но скоро купить новинку можно будет в мобильном виде
Желающие получить GeForce RTX 5050 в скором времени смогут сделать это, поскольку французский магазин pc21.fr анонсировал новый ноутбук линейки MSI VenturePro. Ноутбук оснащен процессором Intel Core 7 240H (семейство Raptor Lake-H, 6P4E) и мобильной видеокартой RTX 5050 Laptop с 8 ГБ памяти GDDR7. Этот ноутбук 16-дюймовым экраном OLED-дисплеем с разрешением 2048 х 1280...