- Дефицит оперативной памяти выходит из-под... (406)
- Huawei представила четыре флагмана Mate 80 —... (758)
- Китай запустил первую в своей истории... (894)
- Российскому интернету грозит «помутнение»:... (433)
- «"Герои" — для всех»: разработчики Heroes of... (411)
- Сооснователь Google Ларри Пейдж стал вторым... (412)
- Крупные американские страховщики требуют... (404)
- Anthropic бросает вызов Gemini 3:... (450)
- Honor представила смарт-часы Watch X5 в... (486)
- Россияне стали реже менять смартфоны и всё... (447)
- Новая статья: Тестируем DDR5-6000 CL26 —... (416)
- Новая статья: Обзор и тестирование корпуса... (418)
- Amazon показала антенну Leo Ultra для... (424)
- Маск ударил по фабрикам троллей: X начала... (457)
- Представлены Honor 500 и Honor 500 Pro —... (454)
- 8000 мА·ч, зарядка 100 Вт и впервые... (619)
Экзафлопсы для генеративного ИИ: Google представила TPU Ironwood для масштабного инференса с рекордной производительностью
Дата: 2025-04-09 21:04
На конференции Next ‘25 в Лас-Вегасе Google анонсировала тензорный процессор Ironwood седьмого поколения — первый в линейке TPU, разработанный исключительно для задач инференса. Устройство, доступное в двух конфигурациях с жидкостным охлаждением (256 и 9 216 чипов), предназначено для поддержки вычислительных нагрузок следующего этапа развития генеративного ИИ.
Каждый чип Ironwood обеспечивает пиковую производительность 4 614 терафлопс. При масштабировании до кластера из 9 216 чипов система достигает 42,5 экзафлопс. По заявлению Google, это более чем в 24 раза превышает мощность суперкомпьютера El Capitan, который демонстрирует 1,742 экзафлопс. Однако сравнение требует уточнения: El Capitan измеряет производительность в стандарте FP64 (двойная точность), тогда как Ironwood использует FP8 (8-битные вычисления) — общепринятый метод оценки для ИИ-систем. При этом, FP64 требует значительно больше ресурсов для выполнения операций.
Google Ironwood TPU. Источник: Google Новое поколение TPU также выделяется улучшенными характеристиками памяти: каждый чип оснащён 192 ГБ высокоскоростной памяти HBM с пропускной способностью 7,4 Тбит/с, что в 6 раз превышает показатели шестого поколения Trillium. Межчиповое соединение Inter-Chip Interconnect (ICI) обеспечивает 1,2 Тбит/с при двунаправленной передаче — на 50% больше, чем у предшественника. По словам Амина Вахдата, вице-президента Google по машинному обучению, Ironwood демонстрирует почти 30-кратный рост энергоэффективности по сравнению с первым облачным TPU 2018 года и вдвое превосходит Trillium.
Параллельно с Ironwood Google представила обновления сетевой инфраструктуры: сервисы 400G Cloud Interconnect и Cross-Cloud Interconnect увеличивают пропускную способность в 4 раза относительно предыдущих 100G-решений. Для хранения данных компания анонсировала Hyperdisk Exapool, позволяющий выделять до экзабайта ёмкости на ИИ-кластер, а также Cloud Storage zonal bucket — решение, которое ускоряет случайное чтение данных в 20 раз по сравнению с региональными хранилищами, минимизируя задержки за счёт размещения данных рядом с TPU или GPU.
«Мы создали Ironwood для эпохи, где важны не только данные модели, но и её способность действовать после обучения, — отметил Вахдат. — За последние восемь лет спрос на обучение и обслуживание ИИ-моделей вырос в 100 миллионов раз, и наши инвестиции в TPU помогают задавать новые стандарты».
Подробнее на iXBT
Предыдущие новости
Видимо, для Apple это слишком кардинальное изменение дизайна iPhone для одного поколения. Двухцветны моделей iPhone 17 Pro ожидать не стоит
Смартфоны iPhone 17 Pro и 17 Pro Max, судя по всем утечкам, получат обновлённый дизайн с большим блоком камер. Чуть ли не на всех рендерах эти аппараты рисуют двухцветными, однако в реальности, видимо, этого ждать не стоит. Журналист Bloomberg и инсайдер Марк Гурман сообщает, что старшие новинки Apple действительно получат обновлённый дизайн с точки зрения формы, но развития...
NASA усиливает связь с космосом: в Австралии начали строить новую антенну для лунных миссий и связи с космическими аппаратами за пределами Солнечной системы
19 марта 2024 года комплекс NASA в Канберре (Австралия) отпраздновал 60-летний юбилей, одновременно начав строительство пятой антенны — Deep Space Station 33. Этот шаг усилит глобальную Сеть дальней космической связи (DSN), которая с 1963 года обеспечивает коммуникацию с аппаратами по всей Солнечной системе через три ключевых центра: Голдстоун (Калифорния), Мадрид и Канберра....
Учёные «возродили» мозг умершего композитора: он «продолжает сочинять музыку» спустя четыре года после смерти Элвина Люсье
Американский композитор и пионер экспериментальной музыки Элвин Люсье умер в 2021 году, после чего команда австралийских художников и учёных решила увековечить музыканта, создав упрощённую искусственную копию мозга композитора, который сегодня сочиняет посмертную партитуру прямо на глазах у посетителей художественной галереи Западной Австралии. В 1965 году Элвин Люсье стал...
От облаков к полям: Microsoft приостановила строительство дата-центров в Огайо стоимостью $1 млрд
Корпорация Microsoft объявила о приостановке проекта по созданию трёх кампусов дата-центров в округе Ликинг (штат Огайо), который оценивался в $1 млрд. Решение затрагивает объекты в Нью-Олбани, Хите и Хеброне, анонсированные в октябре 2024 года. Это стало очередным шагом в череде аналогичных отмен: ранее компания сократила проекты суммарной мощностью 2 ГВт в США, Европе,...