- Marathon вышла из тени — дата выхода, много... (13)
- Три месяца до Марса: британцы придумали... (12)
- Лазер вместо кулера: стартап Maxwell Labs... (13)
- Смартфон с аккумулятором ёмкостью 7300 мАч,... (34)
- Самый тонкий монстр Samsung. Galaxy M56... (37)
- В Telegram появились групповые звонки на 100... (33)
- Новый лидер полупроводниковой индустрии:... (33)
- Бывший инженер SpaceX бросил вызов... (39)
- 8K пока не имеет смысла? Sony прекращает... (39)
- Молодёжь начинает нервничать, когда заряд... (49)
- Asus ROG Crosshair X870E Extreme — системная... (47)
- Недавно проснувшаяся чёрная дыра показала... (48)
- Подорожание iPhone, видеокарт и прочей... (45)
- «Это как подсказка от Вселенной». Ученые... (48)
- «Представьте, что вы бросили камень в пруд,... (52)
- Американские ученые спрятали платиновые... (53)
Экзафлопсы для генеративного ИИ: Google представила TPU Ironwood для масштабного инференса с рекордной производительностью
Дата: 2025-04-09 21:04
На конференции Next ‘25 в Лас-Вегасе Google анонсировала тензорный процессор Ironwood седьмого поколения — первый в линейке TPU, разработанный исключительно для задач инференса. Устройство, доступное в двух конфигурациях с жидкостным охлаждением (256 и 9 216 чипов), предназначено для поддержки вычислительных нагрузок следующего этапа развития генеративного ИИ.
Каждый чип Ironwood обеспечивает пиковую производительность 4 614 терафлопс. При масштабировании до кластера из 9 216 чипов система достигает 42,5 экзафлопс. По заявлению Google, это более чем в 24 раза превышает мощность суперкомпьютера El Capitan, который демонстрирует 1,742 экзафлопс. Однако сравнение требует уточнения: El Capitan измеряет производительность в стандарте FP64 (двойная точность), тогда как Ironwood использует FP8 (8-битные вычисления) — общепринятый метод оценки для ИИ-систем. При этом, FP64 требует значительно больше ресурсов для выполнения операций.

Новое поколение TPU также выделяется улучшенными характеристиками памяти: каждый чип оснащён 192 ГБ высокоскоростной памяти HBM с пропускной способностью 7,4 Тбит/с, что в 6 раз превышает показатели шестого поколения Trillium. Межчиповое соединение Inter-Chip Interconnect (ICI) обеспечивает 1,2 Тбит/с при двунаправленной передаче — на 50% больше, чем у предшественника. По словам Амина Вахдата, вице-президента Google по машинному обучению, Ironwood демонстрирует почти 30-кратный рост энергоэффективности по сравнению с первым облачным TPU 2018 года и вдвое превосходит Trillium.
Параллельно с Ironwood Google представила обновления сетевой инфраструктуры: сервисы 400G Cloud Interconnect и Cross-Cloud Interconnect увеличивают пропускную способность в 4 раза относительно предыдущих 100G-решений. Для хранения данных компания анонсировала Hyperdisk Exapool, позволяющий выделять до экзабайта ёмкости на ИИ-кластер, а также Cloud Storage zonal bucket — решение, которое ускоряет случайное чтение данных в 20 раз по сравнению с региональными хранилищами, минимизируя задержки за счёт размещения данных рядом с TPU или GPU.
«Мы создали Ironwood для эпохи, где важны не только данные модели, но и её способность действовать после обучения, — отметил Вахдат. — За последние восемь лет спрос на обучение и обслуживание ИИ-моделей вырос в 100 миллионов раз, и наши инвестиции в TPU помогают задавать новые стандарты».
Подробнее на iXBT
Предыдущие новости
Видимо, для Apple это слишком кардинальное изменение дизайна iPhone для одного поколения. Двухцветны моделей iPhone 17 Pro ожидать не стоит
Смартфоны iPhone 17 Pro и 17 Pro Max, судя по всем утечкам, получат обновлённый дизайн с большим блоком камер. Чуть ли не на всех рендерах эти аппараты рисуют двухцветными, однако в реальности, видимо, этого ждать не стоит. Журналист Bloomberg и инсайдер Марк Гурман сообщает, что старшие новинки Apple действительно получат обновлённый дизайн с точки зрения формы, но развития...
NASA усиливает связь с космосом: в Австралии начали строить новую антенну для лунных миссий и связи с космическими аппаратами за пределами Солнечной системы
19 марта 2024 года комплекс NASA в Канберре (Австралия) отпраздновал 60-летний юбилей, одновременно начав строительство пятой антенны — Deep Space Station 33. Этот шаг усилит глобальную Сеть дальней космической связи (DSN), которая с 1963 года обеспечивает коммуникацию с аппаратами по всей Солнечной системе через три ключевых центра: Голдстоун (Калифорния), Мадрид и Канберра....
Учёные «возродили» мозг умершего композитора: он «продолжает сочинять музыку» спустя четыре года после смерти Элвина Люсье
Американский композитор и пионер экспериментальной музыки Элвин Люсье умер в 2021 году, после чего команда австралийских художников и учёных решила увековечить музыканта, создав упрощённую искусственную копию мозга композитора, который сегодня сочиняет посмертную партитуру прямо на глазах у посетителей художественной галереи Западной Австралии. В 1965 году Элвин Люсье стал...
От облаков к полям: Microsoft приостановила строительство дата-центров в Огайо стоимостью $1 млрд
Корпорация Microsoft объявила о приостановке проекта по созданию трёх кампусов дата-центров в округе Ликинг (штат Огайо), который оценивался в $1 млрд. Решение затрагивает объекты в Нью-Олбани, Хите и Хеброне, анонсированные в октябре 2024 года. Это стало очередным шагом в череде аналогичных отмен: ранее компания сократила проекты суммарной мощностью 2 ГВт в США, Европе,...