- Спутниковые галактики вокруг Андромеды... (139)
- Российский Kia Rio X под отечественным... (165)
- Doom запустили на коробке от коллекционного... (148)
- В Книгу рекордов Гиннесса попал... (135)
- AR-очки Google на платформе Android XR... (126)
- Perseverance бьет рекорды, исследуя кратер... (143)
- Perseverance бьет рекорды, исследуя кратер... (128)
- Ученые объявили РОС ключом к колонизации... (145)
- Представлен портативный кассетный магнитофон... (127)
- Ученые ищут внеземной разум с помощью... (120)
- Кости мышей в невесомости стали как сыр,... (158)
- Китай перестроил рынок чипов, поддержав... (123)
- Розовой Луны не будет ближайшие выходные:... (94)
- Улучшение космических кораблей, модернизация... (110)
- Космические силы США испытают дозаправку... (82)
- SK hynix благодаря спросу на HBM впервые... (101)
Экзафлопсы для генеративного ИИ: Google представила TPU Ironwood для масштабного инференса с рекордной производительностью
Дата: 2025-04-09 21:04
На конференции Next ‘25 в Лас-Вегасе Google анонсировала тензорный процессор Ironwood седьмого поколения — первый в линейке TPU, разработанный исключительно для задач инференса. Устройство, доступное в двух конфигурациях с жидкостным охлаждением (256 и 9 216 чипов), предназначено для поддержки вычислительных нагрузок следующего этапа развития генеративного ИИ.
Каждый чип Ironwood обеспечивает пиковую производительность 4 614 терафлопс. При масштабировании до кластера из 9 216 чипов система достигает 42,5 экзафлопс. По заявлению Google, это более чем в 24 раза превышает мощность суперкомпьютера El Capitan, который демонстрирует 1,742 экзафлопс. Однако сравнение требует уточнения: El Capitan измеряет производительность в стандарте FP64 (двойная точность), тогда как Ironwood использует FP8 (8-битные вычисления) — общепринятый метод оценки для ИИ-систем. При этом, FP64 требует значительно больше ресурсов для выполнения операций.

Новое поколение TPU также выделяется улучшенными характеристиками памяти: каждый чип оснащён 192 ГБ высокоскоростной памяти HBM с пропускной способностью 7,4 Тбит/с, что в 6 раз превышает показатели шестого поколения Trillium. Межчиповое соединение Inter-Chip Interconnect (ICI) обеспечивает 1,2 Тбит/с при двунаправленной передаче — на 50% больше, чем у предшественника. По словам Амина Вахдата, вице-президента Google по машинному обучению, Ironwood демонстрирует почти 30-кратный рост энергоэффективности по сравнению с первым облачным TPU 2018 года и вдвое превосходит Trillium.
Параллельно с Ironwood Google представила обновления сетевой инфраструктуры: сервисы 400G Cloud Interconnect и Cross-Cloud Interconnect увеличивают пропускную способность в 4 раза относительно предыдущих 100G-решений. Для хранения данных компания анонсировала Hyperdisk Exapool, позволяющий выделять до экзабайта ёмкости на ИИ-кластер, а также Cloud Storage zonal bucket — решение, которое ускоряет случайное чтение данных в 20 раз по сравнению с региональными хранилищами, минимизируя задержки за счёт размещения данных рядом с TPU или GPU.
«Мы создали Ironwood для эпохи, где важны не только данные модели, но и её способность действовать после обучения, — отметил Вахдат. — За последние восемь лет спрос на обучение и обслуживание ИИ-моделей вырос в 100 миллионов раз, и наши инвестиции в TPU помогают задавать новые стандарты».
Подробнее на iXBT
Предыдущие новости
Видимо, для Apple это слишком кардинальное изменение дизайна iPhone для одного поколения. Двухцветны моделей iPhone 17 Pro ожидать не стоит
Смартфоны iPhone 17 Pro и 17 Pro Max, судя по всем утечкам, получат обновлённый дизайн с большим блоком камер. Чуть ли не на всех рендерах эти аппараты рисуют двухцветными, однако в реальности, видимо, этого ждать не стоит. Журналист Bloomberg и инсайдер Марк Гурман сообщает, что старшие новинки Apple действительно получат обновлённый дизайн с точки зрения формы, но развития...
NASA усиливает связь с космосом: в Австралии начали строить новую антенну для лунных миссий и связи с космическими аппаратами за пределами Солнечной системы
19 марта 2024 года комплекс NASA в Канберре (Австралия) отпраздновал 60-летний юбилей, одновременно начав строительство пятой антенны — Deep Space Station 33. Этот шаг усилит глобальную Сеть дальней космической связи (DSN), которая с 1963 года обеспечивает коммуникацию с аппаратами по всей Солнечной системе через три ключевых центра: Голдстоун (Калифорния), Мадрид и Канберра....
Учёные «возродили» мозг умершего композитора: он «продолжает сочинять музыку» спустя четыре года после смерти Элвина Люсье
Американский композитор и пионер экспериментальной музыки Элвин Люсье умер в 2021 году, после чего команда австралийских художников и учёных решила увековечить музыканта, создав упрощённую искусственную копию мозга композитора, который сегодня сочиняет посмертную партитуру прямо на глазах у посетителей художественной галереи Западной Австралии. В 1965 году Элвин Люсье стал...
От облаков к полям: Microsoft приостановила строительство дата-центров в Огайо стоимостью $1 млрд
Корпорация Microsoft объявила о приостановке проекта по созданию трёх кампусов дата-центров в округе Ликинг (штат Огайо), который оценивался в $1 млрд. Решение затрагивает объекты в Нью-Олбани, Хите и Хеброне, анонсированные в октябре 2024 года. Это стало очередным шагом в череде аналогичных отмен: ранее компания сократила проекты суммарной мощностью 2 ГВт в США, Европе,...