- Лиза Су раскрыла планы AMD: скорость... (108)
- Ещё один несостоявшийся запуск SpaceX:... (146)
- Не только «роскошный флагман... (197)
- Новые «китайцы» сильно подешевели:... (196)
- После внеплановой остановки двигателей зонда... (205)
- Toyota, Geely и BMW везут в Россию через... (252)
- Аналог Raspberry Pi с поддержкой 16 ГБ... (306)
- Китайская CXMT скоро займёт до 9 % мирового... (254)
- Эта технология будет доминировать ещё до 20... (317)
- В следующем году TSMC может занять до 75 %... (325)
- SpaceX производит десятки тысяч комплектов... (310)
- Более дюжины Renault Arkana российской... (360)
- Илон Маск: Grok 3.5 позволит «переписать... (360)
- Intel массово сократит маркетологов, заменив... (552)
- Китай ужесточит контроль над интернетом с... (373)
- Новая статья: Deltarune — сила в добре.... (685)
Теперь и у Intel есть ускоритель быстрее Nvidia H100. Компания представила Gaudi 3
Дата: 2024-04-10 00:44
Компания Intel представила новое поколение своих ускорителей для ИИ — Gaudi 3. Если точнее, это целая линейка ускорителей, в которую входит сразу несколько моделей.

Gaudi 3 — чиплетный процессор. Для подобного класса продуктов это уже стало нормой. В его конфигурацию входят два основных кристалла и восемь стеков памяти HBM2e, что странно, учитывая, что конкуренты давно перешли на HBM3 и её варианты.

Чип производится по техпроцессу 5 нм на мощностях TSMC, но Intel почему-то не раскрыла количество транзисторов. Зато известно о 128 ГБ памяти с пропускной способностью 3,7 ТБ/с — эта характеристика неизменна, независимо от версии ускорителя. То же касается интерфейса PCIe 5.0 и 96 МБ кеша SRAM с пропускной способностью в 12,8 ТБ/с. TDP топовой версии достигает внушительных 900 Вт, но есть версии на 450 и 600 Вт.

Теперь к производительности. Версия HL-325L, для которой Intel делится данными, имеет производительность в режиме FP8 в 1835 TFLOPS, то есть почти в 2 PFLOPS. Это двое больше, чем у Gaudi 2. В режиме BF16 новинка и вовсе вчетверо быстрее.
Что касается конфигурации самого чипа, Gaudi 2 использует 24 ядра TPC, а Gaudi 3 использует уже два чипа по 32 TPC, которые основаны на архитектуре VLIW.

Ускоритель для ИИ требует масштабируемости. Как и его предшественники, Gaudi3 использует довольно уникальный в этой отрасли подход к портам Ethernet, которые используются в том числе для масштабирования. При скорости 24 × 200 Гбит/с пропускная способность фактически увеличивается вдвое по сравнению с Gaudi 2. Восемь ускорителей искусственного интеллекта обычно встроены в сервер и соединены друг с другом через Ethernet. Именно эти Ethernet-порты теперь используются и для горизонтального масштабирования сначала в стойку или серверный шкаф, затем в небольшой кластер или даже очень большой. Чтобы было понятнее, именно для этой цели Nvidia использует свой известный интерфейс NVlink со скоростью до 1,8 ТБ/с.



Intel, конечно, проводит сравнение Gaudi 3 с Nvidia H100. По чистой производительности в зависимости от задач Gaudi 3 либо немного медленнее, либо ощутимо быстрее, но при этом якобы более чем вдвое энергоэффективнее. Правда, нужно помнить, что Nvidia уже представила поколение Blackwell.
Первые образцы Gaudi 3 будут представлены партнёрам в текущей половине года, но массовые поставки ожидаются только во второй половине.
Подробнее на iXBT
Предыдущие новости
«Работа по проекту Iskra движется с неожиданной пробуксовкой, где её не ждали», «на одном автомобиле пока до 200 дефектов». Инсайдеры рассказали о сложностях в создании Lada Iskra
Инсайдеры паблика Avtograd News раскрыли закулисье проекта Lada Iskra. Оказалось, АвтоВАЗу приходится сталкиваться с большими трудностями в деле подбора поставщиков компонентов. Изображение: Lada «Находят поставщика где-то из Азии, заключают договор, начинают работать, а он бац — и отказывается от контракта. И приходится искать нового поставщика. Поэтому работа по проекту...
Intel, а это действительно должно интересовать потребителей? Компания рассказала о процессорах Lunar Lake, но говорила только о производительности в задачах ИИ
На прошедшем сегодня мероприятии Vision 2024 компания Intel не только представила настольные процессоры Core Ultra поколения Meteor Lake, но и раскрыла подробности о Core Ultra 200V поколения Lunar Lake, которые выйдут в конце текущего года. К сожалению, сегодня Intel сконцентрировалась только на искусственном интеллекте, рассказав, что новые CPU в этих задачах будут втрое...
Аналог Geely Monjaro от Chery окажется дешевле флагмана Geely. Стоимость Jaecoo J8 (Chery Tiggo 9) стартует от 3,8 млн рублей с учетом скидок
Появились новые подробности о кроссовере Jaecoo J8 — так в России называется Chery Tiggo 9. Как сообщают «Китайские автомобили», полноценная премьера машины состоится в будущий понедельник, 15 апреля. Во время официального мероприятия назовут цены. Согласно предварительным данным, стоить машина будет от 4,5 млн рублей, но будут скидки за trade-in и кредит, которые опустят...
Новая статья: Он вам не силикон! Или почему кремний так сложно заменить
Полупроводниковому транзистору вот-вот стукнет восемьдесят, однако на плечах — сегодня в основном кремниевых — этого бодрого старичка по-прежнему уверенно держится едва ли не вся мировая микропроцессорная индустрия. Пока не очень понятно, какой именно материал однажды заменит кремний полностью, но варианты...