- От 48 до 97 дюймов, сверхъяркий экран Hyper... (1864)
- Alienware готовит игровые ноутбуки с... (1976)
- «Всего» 800 Гц, но зато в Full HD. HKC... (2604)
- Сарафан и босоножки или дублёнка с... (2653)
- ИИ-ускорители Nvidia Feynman могут получить... (2385)
- Новые комплектации официальных Li Auto... (2579)
- Samsung интегрирует Google Photos в свои... (1761)
- Пока все обсуждали цены на память, цены на... (2564)
- Xiaomi 17 Ultra Leica Edition получил... (1793)
- CATL запустит массовое производство... (2416)
- 7000 мАч, IP69 и две 200-мегапиксельные... (2407)
- У обанкротившегося производителя... (2357)
- Мини-ПК с Core Ultra 300 в цвете розового... (1678)
- Одна из самых больших GeForce RTX 5060, при... (1729)
- TSMC не справляется с заказами на 2- и... (1775)
- Microsoft оптимизировала «Проводник» в... (2459)
Nvidia Blackwell ускоряет ИИ в 2,5 раза: новый рекорд производительности в обучении гигантских языковых моделей
Дата: 2025-06-05 09:21
Nvidia объявила о впечатляющих результатах своих новых чипов Blackwell в тестах MLPerf Training v5.0. Архитектура Blackwell, разработанная для удовлетворения растущих требований к производительности современных AI-приложений, продемонстрировала наивысшую производительность во всех бенчмарках, став единственной платформой, представившей результаты по всем тестам. Это особенно впечатляет на самом сложном тесте, ориентированном на большие языковые модели (LLM) — обучении модели Llama 3.1 405B.
Результаты, полученные с использованием двух суперкомпьютеров на базе Blackwell — Tyche и Nyx, а также в сотрудничестве с CoreWeave и IBM (2496 GPU Blackwell и 1248 CPU Nvidia Grace), были тщательно проверены и подтверждены ассоциацией MLCommons, объединяющей более 125 членов и партнёров.
В сравнении с предыдущим поколением архитектуры, Blackwell показал прирост производительности в 2,2 раза на тесте Llama 3.1 405B. На тесте Llama 2 70B LoRA fine-tuning системы Nvidia DGX B200, оснащённые восемью GPU Blackwell, продемонстрировали 2,5-кратное увеличение производительности по сравнению с результатами предыдущего раунда тестирования при использовании того же количества графических процессоров. Такой значительный скачок производительности обусловлен рядом инноваций: жидкостным охлаждением стоек, 13,4 ТБ когерентной памяти на стойку, использованием технологии межсоединения Nvidia NVLink пятого поколения и Nvidia NVLink Switch для масштабирования и сетевой технологии Nvidia Quantum-2 InfiniBand для горизонтального масштабирования. Кроме того, усовершенствования в программном стеке Nvidia NeMo Framework повышают эффективность обучения многомодальных LLM следующего поколения, что важно для вывода на рынок агентивных AI-приложений.
Источник: Nvidia Эти приложения-агенты, способные к рассуждению и решению задач, будут работать в так называемых «AI-фабриках» — центрах обработки данных, оптимизированных для работы с подобными системами. Они будут генерировать ценную информацию, применимую во многих отраслях и академических областях. Платформа Nvidia для центров обработки данных включает в себя GPU, CPU, высокоскоростные сети и обширный набор программного обеспечения, включая библиотеки Nvidia CUDA-X, фреймворк NeMo, Nvidia TensorRT-LLM и Nvidia Dynamo. Такое комплексное решение позволяет организациям ускорить обучение и внедрение моделей, значительно сокращая время выхода на рынок.
Дэйв Сальватор, директор по продуктам ускоренных вычислений в Nvidia, отметил, что компания сосредоточилась на результатах предварительного и последующего обучения, подчеркнув, что это начальный этап инвестиций в ИИ, а получение прибыли начинается на этапе вывода моделей в эксплуатацию. Он также указал на то, что MLPerf является надёжным бенчмарком, гарантирующим объективное сравнение производительности различных систем.
Nvidia планирует дальнейшее повышение производительности Blackwell с помощью программных оптимизаций и адаптации к новым, более сложным задачам. Переход Nvidia от производителя чипов к созданию целых систем, стоек и центров обработки данных, названных «AI-фабриками», позволяет компании предлагать комплексные решения для ускорения развития искусственного интеллекта.
Подробнее на iXBT
Предыдущие новости
Научно-фантастический экшен Pragmata от Capcom выйдет в 2026 году полностью на русском языке
Компания Capcom показала на летней State of Play 2025 трейлер своего научно-фантастического экшена Pragmata, анонсированного ещё пять лет назад. Ролик поближе знакомит геймеров с главным героем и его помощницей, а также окончательно устанавливает окно релиза игры. Источник изображения:...
Китайский прорыв: частная многоразовая ракета Yanxinghe-1 из алюминиево-стальной стали совершила управляемую посадку
29 мая китайский частный космический стартап Space Epoch (Sepoch) успешно провел ключевое испытание своей многоразовой ракеты-носителя Yanxinghe-1. Запуск, состоявшийся на коммерческом космодроме Oriental Spaceport в провинции Шаньдун, длился 125 секунд. Ракета достигла апогея в 2,5 километра, после чего совершила управляемый спуск, повторно запустила двигатели и осуществила...
Совершенно новый Moto Razr с экраном 120 Гц и хорошей камерой. Переосмысление классики под названием Motorola Razr оценили в 580 долларов
Новый телефон Motorola Razr 60 официально поступил в продажу, изначально на индийском рынке. Он доступен для покупки на официальном сайте бренда, Flipkart, Reliance Digital и в основных розничных магазинах. Motorola выпустила Razr 60 в единственной конфигурации с 8 ГБ ОЗУ и 256 ГБ флеш-памяти по цене 49 999 индийских рупий (примерно 580 долларов США). Раскладушку можно...
«Сейчас автомобиль всё больше напоминает смартфон», — в России хотят сделать физические кнопки в машинах обязательными
В России могут появится отдельные требования по оснащению автомобилей минимальным набором физических кнопок для управления основными функциями. Такие предложения были представлены в Общественную палату РФ, о чем пишут «Известия». Заместитель председателя Всероссийского общества автомобилистов Владимир Коробчак отметил, что современные машины часто оснащаются экранами, в...