Добро пожаловать на форум PHP программистов!
За последние 24 часа нас посетили 28900 программистов и 3202 робота. Сейчас ищут 1160 программистов ...
Последние
Популярные

Оказывается, 213 GPU могут работать, как 1192. Alibaba показала, как экономить на ускорителях при работе с большими языковыми моделями

Дата: 2025-10-20 20:56

Задачи, связанные с ИИ, требуют огромных вычислительных мощностей. В частности, специализированных ускорителей или хотя бы GPU. Специалисты Alibaba, похоже, нашли способ в разы снизить количество необходимых графических процессоров. 

Alibaba Cloud рассказала, как её новая система пулов Aegaeon сокращает количество графических процессоров Nvidia, необходимых для обслуживания больших языковых моделей. Если точнее, сокращает на невероятные 82%.  

Создано Grok

Aegaeon — это планировщик времени вывода, разработанный для максимального использования графических процессоров во многих моделях с пиковой или непредсказуемой нагрузкой. Вместо того, чтобы, как обычно, привязывать один ускоритель к одной модели, Aegaeon виртуализирует доступ к графическим процессорам на уровне токенов, позволяя планировать небольшие фрагменты работы в общем пуле.  

С практической точки зрения это означает, что один ускоритель H20 (авторы использовали именно их) может обслуживать несколько различных моделей одновременно, при этом общесистемная полезная производительность увеличивается в девять раз по сравнению со старыми бессерверными системами. 

Система компании тестировалась в производственной среде в течение нескольких месяцев. За это время количество графических процессоров, необходимых для поддержки десятков различных LLM-моделей, объёмом до 72 млрд параметров, сократилось с 1192 до всего 213, то есть в пять с половиной раз. 

Пока неясно, будет ли эта экономия распространяться за пределы стека Alibaba. В документе Alibaba Cloud не указана точная сетевая структура, использованная в бета-тестировании, но известно, что компания предлагает собственную RDMA-сеть eRDMA и имеет опыт создания высокоинтегрированных стеков обслуживания графических процессоров. 



Подробнее на iXBT
 

Предыдущие новости

3Dnews.ru, 2025-10-20 20:07
В России упали продажи портативных колонок — россияне переключаются на умную акустику

В период с июня по август нынешнего года в России было продано около 870 тыс. портативных колонок общей стоимостью свыше 4 млрд рублей. Это на 8 % меньше в натуральном выражении и на 7 % — в денежном по сравнению с аналогичным периодом 2024 года, следует из данных МТС. В компании подсчитали, что лидерами продаж за отчётный период стали устройства малоизвестных китайских...

3Dnews.ru, 2025-10-20 20:33
Вместо Majesty 3: российские разработчики выпустили в Steam амбициозную фэнтезийную стратегию Lessaria: Fantasy Kingdom Sim

Издательство Polden Publishing и разработчики из краснодарской студии Rockbee Team сообщили о выходе амбициозной фэнтезийной стратегии Lessaria: Fantasy Kingdom Sim, которая позиционируется как духовный наследник Majesty. Источник изображений: Polden...

iXBT, 2025-10-20 15:12
Эксперимент: блогер трогала ткань, металл, пластик, дерево и ноутбуки, а нейропсихолог следила за активностью мозга

Накануне старта продаж ноутбука Honor MagicBook Art 14 2025 блогер Ксения Прохорова (Im_ksun) и нейропсихолог Алена Ванченко с помощью датчиков провели тестирование того, как человек эмоционально реагирует на тактильные стимулы. «Подопытная» брала в руки вельвет, шелк, металл, дерево и ноутбуки, включая MagicBook Art 14 2025. Изображение: Honor «Эмоции, рожденные тактильными...

3Dnews.ru, 2025-10-20 19:44
Слухи: Лана Дель Рей исполнит заглавную песню для «Джеймса Бонда», но не в кино, а в игре от создателей Hitman

Популярная американская певица Лана Дель Рей (Lana Del Rey), похоже, получила второй шанс в написании заглавной песни для «Джеймса Бонда». На этот раз, однако, не из мира кино, а видеоигр. Источник изображения: IO...

© 2025 «PHP.RU — Сообщество PHP-Программистов»
Главная | Форум | Реклама на сайте | Контакты VIP Сувениры
Разработка компании ODware