- Ещё одна альтернатива платформам NVIDIA —... (287)
- Новая статья: Обзор смартфона realme 15 Pro:... (257)
- Учёные создали кибер-глаз, частично... (398)
- Samsung выпустила недорогой 27-дюймовый... (264)
- iQOO 15 — самый дешевый флагман на... (303)
- Не бит, не крашен, пробег — 8 тысяч... (498)
- Zotac выпустила самый компактный в мире ПК с... (654)
- Акции Apple обновили исторический максимум... (438)
- «Выглядит фантастически, как и в первый... (408)
- Сервисы AWS упали второй раз за день —... (515)
- AMD может оставить любителей мощных iGPU без... (559)
- Календарь релизов 20 – 26 октября: Ninja... (524)
- В Windows сломалась аутентификация по... (472)
- Представлен флагман iQOO 15 с чипом... (497)
- Этот ноутбук легче, чем три iPhone 17 Pro... (547)
- Оказывается, 213 GPU могут работать, как... (637)
Оказывается, 213 GPU могут работать, как 1192. Alibaba показала, как экономить на ускорителях при работе с большими языковыми моделями
Дата: 2025-10-20 20:56
Задачи, связанные с ИИ, требуют огромных вычислительных мощностей. В частности, специализированных ускорителей или хотя бы GPU. Специалисты Alibaba, похоже, нашли способ в разы снизить количество необходимых графических процессоров.
Alibaba Cloud рассказала, как её новая система пулов Aegaeon сокращает количество графических процессоров Nvidia, необходимых для обслуживания больших языковых моделей. Если точнее, сокращает на невероятные 82%.

Aegaeon — это планировщик времени вывода, разработанный для максимального использования графических процессоров во многих моделях с пиковой или непредсказуемой нагрузкой. Вместо того, чтобы, как обычно, привязывать один ускоритель к одной модели, Aegaeon виртуализирует доступ к графическим процессорам на уровне токенов, позволяя планировать небольшие фрагменты работы в общем пуле.
С практической точки зрения это означает, что один ускоритель H20 (авторы использовали именно их) может обслуживать несколько различных моделей одновременно, при этом общесистемная полезная производительность увеличивается в девять раз по сравнению со старыми бессерверными системами.
Система компании тестировалась в производственной среде в течение нескольких месяцев. За это время количество графических процессоров, необходимых для поддержки десятков различных LLM-моделей, объёмом до 72 млрд параметров, сократилось с 1192 до всего 213, то есть в пять с половиной раз.
Пока неясно, будет ли эта экономия распространяться за пределы стека Alibaba. В документе Alibaba Cloud не указана точная сетевая структура, использованная в бета-тестировании, но известно, что компания предлагает собственную RDMA-сеть eRDMA и имеет опыт создания высокоинтегрированных стеков обслуживания графических процессоров.
Подробнее на iXBT
Предыдущие новости
В России упали продажи портативных колонок — россияне переключаются на умную акустику
В период с июня по август нынешнего года в России было продано около 870 тыс. портативных колонок общей стоимостью свыше 4 млрд рублей. Это на 8 % меньше в натуральном выражении и на 7 % — в денежном по сравнению с аналогичным периодом 2024 года, следует из данных МТС. В компании подсчитали, что лидерами продаж за отчётный период стали устройства малоизвестных китайских...
Вместо Majesty 3: российские разработчики выпустили в Steam амбициозную фэнтезийную стратегию Lessaria: Fantasy Kingdom Sim
Издательство Polden Publishing и разработчики из краснодарской студии Rockbee Team сообщили о выходе амбициозной фэнтезийной стратегии Lessaria: Fantasy Kingdom Sim, которая позиционируется как духовный наследник Majesty. Источник изображений: Polden...
Эксперимент: блогер трогала ткань, металл, пластик, дерево и ноутбуки, а нейропсихолог следила за активностью мозга
Накануне старта продаж ноутбука Honor MagicBook Art 14 2025 блогер Ксения Прохорова (Im_ksun) и нейропсихолог Алена Ванченко с помощью датчиков провели тестирование того, как человек эмоционально реагирует на тактильные стимулы. «Подопытная» брала в руки вельвет, шелк, металл, дерево и ноутбуки, включая MagicBook Art 14 2025. Изображение: Honor «Эмоции, рожденные тактильными...
Слухи: Лана Дель Рей исполнит заглавную песню для «Джеймса Бонда», но не в кино, а в игре от создателей Hitman
Популярная американская певица Лана Дель Рей (Lana Del Rey), похоже, получила второй шанс в написании заглавной песни для «Джеймса Бонда». На этот раз, однако, не из мира кино, а видеоигр. Источник изображения: IO...