- Amazon представила Nova Act — ИИ-агенты для... (40)
- Дешевле «китайцев»: в России нашли Toyota... (25)
- Метановые облака и полярная дымка: ученые... (36)
- Blue Origin выяснила, почему потеряла... (23)
- Глава FOODiQ Global рассказала о грибах,... (28)
- Астронавты первого пилотируемого полета над... (25)
- Первый пилотируемый полет над полюсами Земли... (33)
- Британка случайно выбросила биткоин-кошелёк... (23)
- Неудачный старт CoreWeave на бирже пошатнул... (34)
- Прорыв в химии: новый катализатор на основе... (33)
- Исследователи из США создали акустическую... (26)
- Hubble запечатлел звёздную колыбель в Малом... (115)
- Мощнейшие магнитные бури будут трясти Россию... (20)
- Метеозависимые приготовились. Мощнейшие... (29)
- Ученые обнаружили механизм самоуничтожения... (25)
- Geely обрушила стоимость семейного... (35)
Rapt AI и AMD сократили настройку GPU-инфраструктуры до 3 минут и увеличили запуск моделей в 10 раз на платформе Instinct
Дата: 2025-03-27 11:48
Компания Rapt AI, разрабатывающая решения для автоматизации AI-нагрузок на GPU, заключила долгосрочное соглашение с AMD. Цель сотрудничества — повысить эффективность управления ресурсами при обучении и запуске AI-моделей на графических процессорах AMD Instinct, включая серии MI300X, MI325X и будущие MI350. Интеграция платформы Rapt AI с оборудованием AMD призвана решить ключевые проблемы отрасли: нерациональное использование вычислительных мощностей, сложности в управлении распределёнными системами и рост затрат на инфраструктуру.
«Современные AI-модели стали настолько сложными и непредсказуемыми, что традиционные методы оптимизации уже не работают, — заявил на пресс-брифинге CEO Rapt AI Чарли Лиминг. — Компании вкладывают десятки миллионов, а иногда миллиарды долларов в GPU-инфраструктуру и команды специалистов, но CFO и CIO всё чаще требуют доказательств окупаемости». По его словам, прорывное решение предложил CTO Rapt AI Анил Равиндранат, разработавший систему мониторинга, которая анализирует нагрузку на оборудование в реальном времени.

Платформа Rapt AI, анонсированная в конце 2023 года, уже внедрена в нескольких компаниях из списка Fortune 100, включая двух крупных облачных провайдеров. Алгоритмы автоматически распределяют задачи между GPU, сокращая время настройки инфраструктуры с девяти часов до трёх минут. Система позволяет увеличить количество запусков моделей в десять раз без роста затрат на вычисления, сокращая общие расходы до 90% — и всё это без модификации кода или участия человека.
«При ручном управлении простаивает до 30% мощностей GPU, — подчеркнул Лиминг. — Наш инструментарий обеспечивает почти 100% утилизацию, что особенно важно для клиентов, запрашивающих поддержку AMD. Их GPU, например MI300X, выделяются огромным объёмом памяти, который критичен для динамичных нагрузок». Платформа Rapt адаптируется к изменениям «на лету», анализируя поведение моделей непосредственно во время выполнения.
Совместное решение автоматически масштабирует ресурсы в зависимости от спроса, увеличивая плотность задач на AMD Instinct и сокращая задержки. Единая платформа поддерживает гибридные среды — локальные и облачные GPU разных производителей. Это избавляет инженеров от ручной настройки и позволяет сосредоточиться на разработке моделей.
В планах партнёров — дальнейшая оптимизация планирования задач, управления памятью и других параметров для подготовки инфраструктуры к будущим вызовам, включая переход к моделям с триллионами параметров к 2026 году.
Согласно прогнозам, к 2027 году до 80% корпоративных AI-проектов будут требовать автоматизации управления ресурсами — и альянс двух компаний позиционирует себя как ответ на этот тренд.
Подробнее на iXBT
Предыдущие новости
Вместо Bosch и Valeo — «Руденск»: АвтоВАЗ, КамАЗ, ПАЗ и ЛиАЗ получат белорусские фары
Белорусский «Руденск» модернизировал производство и готов заместить зарубежных производителей фар (Valeo, Bosch и Hella) для российского автопрома. Фото: Lada ОАО «Руденск», белорусский производитель светотехнической продукции, завершил масштабную модернизацию производства, вложив 12,5 млн белорусских рублей (примерно 319 млн российских). Средства были направлены на...
Xiaomi представила смартфоны Poco F7 Ultra и Poco F7 Pro с флагманскими Snapdragon и дискретными графическими чипами
Компания Xiaomi представила на мероприятии в Сингапуре два смартфона новой серии Poco F7 — Poco F7 Ultra и Poco F7 Pro. Старшая модель получила флагманский процессор последнего поколения Snapdragon 8 Elite, а версия Pro оснащена флагманским чипом предыдущего поколения — Snapdragon 8 Gen 3. Poco F7 Ultra. Источник изображений:...
Основная ступень SLS успешно интегрирована с ускорителями для миссии Artemis 2
В Космическом центре Кеннеди (Флорида, США) завершилась интеграция основной ступени ракеты-носителя Space Launch System (SLS) с боковыми ускорителями — это важный шаг к запуску миссии Artemis 2, запланированному на весну 2026 года. Четыре астронавта впервые с 1972 года облетят Луну на корабле Orion, повторив маршрут беспилотной миссии Artemis 1 в ноябре 2022-го. 23 марта...
В «Яндекс Картах» появилась информация о доступности 900 вокзалов, аэропортов и станций метро
Команда Яндекса объявила о запуске полезного обновления фирменного картографического сервиса. Теперь пользователи «Яндекс Карт» могут проверить, насколько здание доступно для людей с ограниченной мобильностью. Иллюстрация: Яндекс Информация о доступности транспортной организации отображается в ее карточке — нужно открыть ее и найти раздел «Особенности». В нём указано, есть...