- Клон Nissan Navara с честным полным приводом... (929)
- 1,2 млрд выброшенных смартфонов в год теперь... (976)
- Razer выпустила Phantom Collection —... (1094)
- Топовая камера 200 Мп, яркий немерцающий... (1382)
- Цены рухнули: новейший кроссовер Jetour X50... (1366)
- Switch 2 с дырками в экране достались... (1116)
- Эти ракеты будут выводить модули Российской... (1782)
- Яркие огненные летящие объекты появились в... (898)
- «Какой салют, это... кометы?». Яркие... (1141)
- Shell бросает вызов перегреву: новая... (873)
- Созданы первые устойчивые к ошибкам фотонные... (1028)
- Китайские полупроводниковые компании Hygon и... (977)
- Акции Microsoft установили новый рекорд... (1084)
- Вот бы нам такие цены: новейший кроссовер... (1099)
- МТС планомерно отключает 3G: процесс уже... (1173)
- Расход менее 5 л на 100 км, запас хода более... (1054)
Rapt AI и AMD сократили настройку GPU-инфраструктуры до 3 минут и увеличили запуск моделей в 10 раз на платформе Instinct
Дата: 2025-03-27 11:48
Компания Rapt AI, разрабатывающая решения для автоматизации AI-нагрузок на GPU, заключила долгосрочное соглашение с AMD. Цель сотрудничества — повысить эффективность управления ресурсами при обучении и запуске AI-моделей на графических процессорах AMD Instinct, включая серии MI300X, MI325X и будущие MI350. Интеграция платформы Rapt AI с оборудованием AMD призвана решить ключевые проблемы отрасли: нерациональное использование вычислительных мощностей, сложности в управлении распределёнными системами и рост затрат на инфраструктуру.
«Современные AI-модели стали настолько сложными и непредсказуемыми, что традиционные методы оптимизации уже не работают, — заявил на пресс-брифинге CEO Rapt AI Чарли Лиминг. — Компании вкладывают десятки миллионов, а иногда миллиарды долларов в GPU-инфраструктуру и команды специалистов, но CFO и CIO всё чаще требуют доказательств окупаемости». По его словам, прорывное решение предложил CTO Rapt AI Анил Равиндранат, разработавший систему мониторинга, которая анализирует нагрузку на оборудование в реальном времени.

Платформа Rapt AI, анонсированная в конце 2023 года, уже внедрена в нескольких компаниях из списка Fortune 100, включая двух крупных облачных провайдеров. Алгоритмы автоматически распределяют задачи между GPU, сокращая время настройки инфраструктуры с девяти часов до трёх минут. Система позволяет увеличить количество запусков моделей в десять раз без роста затрат на вычисления, сокращая общие расходы до 90% — и всё это без модификации кода или участия человека.
«При ручном управлении простаивает до 30% мощностей GPU, — подчеркнул Лиминг. — Наш инструментарий обеспечивает почти 100% утилизацию, что особенно важно для клиентов, запрашивающих поддержку AMD. Их GPU, например MI300X, выделяются огромным объёмом памяти, который критичен для динамичных нагрузок». Платформа Rapt адаптируется к изменениям «на лету», анализируя поведение моделей непосредственно во время выполнения.
Совместное решение автоматически масштабирует ресурсы в зависимости от спроса, увеличивая плотность задач на AMD Instinct и сокращая задержки. Единая платформа поддерживает гибридные среды — локальные и облачные GPU разных производителей. Это избавляет инженеров от ручной настройки и позволяет сосредоточиться на разработке моделей.
В планах партнёров — дальнейшая оптимизация планирования задач, управления памятью и других параметров для подготовки инфраструктуры к будущим вызовам, включая переход к моделям с триллионами параметров к 2026 году.
Согласно прогнозам, к 2027 году до 80% корпоративных AI-проектов будут требовать автоматизации управления ресурсами — и альянс двух компаний позиционирует себя как ответ на этот тренд.
Подробнее на iXBT
Предыдущие новости
Вместо Bosch и Valeo — «Руденск»: АвтоВАЗ, КамАЗ, ПАЗ и ЛиАЗ получат белорусские фары
Белорусский «Руденск» модернизировал производство и готов заместить зарубежных производителей фар (Valeo, Bosch и Hella) для российского автопрома. Фото: Lada ОАО «Руденск», белорусский производитель светотехнической продукции, завершил масштабную модернизацию производства, вложив 12,5 млн белорусских рублей (примерно 319 млн российских). Средства были направлены на...
Xiaomi представила смартфоны Poco F7 Ultra и Poco F7 Pro с флагманскими Snapdragon и дискретными графическими чипами
Компания Xiaomi представила на мероприятии в Сингапуре два смартфона новой серии Poco F7 — Poco F7 Ultra и Poco F7 Pro. Старшая модель получила флагманский процессор последнего поколения Snapdragon 8 Elite, а версия Pro оснащена флагманским чипом предыдущего поколения — Snapdragon 8 Gen 3. Poco F7 Ultra. Источник изображений:...
Основная ступень SLS успешно интегрирована с ускорителями для миссии Artemis 2
В Космическом центре Кеннеди (Флорида, США) завершилась интеграция основной ступени ракеты-носителя Space Launch System (SLS) с боковыми ускорителями — это важный шаг к запуску миссии Artemis 2, запланированному на весну 2026 года. Четыре астронавта впервые с 1972 года облетят Луну на корабле Orion, повторив маршрут беспилотной миссии Artemis 1 в ноябре 2022-го. 23 марта...
В «Яндекс Картах» появилась информация о доступности 900 вокзалов, аэропортов и станций метро
Команда Яндекса объявила о запуске полезного обновления фирменного картографического сервиса. Теперь пользователи «Яндекс Карт» могут проверить, насколько здание доступно для людей с ограниченной мобильностью. Иллюстрация: Яндекс Информация о доступности транспортной организации отображается в ее карточке — нужно открыть ее и найти раздел «Особенности». В нём указано, есть...