- M**a запустила онлайн-переводы и другие... (982)
- Минфин и ЦБ РФ запустят криптобиржу для... (950)
- AMD подтвердила участие в Computex 2025 —... (902)
- «Возвращает легенду в строй»:... (965)
- Герои не нашего времени: Ubisoft... (893)
- Суперфлагман по суперцене. Представлен Honor... (1069)
- В WhatsApp теперь можно запретить экспорт... (928)
- Honor представила фитнес-браслет Band 10 за... (814)
- Google и X могут стать следующими целями для... (946)
- Honor представила фитнес-брасле Band 10 за... (807)
- У крупных дилеров — 3,5 млн рублей, на... (821)
- Будущее космических технологий: Россия... (908)
- YouTube поменял дизайн видеоплеера впервые... (895)
- Экспериментальное электронное производство:... (912)
- Samsung уже готовит One UI 8.5 на Android 16... (863)
- Дроны против молний: в Японии нашли замену... (805)
Rapt AI и AMD сократили настройку GPU-инфраструктуры до 3 минут и увеличили запуск моделей в 10 раз на платформе Instinct
Дата: 2025-03-27 11:48
Компания Rapt AI, разрабатывающая решения для автоматизации AI-нагрузок на GPU, заключила долгосрочное соглашение с AMD. Цель сотрудничества — повысить эффективность управления ресурсами при обучении и запуске AI-моделей на графических процессорах AMD Instinct, включая серии MI300X, MI325X и будущие MI350. Интеграция платформы Rapt AI с оборудованием AMD призвана решить ключевые проблемы отрасли: нерациональное использование вычислительных мощностей, сложности в управлении распределёнными системами и рост затрат на инфраструктуру.
«Современные AI-модели стали настолько сложными и непредсказуемыми, что традиционные методы оптимизации уже не работают, — заявил на пресс-брифинге CEO Rapt AI Чарли Лиминг. — Компании вкладывают десятки миллионов, а иногда миллиарды долларов в GPU-инфраструктуру и команды специалистов, но CFO и CIO всё чаще требуют доказательств окупаемости». По его словам, прорывное решение предложил CTO Rapt AI Анил Равиндранат, разработавший систему мониторинга, которая анализирует нагрузку на оборудование в реальном времени.

Платформа Rapt AI, анонсированная в конце 2023 года, уже внедрена в нескольких компаниях из списка Fortune 100, включая двух крупных облачных провайдеров. Алгоритмы автоматически распределяют задачи между GPU, сокращая время настройки инфраструктуры с девяти часов до трёх минут. Система позволяет увеличить количество запусков моделей в десять раз без роста затрат на вычисления, сокращая общие расходы до 90% — и всё это без модификации кода или участия человека.
«При ручном управлении простаивает до 30% мощностей GPU, — подчеркнул Лиминг. — Наш инструментарий обеспечивает почти 100% утилизацию, что особенно важно для клиентов, запрашивающих поддержку AMD. Их GPU, например MI300X, выделяются огромным объёмом памяти, который критичен для динамичных нагрузок». Платформа Rapt адаптируется к изменениям «на лету», анализируя поведение моделей непосредственно во время выполнения.
Совместное решение автоматически масштабирует ресурсы в зависимости от спроса, увеличивая плотность задач на AMD Instinct и сокращая задержки. Единая платформа поддерживает гибридные среды — локальные и облачные GPU разных производителей. Это избавляет инженеров от ручной настройки и позволяет сосредоточиться на разработке моделей.
В планах партнёров — дальнейшая оптимизация планирования задач, управления памятью и других параметров для подготовки инфраструктуры к будущим вызовам, включая переход к моделям с триллионами параметров к 2026 году.
Согласно прогнозам, к 2027 году до 80% корпоративных AI-проектов будут требовать автоматизации управления ресурсами — и альянс двух компаний позиционирует себя как ответ на этот тренд.
Подробнее на iXBT
Предыдущие новости
Вместо Bosch и Valeo — «Руденск»: АвтоВАЗ, КамАЗ, ПАЗ и ЛиАЗ получат белорусские фары
Белорусский «Руденск» модернизировал производство и готов заместить зарубежных производителей фар (Valeo, Bosch и Hella) для российского автопрома. Фото: Lada ОАО «Руденск», белорусский производитель светотехнической продукции, завершил масштабную модернизацию производства, вложив 12,5 млн белорусских рублей (примерно 319 млн российских). Средства были направлены на...
Xiaomi представила смартфоны Poco F7 Ultra и Poco F7 Pro с флагманскими Snapdragon и дискретными графическими чипами
Компания Xiaomi представила на мероприятии в Сингапуре два смартфона новой серии Poco F7 — Poco F7 Ultra и Poco F7 Pro. Старшая модель получила флагманский процессор последнего поколения Snapdragon 8 Elite, а версия Pro оснащена флагманским чипом предыдущего поколения — Snapdragon 8 Gen 3. Poco F7 Ultra. Источник изображений:...
Основная ступень SLS успешно интегрирована с ускорителями для миссии Artemis 2
В Космическом центре Кеннеди (Флорида, США) завершилась интеграция основной ступени ракеты-носителя Space Launch System (SLS) с боковыми ускорителями — это важный шаг к запуску миссии Artemis 2, запланированному на весну 2026 года. Четыре астронавта впервые с 1972 года облетят Луну на корабле Orion, повторив маршрут беспилотной миссии Artemis 1 в ноябре 2022-го. 23 марта...
В «Яндекс Картах» появилась информация о доступности 900 вокзалов, аэропортов и станций метро
Команда Яндекса объявила о запуске полезного обновления фирменного картографического сервиса. Теперь пользователи «Яндекс Карт» могут проверить, насколько здание доступно для людей с ограниченной мобильностью. Иллюстрация: Яндекс Информация о доступности транспортной организации отображается в ее карточке — нужно открыть ее и найти раздел «Особенности». В нём указано, есть...