- Intel рассчитывает укрепить свои позиции на... (1040)
- Inte рассчитывает укрепить свои позиции на... (982)
- Канадцы нагрели Германию: смелый... (1041)
- Philips показала монитор с частотой до 1000... (981)
- Еврокомиссия оштрафовала X Илона Маска на... (1007)
- 17-летний японец посредством вайб-кодинга... (1033)
- Может ли это быть началом китайской Nvidia?... (977)
- Новая функция Windows 11 делает обновления... (1066)
- В кратере Езеро нашли следы древних... (999)
- Впервые за 30 лет Microsoft радикально... (964)
- Впервые за всю историю МКС все 8 стыковочных... (938)
- Это действительно полезная новая функция... (898)
- Системные платы Gigabyte Z890 уже готовы к... (864)
- Новый конкурент для RTX 5060 Ti? Intel... (1010)
- Физики научились «расклеивать» левитирующие... (944)
- Ноутбук на замену настольному ПК. Tuxedo... (1579)
Rapt AI и AMD сократили настройку GPU-инфраструктуры до 3 минут и увеличили запуск моделей в 10 раз на платформе Instinct
Дата: 2025-03-27 11:48
Компания Rapt AI, разрабатывающая решения для автоматизации AI-нагрузок на GPU, заключила долгосрочное соглашение с AMD. Цель сотрудничества — повысить эффективность управления ресурсами при обучении и запуске AI-моделей на графических процессорах AMD Instinct, включая серии MI300X, MI325X и будущие MI350. Интеграция платформы Rapt AI с оборудованием AMD призвана решить ключевые проблемы отрасли: нерациональное использование вычислительных мощностей, сложности в управлении распределёнными системами и рост затрат на инфраструктуру.
«Современные AI-модели стали настолько сложными и непредсказуемыми, что традиционные методы оптимизации уже не работают, — заявил на пресс-брифинге CEO Rapt AI Чарли Лиминг. — Компании вкладывают десятки миллионов, а иногда миллиарды долларов в GPU-инфраструктуру и команды специалистов, но CFO и CIO всё чаще требуют доказательств окупаемости». По его словам, прорывное решение предложил CTO Rapt AI Анил Равиндранат, разработавший систему мониторинга, которая анализирует нагрузку на оборудование в реальном времени.
Изображение: Rapt AI Платформа Rapt AI, анонсированная в конце 2023 года, уже внедрена в нескольких компаниях из списка Fortune 100, включая двух крупных облачных провайдеров. Алгоритмы автоматически распределяют задачи между GPU, сокращая время настройки инфраструктуры с девяти часов до трёх минут. Система позволяет увеличить количество запусков моделей в десять раз без роста затрат на вычисления, сокращая общие расходы до 90% — и всё это без модификации кода или участия человека.
«При ручном управлении простаивает до 30% мощностей GPU, — подчеркнул Лиминг. — Наш инструментарий обеспечивает почти 100% утилизацию, что особенно важно для клиентов, запрашивающих поддержку AMD. Их GPU, например MI300X, выделяются огромным объёмом памяти, который критичен для динамичных нагрузок». Платформа Rapt адаптируется к изменениям «на лету», анализируя поведение моделей непосредственно во время выполнения.
Совместное решение автоматически масштабирует ресурсы в зависимости от спроса, увеличивая плотность задач на AMD Instinct и сокращая задержки. Единая платформа поддерживает гибридные среды — локальные и облачные GPU разных производителей. Это избавляет инженеров от ручной настройки и позволяет сосредоточиться на разработке моделей.
В планах партнёров — дальнейшая оптимизация планирования задач, управления памятью и других параметров для подготовки инфраструктуры к будущим вызовам, включая переход к моделям с триллионами параметров к 2026 году.
Согласно прогнозам, к 2027 году до 80% корпоративных AI-проектов будут требовать автоматизации управления ресурсами — и альянс двух компаний позиционирует себя как ответ на этот тренд.
Подробнее на iXBT
Предыдущие новости
Вместо Bosch и Valeo — «Руденск»: АвтоВАЗ, КамАЗ, ПАЗ и ЛиАЗ получат белорусские фары
Белорусский «Руденск» модернизировал производство и готов заместить зарубежных производителей фар (Valeo, Bosch и Hella) для российского автопрома. Фото: Lada ОАО «Руденск», белорусский производитель светотехнической продукции, завершил масштабную модернизацию производства, вложив 12,5 млн белорусских рублей (примерно 319 млн российских). Средства были направлены на...
Xiaomi представила смартфоны Poco F7 Ultra и Poco F7 Pro с флагманскими Snapdragon и дискретными графическими чипами
Компания Xiaomi представила на мероприятии в Сингапуре два смартфона новой серии Poco F7 — Poco F7 Ultra и Poco F7 Pro. Старшая модель получила флагманский процессор последнего поколения Snapdragon 8 Elite, а версия Pro оснащена флагманским чипом предыдущего поколения — Snapdragon 8 Gen 3. Poco F7 Ultra. Источник изображений:...
Основная ступень SLS успешно интегрирована с ускорителями для миссии Artemis 2
В Космическом центре Кеннеди (Флорида, США) завершилась интеграция основной ступени ракеты-носителя Space Launch System (SLS) с боковыми ускорителями — это важный шаг к запуску миссии Artemis 2, запланированному на весну 2026 года. Четыре астронавта впервые с 1972 года облетят Луну на корабле Orion, повторив маршрут беспилотной миссии Artemis 1 в ноябре 2022-го. 23 марта...
В «Яндекс Картах» появилась информация о доступности 900 вокзалов, аэропортов и станций метро
Команда Яндекса объявила о запуске полезного обновления фирменного картографического сервиса. Теперь пользователи «Яндекс Карт» могут проверить, насколько здание доступно для людей с ограниченной мобильностью. Иллюстрация: Яндекс Информация о доступности транспортной организации отображается в ее карточке — нужно открыть ее и найти раздел «Особенности». В нём указано, есть...