- Micron предала потребителей ради ИИ: выпуск... (404)
- В образцах с астероида Бенну нашли... (504)
- Asus приостановила поставки дорогущей... (578)
- «Величие не терпит спешки»: амбициозный мод... (507)
- Samsung и SK hynix угодили в цугцванг:... (503)
- «У Microsoft никогда ничего не получается с... (923)
- Все ИИ-гиганты провалили проверку на... (551)
- Обновление опять сломало Windows 11 — в этот... (648)
- Чувак отправляется в мультивселенную:... (538)
- «Стоящее дело»: Intel впечатлила клиентов... (561)
- В США представили «вечную флешку» на базе... (624)
- Стартап взялся навести порядок в хаосе... (594)
- В Google Chrome для Android появилась... (660)
- Gemini добавили в «Google Диск» — ИИ... (614)
- Роскомнадзор подтвердил и объяснил... (582)
- «Китайский Maybach» едет в Россию: премьера... (568)
Rapt AI и AMD сократили настройку GPU-инфраструктуры до 3 минут и увеличили запуск моделей в 10 раз на платформе Instinct
Дата: 2025-03-27 11:48
Компания Rapt AI, разрабатывающая решения для автоматизации AI-нагрузок на GPU, заключила долгосрочное соглашение с AMD. Цель сотрудничества — повысить эффективность управления ресурсами при обучении и запуске AI-моделей на графических процессорах AMD Instinct, включая серии MI300X, MI325X и будущие MI350. Интеграция платформы Rapt AI с оборудованием AMD призвана решить ключевые проблемы отрасли: нерациональное использование вычислительных мощностей, сложности в управлении распределёнными системами и рост затрат на инфраструктуру.
«Современные AI-модели стали настолько сложными и непредсказуемыми, что традиционные методы оптимизации уже не работают, — заявил на пресс-брифинге CEO Rapt AI Чарли Лиминг. — Компании вкладывают десятки миллионов, а иногда миллиарды долларов в GPU-инфраструктуру и команды специалистов, но CFO и CIO всё чаще требуют доказательств окупаемости». По его словам, прорывное решение предложил CTO Rapt AI Анил Равиндранат, разработавший систему мониторинга, которая анализирует нагрузку на оборудование в реальном времени.
Изображение: Rapt AI Платформа Rapt AI, анонсированная в конце 2023 года, уже внедрена в нескольких компаниях из списка Fortune 100, включая двух крупных облачных провайдеров. Алгоритмы автоматически распределяют задачи между GPU, сокращая время настройки инфраструктуры с девяти часов до трёх минут. Система позволяет увеличить количество запусков моделей в десять раз без роста затрат на вычисления, сокращая общие расходы до 90% — и всё это без модификации кода или участия человека.
«При ручном управлении простаивает до 30% мощностей GPU, — подчеркнул Лиминг. — Наш инструментарий обеспечивает почти 100% утилизацию, что особенно важно для клиентов, запрашивающих поддержку AMD. Их GPU, например MI300X, выделяются огромным объёмом памяти, который критичен для динамичных нагрузок». Платформа Rapt адаптируется к изменениям «на лету», анализируя поведение моделей непосредственно во время выполнения.
Совместное решение автоматически масштабирует ресурсы в зависимости от спроса, увеличивая плотность задач на AMD Instinct и сокращая задержки. Единая платформа поддерживает гибридные среды — локальные и облачные GPU разных производителей. Это избавляет инженеров от ручной настройки и позволяет сосредоточиться на разработке моделей.
В планах партнёров — дальнейшая оптимизация планирования задач, управления памятью и других параметров для подготовки инфраструктуры к будущим вызовам, включая переход к моделям с триллионами параметров к 2026 году.
Согласно прогнозам, к 2027 году до 80% корпоративных AI-проектов будут требовать автоматизации управления ресурсами — и альянс двух компаний позиционирует себя как ответ на этот тренд.
Подробнее на iXBT
Предыдущие новости
Вместо Bosch и Valeo — «Руденск»: АвтоВАЗ, КамАЗ, ПАЗ и ЛиАЗ получат белорусские фары
Белорусский «Руденск» модернизировал производство и готов заместить зарубежных производителей фар (Valeo, Bosch и Hella) для российского автопрома. Фото: Lada ОАО «Руденск», белорусский производитель светотехнической продукции, завершил масштабную модернизацию производства, вложив 12,5 млн белорусских рублей (примерно 319 млн российских). Средства были направлены на...
Xiaomi представила смартфоны Poco F7 Ultra и Poco F7 Pro с флагманскими Snapdragon и дискретными графическими чипами
Компания Xiaomi представила на мероприятии в Сингапуре два смартфона новой серии Poco F7 — Poco F7 Ultra и Poco F7 Pro. Старшая модель получила флагманский процессор последнего поколения Snapdragon 8 Elite, а версия Pro оснащена флагманским чипом предыдущего поколения — Snapdragon 8 Gen 3. Poco F7 Ultra. Источник изображений:...
Основная ступень SLS успешно интегрирована с ускорителями для миссии Artemis 2
В Космическом центре Кеннеди (Флорида, США) завершилась интеграция основной ступени ракеты-носителя Space Launch System (SLS) с боковыми ускорителями — это важный шаг к запуску миссии Artemis 2, запланированному на весну 2026 года. Четыре астронавта впервые с 1972 года облетят Луну на корабле Orion, повторив маршрут беспилотной миссии Artemis 1 в ноябре 2022-го. 23 марта...
В «Яндекс Картах» появилась информация о доступности 900 вокзалов, аэропортов и станций метро
Команда Яндекса объявила о запуске полезного обновления фирменного картографического сервиса. Теперь пользователи «Яндекс Карт» могут проверить, насколько здание доступно для людей с ограниченной мобильностью. Иллюстрация: Яндекс Информация о доступности транспортной организации отображается в ее карточке — нужно открыть ее и найти раздел «Особенности». В нём указано, есть...