- Индия готовится к исторической миссии... (605)
- АвтоВАЗ собрал презентационные Lada Iskra в... (574)
- Корейцы натравят ИИ на пиратские кинотеатры... (584)
- Geely готовит конкурента Li Auto L9 и Aito... (620)
- Открыт метастабильный материал для будущих... (558)
- Новая реальность: успех S.T.A.L.K.E.R. 2:... (585)
- «Недостаточно слов, чтобы выразить... (516)
- ИИ научили генерировать тысячи модификаций... (511)
- В Epic Games Store стартовала новая раздача... (450)
- Новые открытия телескопа «Джеймс Уэбб»:... (498)
- На российском заводе Haval произошёл... (413)
- Новый год россияне встретят под «чёрной»... (431)
- За 2024 год в Steam вышло на 30 % больше... (483)
- 224 л.с., 8-ступенчатый «автомат» и полный... (400)
- Лампа накаливания снова в деле — физики... (394)
- xAI привлекла $6 млрд... (415)
Разработан алгоритм, который позволяет передавать навыки между роботами
Дата: 2024-10-13 20:44
Учёные из Калифорнийского университета в Беркли разработали новую вычислительную структуру под названием RoVi-Aug, которая позволяет дополнять роботизированные данные и облегчает передачу навыков между различными роботами. Эта структура использует генеративные модели для дополнения данных изображений и создания синтезированных визуальных демонстраций задач с различными видами камер для разных роботов.
По словам группы разработчиков, которыми руководили исследователи Лоуренс Чен (Lawrence Chen) и Чэньфэн Сю (Chenfeng Xu), целью их работы было преодолеть ограничения существующих алгоритмов, которые не могут надёжно передавать навыки между роботами с разными корпусами и характеристиками. Они отметили, что многие существующие наборы данных для обучения роботов не сбалансированы и содержат неточности, которые могут привести к переобучению определённых типов роботов.
«Успех современных систем машинного обучения, в частности генеративных моделей, демонстрирует впечатляющую обобщаемость и мотивирует исследователей робототехники искать, как достичь аналогичной обобщаемости в робототехнике», — рассказали Чен и Сюй.
RoVi-Aug состоит из двух отдельных компонентов: модуля роботизированного дополнения (Ro-Aug) и модуля дополнения точки обзора (Vi-Aug). Первый компонент синтезирует демонстрационные данные с участием различных роботизированных систем, а второй производит демонстрации с разных углов.
Источник: DALL-E«Ro-Aug имеет две ключевые особенности: тонко настроенную модель SAM для сегментации робота и тонко настроенную ControlNet для замены исходного робота другим. Тем временем Vi-Aug использует ZeroNVS, современную модель синтеза новых видов, для создания новых перспектив сцены, что делает модель адаптируемой к различным точкам обзора камеры», — объяснили Чен и Сюй.
Исследователи использовали свою структуру для создания дополненного набора данных робота и проверили его эффективность для обучения политик и передачи навыков между различными роботами. Их результаты показали, что RoVi-Aug позволяет обновлять политики, которые хорошо обобщаются между различными роботами и настройками камер.
«Ключевое новшество заключается в применении генеративных моделей, таких как генерация изображений и синтез новых представлений, к задаче кросс-воплощенного обучения роботов», — пояснили Чен и Сюй.
Эта работа может способствовать развитию роботов, помочь исследователям легко расширять набор навыков систем. В будущем она может быть использована другими командами для передачи навыков между различными роботами или разработки более эффективных универсальных роботизированных политик.
Например, представьте себе ситуацию, когда исследователь потратил значительные усилия на сбор данных и обучение робота Franka политике выполнения задачи, но у вас есть только робот UR5. RoVi-Aug позволяет вам повторно использовать данные Franka и развёртывать политику на роботе UR5 без дополнительного обучения. Это особенно полезно, поскольку политики робота часто чувствительны к изменениям точки обзора камеры, а настройка идентичных углов камеры для разных роботов является сложной задачей. RoVi-Aug устраняет необходимость в таких точных настройках.
Лоуренс Чен, Чэньфэн Сю
По словам авторов работы, RoVi-Aug может быть экономически эффективной альтернативой для простого составления надёжных наборов данных для обучения. Они также отметили, что их подход может быть расширен для применения к другим наборам данных роботов и что они планируют дальнейшее совершенствование RoVi-Aug, включая генерацию видео вместо генерации изображений.
«Мы также планируем применить RoVi-Aug к существующим наборам данных, таким как набор Open-X Embodiment (OXE), и воодушевлены потенциалом повышения производительности универсальных политик роботов, обученных на этих данных. Расширение возможностей RoVi-Aug может значительно повысить гибкость и надёжность этих политик для более широкого спектра роботов и задач», — заключили исследователи.
Подробнее на iXBT
Предыдущие новости
7 семейств смартфонов Xiaomi, Redmi и Poco получат HyperOS 2 на Android 14
Xiaomi работает над новой версией фирменного интерфейса HyperOS 2 — он, согласно предварительным данным, дебютирует одновременно с линейкой Xiaomi 15 в конце текущего месяца. Однако у HyperOS 2 будет две версии — на Android 14 для «старых» моделей и на Android 15 для моделей посвежее. Ресурс XiaomiTime перечислил линейки моделей Xiaomi, Redmi и Poco, которые получат HyperOS 2...
Заменитель Toyota Grand Highlander от Volkswagen. Новый Volkswagen Teramont Pro показали на фото изнутри
В Китае к выходу готовится кроссовер Volkswagen Teramont Pro нового поколения. Ранее автомобиль засветился на живых фото китайского Минпрома, но они демонстрировали машину лишь снаружи. Теперь появились фото салона. Фото: Autohome/Минпром КНР Фото: Autohome/Минпром КНР Судя по этим картинкам, интерьер нового Volkswagen Teramont Pro будет выполнен в духе нынешней машины....
Кроссовер-минивэн Toyota Rush заметно подорожал в России
В августе кросс-вэн Toyota Rush можно было купить в России за 2,65 млн рублей, а сейчас цены на новые машины заметно повысились. Так, самый доступный экземпляр 2022 года выпуска с символическим пробегом 247 км продается в Воронежской области за 2,98 млн рублей. При этом продавец призывает купить машины побыстрее, потому что «таких цен больше не будет». У московской компании в...
Исследование Apple показало, что ИИ-модели не думают, а лишь имитируют мышление
Исследователи Apple обнаружили, что большие языковые модели, такие как ChatGPT, не способны к логическому мышлению и их легко сбить с толку, если добавить несущественные детали к поставленной задаче, сообщает издание TechCrunch. Источник изображения: D...