Добро пожаловать на форум PHP программистов!
За последние 24 часа нас посетили 20712 программистов и 1587 роботов. Сейчас ищут 1728 программистов ...
Последние
Популярные

Microsoft представила Magma — ИИ-систему для самостоятельного управления роботами и интерфейсами

Дата: 2025-02-23 21:51

Microsoft представила модель искусственного интеллекта Magma, способную одновременно обрабатывать визуальные данные, текст и управлять физическими объектами. Разработка стала результатом совместных усилий исследователей из Microsoft, KAIST, Университета Мэриленда, Университета Висконсин-Мэдисон и Университета Вашингтона.

В отличие от существующих систем, таких как PALM-E и RT-2 от Google или ChatGPT for Robotics от Microsoft, которые используют отдельные модели для восприятия и управления, Magma объединяет эти возможности в единую основу. Система способна не только анализировать мультимодальные данные, но и самостоятельно действовать на их основе – будь то навигация по пользовательскому интерфейсу или манипуляции с физическими предметами.

Скриншот видео, на котором Magma управляет роботизированной рукой. Источник: Microsoft Research

Модель основана на двух ключевых компонентах. Первый – Set-of-Mark – идентифицирует объекты, с которыми можно взаимодействовать, присваивая числовые метки интерактивным элементам. Второй компонент – Trace-of-Mark – изучает схемы движения на основе видеоданных. Благодаря этому Magma может выполнять такие задачи, как навигация по интерфейсам или управление роботизированными манипуляторами.

По данным Microsoft, модель Magma-8B показывает впечатляющие результаты в тестовых испытаниях. В частности, она набрала 80,0 баллов в тесте VQAv2 (Visual Question Answering) — стандартном тесте, где система должна отвечать на вопросы о содержании изображений, что является важным показателем понимания визуальной информации. В тесте POPE (Popular Object in Common Environment), который проверяет способность модели точно определять наличие или отсутствие распространённых объектов на изображениях, система достигла результата 87,4, став лидером среди сравниваемых моделей. Такие показатели говорят о высокой точности визуального восприятия и анализа, превосходящей возможности GPT-4V (77,2 балла в VQAv2), хотя в некоторых тестах Magma всё же уступает другим системам, например LLaVA-Next (81,8 балла в VQAv2).

Исследователь проекта Magma Цзяньвэй Ян пояснил, что название расшифровывается как M(ultimodal) Ag(entic) M(odel) at Microsoft (Rese)A(rch).

Microsoft планирует опубликовать код для Magma на GitHub, что позволит исследователям развивать эту технологию. Несмотря на многообещающие результаты, система всё ещё имеет ограничения в сложных многоступенчатых процессах принятия решений, над улучшением которых продолжается работа.

Появление Magma отражает стремительное развитие моделей искусственного интеллекта, на сегодня это стандартное направление исследований, не вызывающее призывов к приостановке разработок в области ИИ.



Подробнее на iXBT
 

Предыдущие новости

3Dnews.ru, 2025-02-23 21:58
Детский сад какой-то: бывший немецкий дата-центр превратили в дошкольное учреждение

Бонн (Германия) остро нуждается в детских садах, поэтому размещают их порой в самых неожиданных местах. Так, 70 детей в четырёх обычных группах и одной ясельной скоро должен принять бывший дата-центр, построенный в 1980-х годах, архитектура которого практически не предусматривала окон, сообщает издание General Anzeiger. Как сообщил представитель управляющей активами...

iXBT, 2025-02-23 21:17
Дизайн в духе «Москвича-400», 6-ступенчатая коробка передач и 1,6-литровый отечественный мотор. В России собрали первый дорожный экземпляр спорткара МАРТТ

Московская ArtLine Engineering изготовила первый дорожный образец спорткара МАРТТ (аббревиатура расшифровывается как «Москвич-АРТ-лайн Технолоджи»). Своим дизайном спорткар отсылает к классическому «Москвичу-400/401». Фото: ArtLine Engineering «Автомобиль прошел все необходимые экспертизы и испытания, признан пригодным без ограничений к использованию на дорогах общего...

3Dnews.ru, 2025-02-23 21:22
GeForce RTX 5070 Ti с «отвалившимися» блоками ROP теряет до 11 % производительности в синтетических тестах

Ранее сообщалось, что некоторые видеокарты GeForce RTX 5090/RTX 5090D, а как позже выяснилось и RTX 5070 Ti, оснащены бракованными GPU, у которых не хватает нужного количества блоков растеризации, напрямую отвечающих за производительность видеокарт. В случае с GeForce RTX 5090 потеря игрового быстродействия от отсутствующих исполнительных блоков составляет около 5–8 %. А...

3Dnews.ru, 2025-02-23 21:29
Apple улучшит камеру iPhone 17 Pro с упором на видеосъёмку

По сообщениям сетевых источников, компания Apple уделит больше внимания улучшению видеосъёмки в новых смартфонах iPhone 17 Pro и iPhone 17 Pro Max, запуск которых должен состояться осенью этого года. Ранее вендор делал ставку на фотосъёмку, но теперь это должно измениться, считает журналист Bloomberg Марк Гурман (Mark Gurman). Источник изображения:...

© 2025 «PHP.RU — Сообщество PHP-Программистов»
Главная | Форум | Реклама на сайте | Контакты VIP Сувениры
Разработка компании ODware