- Физики 200 лет распространяли чушь о... (1111)
- Bethesda представила рабочий Pip-Boy 3000 из... (1050)
- Испанский суд оштрафовал M**a на €479 млн —... (698)
- Глава AMD заявила, что недальновидно бояться... (723)
- «Сбер» представил «Грина» —... (863)
- Осколки зелёного болида, замеченного в небе... (1241)
- Воксельный вестерн Erosion отправит игроков... (823)
- Perplexity выпустила ИИ-браузер Comet для... (778)
- Nvidia на крючке: 61 % выручки компании... (1239)
- Назван самый популярный бренд смартфонов... (1164)
- У Джеффа Безоса появится своя лунная ракета... (1163)
- «Это слухи и домыслы»: Тан отверг... (960)
- Отечественная ОС «Аврора» получила большое... (725)
- «Одна из самых безумных битв с боссом, что я... (839)
- Представлены телевизоры Sber 7000 с... (978)
- Samsung Electronics снова провела... (983)
Google DeepMind подключила языковую модель Gemini к роботам для выполнения команд без предварительного обучения
Дата: 2025-03-12 21:29
Google DeepMind представила роботизированную модель Gemini Robotics на базе продвинутых языковых алгоритмов
Компания Google DeepMind анонсировала Gemini Robotics — новую систему, объединяющую передовую языковую модель Gemini 2.0 с поддержкой робототехники. Эта интеграция позволит роботам выполнять задачи с большей точностью, понимать естественные команды и адаптироваться к незнакомым сценариям без дополнительного обучения.
Разработка может стать прорывом в создании универсальных роботов, способных заменить человека в бытовых, промышленных и образовательных сферах.
«Главная проблема робототехники в том, что существующие системы хорошо работают только в заранее заданных условиях, но терпят неудачи в новых ситуациях», — отметил Канишка Рао, директор подразделения робототехники DeepMind, на пресс-брифинге. По его словам, Gemini Robotics преодолевает этот барьер благодаря способности Gemini 2.0 анализировать контекст, планировать действия и общаться на естественном языке. Модель также совместима с разными типами роботов, от манипуляторов до гуманоидных платформ.
Источник: Gemini Robotics В рамках проекта Google DeepMind сотрудничает с Agility Robotics, Boston Dynamics и другими компаниями над второй версией системы — Gemini Robotics-ER. Эта модель фокусируется на пространственном мышлении и призвана улучшить понимание роботами физического окружения. «Мы тестируем её в реальных сценариях, чтобы создать более интеллектуальные решения», — пояснила Каролина Парада, руководитель робототехнической команды DeepMind.
Демонстрации Gemini Robotics впечатляют: в одном из роликов две роборуки по команде «положи бананы в прозрачный контейнер» точно идентифицировали объекты, даже при перемещении ёмкости. В другом случае система сложила очки в футляр, свернула бумагу в оригами-лису и выполнила «слэм-данк» с мини-мячом, хотя ранее не сталкивалась с такими заданиями. «Промежуточное звено между командой и действием — ключевой прорыв. Теперь робот не просто слышит „возьми красный карандаш“, но и точно выполняет это», — прокомментировал Ян Липхардт, профессор Стэнфорда и основатель OpenMind.
Хотя движения робота пока что медленны и неидеальны, его способность адаптироваться «на лету» значительно превосходит традиционные системы. Липхардт добавил, что интеграция генеративного ИИ открывает путь к созданию роботов-помощников, учителей и компаньонов.
Обучение модели стало вызовом: в отличие от языковых алгоритмов, робототехнике не хватает реальных данных. DeepMind использовала симуляции и телеуправление, где операторы удалённо задавали действия. Однако симуляции часто страдают от «разрыва между виртуальным и реальным миром» — например, не учитывают трение поверхностей. Для минимизации ошибок команда комбинировала оба подхода и анализировала видеозаписи.
Безопасность — ещё один приоритет. Модель тестировали на наборе ASIMOV (в честь Айзека Азимова и его «Трёх законов робототехники»), включающем сценарии вроде «безопасно ли смешивать уксус с отбеливателем?». «Gemini 2.0 и Gemini Robotics показали высокую точность в оценке рисков», — заявил Викас Синдвани, научный сотрудник DeepMind.
Для обеспечения этичности в систему встроен механизм «конституционного ИИ», основанный на принципах Азимова. Модель генерирует ответы, критикует их согласно правилам и дорабатывает, минимизируя потенциальный вред.
Хотя до массового внедрения ещё далеко, прогресс Gemini Robotics знаменует переход к эпохе, где роботы не просто выполняют команды, а понимают их смысл. Как заключил Липхардт: «Это часть растущей волны, где роботы становятся умнее, интерактивнее и проще в обучении».
Подробнее на iXBT
Предыдущие новости
Наконец-то народные видеокарты GeForce RTX 50. GeForce RTX 5060 и 5060 Ti представят уже завтра
Видеокарты GeForce RTX 5060 и 5060 Ti будут представлены уже завтра. фото Videocardz Это не слухи, а информация непосредственно от Nvidia, которую компания предоставила сегодня. Ожидается три версии: RTX 5060, RTX 5060 Ti 8GB и RTX 5060 Ti 16GB. GeForce RTX 5060 Ti может быть такой же быстрой, как RTX 4070, но вот 8 ГБ памяти никак не исправить. Появились характеристики...
Учёные создали программируемый фотонный чип на основе ниобата лития, который обеспечит защиту связи от помех и ускорит внедрение 6G
Исследователи из Университета Твенте (Нидерланды) совместно с коллегами из Городского университета Гонконка разработали инновационный программируемый фотонный чип на базе тонкоплёночного ниобата лития (TFLN) — материала, который считается ключевым для развития фотонных технологий. Результаты работы открывают путь к созданию компактных и высокопроизводительных систем связи,...
Ryzen 9 9950X3D — самый быстрый процессор на рынке в своём сегменте. Тесты показали превосходство, но цена кусается
Компания AMD выпустила на рынок свои топовые процессоры с дополнительной кеш-памятью. И сегодня мы посмотрим на обзоры флагманского Ryzen 9 9950X3D. фото TechPowerUp Как обычно в случае с современными многоядерными CPU, правильнее всего смотреть на те задачи, которые важны конкретному пользователю. Если же оценивать производительность, лучше смотреть на самые ресурсоёмкие...
NASA и Blue Origin нацелились на август для первой лунной миссии с рекордно тяжёлым модулем MK1
NASA объявило о планах отправить посадочный модуль Blue Moon MK1 от компании Blue Origin на южный полюс Луны уже этим летом. Беспилотная миссия станет важным шагом в подготовке будущих пилотируемых экспедиций в рамках программы Artemis, а сам аппарат войдёт в историю как крупнейший космический корабль, достигший лунной поверхности. В перспективе 2030-х годов этот статус...