- Microsoft не выпустит портативную Xbox в... (23)
- Пока акции Tesla летят вниз, стоимость... (36)
- Из совета директоров в кресло генерального... (50)
- Колесо в поворотах трется о лонжерон, сбои... (49)
- Новая статья: Обзор телевизора Digma Pro... (56)
- Такую Lada Iskra мы ещё не видели: фото... (75)
- Всё та же корейская сборка, японские... (75)
- Первый след на Луне в новой эре исследований... (111)
- Тот же Volkswagen Jetta, только больше и... (106)
- Авторы амбициозного симулятора жизни Inzoi... (106)
- Одна только Radeon RX 9070 XT продалась... (115)
- Intel показала очень важные для себя... (148)
- Пионер в сфере роботов-пылесосов iRobot... (141)
- Израильский стартап BeeFree Agro выпустил... (154)
- Intel в живую показала 18-ангстремный... (137)
- 9 моделей смартфонов Xiaomi получат HyperOS... (130)
Google DeepMind подключила языковую модель Gemini к роботам для выполнения команд без предварительного обучения
Дата: 2025-03-12 21:29
Google DeepMind представила роботизированную модель Gemini Robotics на базе продвинутых языковых алгоритмов
Компания Google DeepMind анонсировала Gemini Robotics — новую систему, объединяющую передовую языковую модель Gemini 2.0 с поддержкой робототехники. Эта интеграция позволит роботам выполнять задачи с большей точностью, понимать естественные команды и адаптироваться к незнакомым сценариям без дополнительного обучения.
Разработка может стать прорывом в создании универсальных роботов, способных заменить человека в бытовых, промышленных и образовательных сферах.
«Главная проблема робототехники в том, что существующие системы хорошо работают только в заранее заданных условиях, но терпят неудачи в новых ситуациях», — отметил Канишка Рао, директор подразделения робототехники DeepMind, на пресс-брифинге. По его словам, Gemini Robotics преодолевает этот барьер благодаря способности Gemini 2.0 анализировать контекст, планировать действия и общаться на естественном языке. Модель также совместима с разными типами роботов, от манипуляторов до гуманоидных платформ.

В рамках проекта Google DeepMind сотрудничает с Agility Robotics, Boston Dynamics и другими компаниями над второй версией системы — Gemini Robotics-ER. Эта модель фокусируется на пространственном мышлении и призвана улучшить понимание роботами физического окружения. «Мы тестируем её в реальных сценариях, чтобы создать более интеллектуальные решения», — пояснила Каролина Парада, руководитель робототехнической команды DeepMind.
Демонстрации Gemini Robotics впечатляют: в одном из роликов две роборуки по команде «положи бананы в прозрачный контейнер» точно идентифицировали объекты, даже при перемещении ёмкости. В другом случае система сложила очки в футляр, свернула бумагу в оригами-лису и выполнила «слэм-данк» с мини-мячом, хотя ранее не сталкивалась с такими заданиями. «Промежуточное звено между командой и действием — ключевой прорыв. Теперь робот не просто слышит „возьми красный карандаш“, но и точно выполняет это», — прокомментировал Ян Липхардт, профессор Стэнфорда и основатель OpenMind.
Хотя движения робота пока что медленны и неидеальны, его способность адаптироваться «на лету» значительно превосходит традиционные системы. Липхардт добавил, что интеграция генеративного ИИ открывает путь к созданию роботов-помощников, учителей и компаньонов.
Обучение модели стало вызовом: в отличие от языковых алгоритмов, робототехнике не хватает реальных данных. DeepMind использовала симуляции и телеуправление, где операторы удалённо задавали действия. Однако симуляции часто страдают от «разрыва между виртуальным и реальным миром» — например, не учитывают трение поверхностей. Для минимизации ошибок команда комбинировала оба подхода и анализировала видеозаписи.
Безопасность — ещё один приоритет. Модель тестировали на наборе ASIMOV (в честь Айзека Азимова и его «Трёх законов робототехники»), включающем сценарии вроде «безопасно ли смешивать уксус с отбеливателем?». «Gemini 2.0 и Gemini Robotics показали высокую точность в оценке рисков», — заявил Викас Синдвани, научный сотрудник DeepMind.
Для обеспечения этичности в систему встроен механизм «конституционного ИИ», основанный на принципах Азимова. Модель генерирует ответы, критикует их согласно правилам и дорабатывает, минимизируя потенциальный вред.
Хотя до массового внедрения ещё далеко, прогресс Gemini Robotics знаменует переход к эпохе, где роботы не просто выполняют команды, а понимают их смысл. Как заключил Липхардт: «Это часть растущей волны, где роботы становятся умнее, интерактивнее и проще в обучении».
Подробнее на iXBT
Предыдущие новости
Наконец-то народные видеокарты GeForce RTX 50. GeForce RTX 5060 и 5060 Ti представят уже завтра
Видеокарты GeForce RTX 5060 и 5060 Ti будут представлены уже завтра. фото Videocardz Это не слухи, а информация непосредственно от Nvidia, которую компания предоставила сегодня. Ожидается три версии: RTX 5060, RTX 5060 Ti 8GB и RTX 5060 Ti 16GB. GeForce RTX 5060 Ti может быть такой же быстрой, как RTX 4070, но вот 8 ГБ памяти никак не исправить. Появились характеристики...
Учёные создали программируемый фотонный чип на основе ниобата лития, который обеспечит защиту связи от помех и ускорит внедрение 6G
Исследователи из Университета Твенте (Нидерланды) совместно с коллегами из Городского университета Гонконка разработали инновационный программируемый фотонный чип на базе тонкоплёночного ниобата лития (TFLN) — материала, который считается ключевым для развития фотонных технологий. Результаты работы открывают путь к созданию компактных и высокопроизводительных систем связи,...
Ryzen 9 9950X3D — самый быстрый процессор на рынке в своём сегменте. Тесты показали превосходство, но цена кусается
Компания AMD выпустила на рынок свои топовые процессоры с дополнительной кеш-памятью. И сегодня мы посмотрим на обзоры флагманского Ryzen 9 9950X3D. фото TechPowerUp Как обычно в случае с современными многоядерными CPU, правильнее всего смотреть на те задачи, которые важны конкретному пользователю. Если же оценивать производительность, лучше смотреть на самые ресурсоёмкие...
NASA и Blue Origin нацелились на август для первой лунной миссии с рекордно тяжёлым модулем MK1
NASA объявило о планах отправить посадочный модуль Blue Moon MK1 от компании Blue Origin на южный полюс Луны уже этим летом. Беспилотная миссия станет важным шагом в подготовке будущих пилотируемых экспедиций в рамках программы Artemis, а сам аппарат войдёт в историю как крупнейший космический корабль, достигший лунной поверхности. В перспективе 2030-х годов этот статус...