- «Возобновляется производство. Санкции не... (509)
- Toyota придумала двухместный электромобиль... (523)
- Microsoft добавила сочетание клавиш для... (490)
- 200-сильный отлично оснащенный Hyundai по... (481)
- Новый метод позволит искать следы жизни на... (480)
- Марсоход Curiosity продолжил исследования... (484)
- Microsoft обвинили в мошенничестве с... (292)
- Замена Toyota RAV4 с богатым оснащением и... (311)
- Трёхмерные симуляции взрывов сверхновых... (279)
- Китайские астрономы исследовали аномальную... (290)
- Четыре субземли у звезды Барнарда: первый в... (221)
- Electronic Arts добавила в новую Skate... (218)
- Altera представила малые FPGA семейства... (261)
- Японская Mazda 3 с автоматом за 1,79 млн... (218)
- 10+ Тбайт/с: Pure Storage представила... (213)
- Volkswagen сообщил о резком падении прибыли... (195)
Google DeepMind подключила языковую модель Gemini к роботам для выполнения команд без предварительного обучения
Дата: 2025-03-12 21:29
Google DeepMind представила роботизированную модель Gemini Robotics на базе продвинутых языковых алгоритмов
Компания Google DeepMind анонсировала Gemini Robotics — новую систему, объединяющую передовую языковую модель Gemini 2.0 с поддержкой робототехники. Эта интеграция позволит роботам выполнять задачи с большей точностью, понимать естественные команды и адаптироваться к незнакомым сценариям без дополнительного обучения.
Разработка может стать прорывом в создании универсальных роботов, способных заменить человека в бытовых, промышленных и образовательных сферах.
«Главная проблема робототехники в том, что существующие системы хорошо работают только в заранее заданных условиях, но терпят неудачи в новых ситуациях», — отметил Канишка Рао, директор подразделения робототехники DeepMind, на пресс-брифинге. По его словам, Gemini Robotics преодолевает этот барьер благодаря способности Gemini 2.0 анализировать контекст, планировать действия и общаться на естественном языке. Модель также совместима с разными типами роботов, от манипуляторов до гуманоидных платформ.

В рамках проекта Google DeepMind сотрудничает с Agility Robotics, Boston Dynamics и другими компаниями над второй версией системы — Gemini Robotics-ER. Эта модель фокусируется на пространственном мышлении и призвана улучшить понимание роботами физического окружения. «Мы тестируем её в реальных сценариях, чтобы создать более интеллектуальные решения», — пояснила Каролина Парада, руководитель робототехнической команды DeepMind.
Демонстрации Gemini Robotics впечатляют: в одном из роликов две роборуки по команде «положи бананы в прозрачный контейнер» точно идентифицировали объекты, даже при перемещении ёмкости. В другом случае система сложила очки в футляр, свернула бумагу в оригами-лису и выполнила «слэм-данк» с мини-мячом, хотя ранее не сталкивалась с такими заданиями. «Промежуточное звено между командой и действием — ключевой прорыв. Теперь робот не просто слышит „возьми красный карандаш“, но и точно выполняет это», — прокомментировал Ян Липхардт, профессор Стэнфорда и основатель OpenMind.
Хотя движения робота пока что медленны и неидеальны, его способность адаптироваться «на лету» значительно превосходит традиционные системы. Липхардт добавил, что интеграция генеративного ИИ открывает путь к созданию роботов-помощников, учителей и компаньонов.
Обучение модели стало вызовом: в отличие от языковых алгоритмов, робототехнике не хватает реальных данных. DeepMind использовала симуляции и телеуправление, где операторы удалённо задавали действия. Однако симуляции часто страдают от «разрыва между виртуальным и реальным миром» — например, не учитывают трение поверхностей. Для минимизации ошибок команда комбинировала оба подхода и анализировала видеозаписи.
Безопасность — ещё один приоритет. Модель тестировали на наборе ASIMOV (в честь Айзека Азимова и его «Трёх законов робототехники»), включающем сценарии вроде «безопасно ли смешивать уксус с отбеливателем?». «Gemini 2.0 и Gemini Robotics показали высокую точность в оценке рисков», — заявил Викас Синдвани, научный сотрудник DeepMind.
Для обеспечения этичности в систему встроен механизм «конституционного ИИ», основанный на принципах Азимова. Модель генерирует ответы, критикует их согласно правилам и дорабатывает, минимизируя потенциальный вред.
Хотя до массового внедрения ещё далеко, прогресс Gemini Robotics знаменует переход к эпохе, где роботы не просто выполняют команды, а понимают их смысл. Как заключил Липхардт: «Это часть растущей волны, где роботы становятся умнее, интерактивнее и проще в обучении».
Подробнее на iXBT
Предыдущие новости
Наконец-то народные видеокарты GeForce RTX 50. GeForce RTX 5060 и 5060 Ti представят уже завтра
Видеокарты GeForce RTX 5060 и 5060 Ti будут представлены уже завтра. фото Videocardz Это не слухи, а информация непосредственно от Nvidia, которую компания предоставила сегодня. Ожидается три версии: RTX 5060, RTX 5060 Ti 8GB и RTX 5060 Ti 16GB. GeForce RTX 5060 Ti может быть такой же быстрой, как RTX 4070, но вот 8 ГБ памяти никак не исправить. Появились характеристики...
Учёные создали программируемый фотонный чип на основе ниобата лития, который обеспечит защиту связи от помех и ускорит внедрение 6G
Исследователи из Университета Твенте (Нидерланды) совместно с коллегами из Городского университета Гонконка разработали инновационный программируемый фотонный чип на базе тонкоплёночного ниобата лития (TFLN) — материала, который считается ключевым для развития фотонных технологий. Результаты работы открывают путь к созданию компактных и высокопроизводительных систем связи,...
Ryzen 9 9950X3D — самый быстрый процессор на рынке в своём сегменте. Тесты показали превосходство, но цена кусается
Компания AMD выпустила на рынок свои топовые процессоры с дополнительной кеш-памятью. И сегодня мы посмотрим на обзоры флагманского Ryzen 9 9950X3D. фото TechPowerUp Как обычно в случае с современными многоядерными CPU, правильнее всего смотреть на те задачи, которые важны конкретному пользователю. Если же оценивать производительность, лучше смотреть на самые ресурсоёмкие...
NASA и Blue Origin нацелились на август для первой лунной миссии с рекордно тяжёлым модулем MK1
NASA объявило о планах отправить посадочный модуль Blue Moon MK1 от компании Blue Origin на южный полюс Луны уже этим летом. Беспилотная миссия станет важным шагом в подготовке будущих пилотируемых экспедиций в рамках программы Artemis, а сам аппарат войдёт в историю как крупнейший космический корабль, достигший лунной поверхности. В перспективе 2030-х годов этот статус...