- ИИ угрожает миллионам рабочих мест уже... (617)
- Паспорт и СНИЛС под рукой: в отечественном... (742)
- Спасёт ли новый чип Huawei новый техпроцесс?... (932)
- Провал iPhone Air меняет планы конкурентов.... (901)
- AliExpress: самые популярные неубиваемые... (445)
- В стиле ёлочки и не только: в России... (448)
- ИИ и «Айран» в ядре 6G: Samsung и SKT... (594)
- Необходимое зло: Ubisoft объяснила, зачем... (601)
- Paradox взяла на себя вину за провал... (506)
- Kirin 9030 против 9030 Pro: в чём реальная... (863)
- Nvidia решила избавиться от рисков и теперь... (592)
- Toyota Camry, Haval Jolion и Kia Rio:... (372)
- Intel всё же раздумывает над выпуском... (710)
- Охват HyperOS 3 расширяется: Poco... (727)
- «Союз МС-28» на ракете Союз-2.1а» ушел в... (809)
- Большой и экономичный кроссовер готов к... (502)
Google DeepMind подключила языковую модель Gemini к роботам для выполнения команд без предварительного обучения
Дата: 2025-03-12 21:29
Google DeepMind представила роботизированную модель Gemini Robotics на базе продвинутых языковых алгоритмов
Компания Google DeepMind анонсировала Gemini Robotics — новую систему, объединяющую передовую языковую модель Gemini 2.0 с поддержкой робототехники. Эта интеграция позволит роботам выполнять задачи с большей точностью, понимать естественные команды и адаптироваться к незнакомым сценариям без дополнительного обучения.
Разработка может стать прорывом в создании универсальных роботов, способных заменить человека в бытовых, промышленных и образовательных сферах.
«Главная проблема робототехники в том, что существующие системы хорошо работают только в заранее заданных условиях, но терпят неудачи в новых ситуациях», — отметил Канишка Рао, директор подразделения робототехники DeepMind, на пресс-брифинге. По его словам, Gemini Robotics преодолевает этот барьер благодаря способности Gemini 2.0 анализировать контекст, планировать действия и общаться на естественном языке. Модель также совместима с разными типами роботов, от манипуляторов до гуманоидных платформ.
Источник: Gemini Robotics В рамках проекта Google DeepMind сотрудничает с Agility Robotics, Boston Dynamics и другими компаниями над второй версией системы — Gemini Robotics-ER. Эта модель фокусируется на пространственном мышлении и призвана улучшить понимание роботами физического окружения. «Мы тестируем её в реальных сценариях, чтобы создать более интеллектуальные решения», — пояснила Каролина Парада, руководитель робототехнической команды DeepMind.
Демонстрации Gemini Robotics впечатляют: в одном из роликов две роборуки по команде «положи бананы в прозрачный контейнер» точно идентифицировали объекты, даже при перемещении ёмкости. В другом случае система сложила очки в футляр, свернула бумагу в оригами-лису и выполнила «слэм-данк» с мини-мячом, хотя ранее не сталкивалась с такими заданиями. «Промежуточное звено между командой и действием — ключевой прорыв. Теперь робот не просто слышит „возьми красный карандаш“, но и точно выполняет это», — прокомментировал Ян Липхардт, профессор Стэнфорда и основатель OpenMind.
Хотя движения робота пока что медленны и неидеальны, его способность адаптироваться «на лету» значительно превосходит традиционные системы. Липхардт добавил, что интеграция генеративного ИИ открывает путь к созданию роботов-помощников, учителей и компаньонов.
Обучение модели стало вызовом: в отличие от языковых алгоритмов, робототехнике не хватает реальных данных. DeepMind использовала симуляции и телеуправление, где операторы удалённо задавали действия. Однако симуляции часто страдают от «разрыва между виртуальным и реальным миром» — например, не учитывают трение поверхностей. Для минимизации ошибок команда комбинировала оба подхода и анализировала видеозаписи.
Безопасность — ещё один приоритет. Модель тестировали на наборе ASIMOV (в честь Айзека Азимова и его «Трёх законов робототехники»), включающем сценарии вроде «безопасно ли смешивать уксус с отбеливателем?». «Gemini 2.0 и Gemini Robotics показали высокую точность в оценке рисков», — заявил Викас Синдвани, научный сотрудник DeepMind.
Для обеспечения этичности в систему встроен механизм «конституционного ИИ», основанный на принципах Азимова. Модель генерирует ответы, критикует их согласно правилам и дорабатывает, минимизируя потенциальный вред.
Хотя до массового внедрения ещё далеко, прогресс Gemini Robotics знаменует переход к эпохе, где роботы не просто выполняют команды, а понимают их смысл. Как заключил Липхардт: «Это часть растущей волны, где роботы становятся умнее, интерактивнее и проще в обучении».
Подробнее на iXBT
Предыдущие новости
Наконец-то народные видеокарты GeForce RTX 50. GeForce RTX 5060 и 5060 Ti представят уже завтра
Видеокарты GeForce RTX 5060 и 5060 Ti будут представлены уже завтра. фото Videocardz Это не слухи, а информация непосредственно от Nvidia, которую компания предоставила сегодня. Ожидается три версии: RTX 5060, RTX 5060 Ti 8GB и RTX 5060 Ti 16GB. GeForce RTX 5060 Ti может быть такой же быстрой, как RTX 4070, но вот 8 ГБ памяти никак не исправить. Появились характеристики...
Учёные создали программируемый фотонный чип на основе ниобата лития, который обеспечит защиту связи от помех и ускорит внедрение 6G
Исследователи из Университета Твенте (Нидерланды) совместно с коллегами из Городского университета Гонконка разработали инновационный программируемый фотонный чип на базе тонкоплёночного ниобата лития (TFLN) — материала, который считается ключевым для развития фотонных технологий. Результаты работы открывают путь к созданию компактных и высокопроизводительных систем связи,...
Ryzen 9 9950X3D — самый быстрый процессор на рынке в своём сегменте. Тесты показали превосходство, но цена кусается
Компания AMD выпустила на рынок свои топовые процессоры с дополнительной кеш-памятью. И сегодня мы посмотрим на обзоры флагманского Ryzen 9 9950X3D. фото TechPowerUp Как обычно в случае с современными многоядерными CPU, правильнее всего смотреть на те задачи, которые важны конкретному пользователю. Если же оценивать производительность, лучше смотреть на самые ресурсоёмкие...
NASA и Blue Origin нацелились на август для первой лунной миссии с рекордно тяжёлым модулем MK1
NASA объявило о планах отправить посадочный модуль Blue Moon MK1 от компании Blue Origin на южный полюс Луны уже этим летом. Беспилотная миссия станет важным шагом в подготовке будущих пилотируемых экспедиций в рамках программы Artemis, а сам аппарат войдёт в историю как крупнейший космический корабль, достигший лунной поверхности. В перспективе 2030-х годов этот статус...