• Астрономы обнаружили потенциально обитаемую планету «недалеко» от Земли (2 фото + видео)

    Астрономы обнаружили новую экзопланету HD 20794 d, классифицированную как суперземля и расположенную в 19,6 светового года от нас. Планета находится в обитаемой зоне своей звезды, что предполагает возможность наличия жидкой воды на её поверхности.
    Читать дальше
  • NASA обнаружило «элементы жизни» в образцах астероида Бенну (2 фото)

    Учёные NASA проанализировали образцы, собранные с астероида Бенну в ходе миссии OSIRIS-REx, и нашли в них органические соединения, играющие важную роль в происхождении жизни. В частности, были обнаружены фундаментальные элементы, необходимые для синтеза белков и формирования ДНК.
    Читать дальше
  • DOOM запустили на HDMI-переходнике Apple (видео)

    Среди энтузиастов со всего мира стало своеобразным состязанием запускать DOOM на любой электронике и не только. Оказывается, поиграть в культовый шутер можно даже на HDMI-переходнике Apple. Таким достижением поделилась девушка-программист под ником Nyan Satan.
    Читать дальше
  • Совершён первый в истории видеозвонок через космос между обычными смартфонами

    Спутниковый провайдер AST SpaceMobile и оператор мобильной связи Vodafone из Великобритании сообщили об успешном выполнении видеозвонка между двумя немодифицированными смартфонами с использованием спутниковой связи. В 2023 году AST осуществила первый в истории звонок между обычными смартфонами через спутник, а также первый такой звонок че...
    Читать дальше
  • Первый отрезок гигантского «лежачего небоскрёба» The Line в Саудовской Аравии построят к 2030 году (3 фото)

    На Всемирном экономическом форуме в Давосе стали известны новые подробности о мегапроекте Neom в Саудовской Аравии. В частности, появилась новая информация о строительстве города The Line («Линия») длиной 170 км и высотой 500 м. На форуме представитель проекта сообщил, что закладка фундамента для первой очереди «лежачего небоскрёба» начнё...
    Читать дальше

Boston Dynamics рассказала, как человекоподобный робот Atlas видит окружающий мир (3 фото)

3 июня 2025 | Просмотров: 1 070 | Гаджет новости

Большое количество задач, которые может выполнять человекоподобный робот на заводе, складе или дома, требует понимания геометрических и семантических свойств окружающих его предметов, таких как формы и контекст объектов взаимодействия. Инженеры компании Boston Dynamics поделились подробностями относительно того, как их робот Atlas «видит» мир благодаря гибкой и адаптивной системе восприятия.

Даже простая на первый взгляд задача — подобрать деталь автомобиля и установить её в нужное место — разбивается на несколько этапов, выполнение каждого из которых требует обширных знаний об окружающем пространстве. Сначала Atlas обнаруживает и идентифицирует объект. Многие детали на заводе блестящие или же малоконтрастные и тёмные, поэтому камерам робота трудно их различать. Затем роботу нужно определить, где находится объект, чтобы схватить его. Нужный объект может лежать на столе, находиться в контейнере с ограниченным пространством и др. Когда Atlas определяется с выбором объекта, он решает, куда его установить и как его доставить в нужное место.

В конечном счёте Atlas должен с высокой точностью разместить объект в определённом месте и отклонение даже на пару сантиметров может привести к тому, что предмет, с которым взаимодействует робот, будет установлен неправильно или упадёт. Чтобы избежать этого Atlas должен быть способен вносить корректировки в свои действия, если что-то пойдёт не так. Например, если не удалось установить деталь и она упала на пол, робот может поднять её, используя систему на основе компьютерного зрения.

Выполнение таких задач требуют внедрения новых методов и влияют на всю систему восприятия Atlas, которая включает в себя качественно откалиброванные сенсоры, современные ИИ-алгоритмы с машинным обучением, систему оценки состояния и др. Восприятие начинается с того, что находится вокруг робота и есть ли на его пути какие-то препятствия. Для идентификации окружающих объектов инженеры Boston Dynamics задействовали систему обнаружения, которая предоставляет данные о предметах в виде идентификаторов, ограничительных рамок и точек интереса.

В процессе работы на автомобильном производстве Atlas обнаруживает стеллажи, на которых хранятся разные автомобильные детали. Стеллажи могут быть разной формы и размера, поэтому робот должен знать не только их тип, но и местоположение, чтобы избежать столкновений с ними. Наряду с обнаружением стеллажей робот идентифицирует их углы как точки интереса, за счёт чего окружающее пространство удаётся привести в соответствие с внутренней картой.

Ключевые точки представляют собой двумерные пиксельные точки двух типов: внешние (зелёные) и внутренние (красные). Внешние точки отражают объекты, которые следует огибать в процессе работы. Внутренние более разнообразны и многочисленны, они могут отражать распределение полок на стеллаже, расположение ящиков, а также позволяют точно локализовать отдельные объекты. Для классификации крупных объектов и прогнозирования расположения точек интереса Atlas использует облегчённую сетевую архитектуру, позволяющую достичь компромисса между производительностью и восприятием, что важно для обеспечения манёвренности робота.

Перед проведением манипуляций с объектами внутри подсвеченных точками пространств Atlas определяет своё местоположение, для чего задействуется модуль локализации объекта по ключевым точкам. Система оценивает положение объекта и его ориентацию по отношению к другим объектам, находящимся поблизости. Система локализации получает данные о внутренних и внешних точках интереса из конвейера обнаружения объектов и выравнивает их в соответствии с предварительной моделью их распределения в пространстве. В дополнение к этому задействована кинематическая одометрия для определения движений робота, чтобы свести воедино положение объектов и повысить надёжность прогнозирования расположения точек интереса.


Навыки Atlas в манипулировании предметами основаны на точности восприятия окружающего пространства в режиме онлайн. Система отслеживания положения SuperTracker объединяет разные потоки информации: кинематику робота, компьютерное зрение и др. Кинематическая информация, получаемая от энкодеров суставов Atlas, позволяет определить расположение захватов робота в пространстве. Объединение кинематических данных позволяет преодолевать ситуации, когда нужный объект скрыт или не находится в поле зрения камер.

Когда объект находится в поле зрения камер, Atlas задействует модель оценки положения объекта, которая использует рендеринг и сравнение для оценки положения по монокулярным изображениям. Модель обучена на большом массиве синтетических данных и обобщает данные с нулевого кадра для новых объектов с использованием CAD-модели. При инициализации с использованием 3D-изображения модель уточняет его вид, чтобы минимизировать расхождения между визуализированной CAD-моделью и изображением с камеры. В качестве альтернативы система оценки может работать на основе 2D-модели области интереса, например, маски объекта. После этого генерируется пакет гипотез, которые анализируются специальным алгоритмом для выбора оптимальной. Система оценки Atlas надёжно работает на сотнях заводских объектов, которые предварительно были смоделированы и текстурированы.

Boston Dynamics рассказала, как человекоподобный робот Atlas видит окружающий мир (3 фото)

Система SuperTracker получает визуальные оценки позы робота в формате 3D. В сценариях с манипуляциями визуальные оценки позы могут быть неоднозначными, например, из-за неполной видимости или плохого освещения. Для проверки точности оценки в этих случаях используются специальные фильтры.

При выполнении точных манипуляций, включающих в себя несколько действий, важное значение имеет точная калибровка датчиков, системы компьютерного зрения и др. Инженеры отмечают, что точная калибровка является ключевым фактором, который позволяет обеспечить высокопроизводительное манипулирование и автономность на основе восприятия окружающего пространства.

В дальнейшем Boston Dynamics планирует повышать точность действий и адаптивность Atlas. Команда сосредоточена на продвижении к созданию единой базовой модели для Atlas. Разработчики намерены выйти за рамки достигнутого, когда восприятие и действие не являются отдельными процессами.


Написать комментарий

  • bowtiesmilelaughingblushsmileyrelaxedsmirk
    heart_eyeskissing_heartkissing_closed_eyesflushedrelievedsatisfiedgrin
    winkstuck_out_tongue_winking_eyestuck_out_tongue_closed_eyesgrinningkissingstuck_out_tonguesleeping
    worriedfrowninganguishedopen_mouthgrimacingconfusedhushed
    expressionlessunamusedsweat_smilesweatdisappointed_relievedwearypensive
    disappointedconfoundedfearfulcold_sweatperseverecrysob
    joyastonishedscreamtired_faceangryragetriumph
    sleepyyummasksunglassesdizzy_faceimpsmiling_imp
    neutral_faceno_mouthinnocent

Кликните на изображение чтобы обновить код, если он неразборчив

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.