Title: Articulated 3D Scene Graphs for Open-World Mobile Manipulation
Authors: Martin Büchner et al.
arXiv: https://arxiv.org/abs/2602.16356

Problem framing

长时程移动操作不仅要语义理解,还要建模可动结构的运动学(铰链/滑轨/包含关系)。

Core method

MoMa-SG:RGB-D 时序分段 + 遮挡鲁棒点跟踪 + unified twist estimation + 语义层级关联,构建 semantic-kinematic scene graph。

Key equations and mechanisms

统一关节估计可抽象为:

其中 统一参数化 revolute/prismatic 关节。

Experiment reading guide

先读 Arti4D-Semantic 数据集,再看四足与移动臂平台真实任务结果。

Limitations

依赖高质量 RGB-D;拥挤动态场景下关联误差仍敏感。

Future work

引入主动感知和不确定性传播,并与策略学习更紧耦合。

Replication angle

建议先在单房间可动家具场景复现关节估计链路。

arXiv 页面无稳定直链图片。

Graph: Paper Node 2602.16356