Title: Learning to Build: Autonomous Robotic Assembly of Stable Structures Without Predefined Plans
Authors: Jingwen Wang, Johannes Kirschner, Paul Rolland, Luis Salamanca, Stefana Parascho
arXiv: https://arxiv.org/abs/2602.23934

Problem framing

摆脱预定义蓝图,在目标/障碍约束下进行在线构建,核心难点是稳定性与可达性的组合决策。

Core method

将建造建模为序列决策:状态编码结构拓扑与障碍,采用 DQN + successor features 做可迁移价值分解。

Key equations and mechanisms

价值分解:

其中 表示长期特征占用, 为任务偏好权重,支持任务切换时快速重用。

Experiment reading guide

关注无蓝图构建成功率、障碍变化泛化、以及 SF 相对普通 DQN 的迁移收益。

Limitations

策略决策与底层执行误差会耦合放大;结构状态估计偏差会影响稳定性判断。

Future work

可引入物理一致 world model 或可微稳定性 proxy 做前瞻评估。

Replication angle

先仿真复现状态编码+SF,再接真实机械臂验证任务切换无需重训的能力。

Figure: https://arxiv.org/html/2602.23934v1/Figures/Problem_Task.jpg

Graph: Paper Node 2602.23934