Title: Learning to unfold cloth: Scaling up world models to deformable object manipulation
Authors: Jack Rome, Stephen James, Subramanian Ramamoorthy
arXiv: https://arxiv.org/abs/2602.16675

Problem framing

布料操作是高维形变 + 接触耦合问题,刚体操控范式在跨材质/折痕场景下泛化不足。

Core method

在 DreamerV2 基础上增强 world model:加入 surface normals 输入,并改造 replay buffer 与数据增强流程。

Key equations and mechanisms

沿用 latent imagination RL:

法向输入提升局部几何可辨识度,缓解视觉同像异态。

Experiment reading guide

重点看 zero-shot 实机 unfold、跨材质稳健性、以及 normals/buffer 的消融贡献。

Limitations

主要覆盖 unfold;复杂遮挡与长时 rollout 偏差问题仍在。

Future work

加入触觉和层级子目标,扩展到 folding/packing 等更复杂可变形任务。

Replication angle

先单材质做 ablation,再做跨材质扩展,重点记录想象偏差导致的失败模式。

图链接(可直链渲染):https://arxiv.org/html/2602.16675v1/media/system_diagram2.png

Graph: Paper Node 2602.16675