Title: Learning Part-Aware Dense 3D Feature Field for Generalizable Articulated Object Manipulation
Authors: Yue Chen, Muqing Jiang, Kaifeng Zheng, et al.
arXiv: https://arxiv.org/abs/2602.14193

Problem framing

可动件操作(门/抽屉/旋钮)泛化难点在“功能部件对齐”:纯 2D foundation feature 提升到 3D 后常出现多视角不一致、分辨率低、几何语义错配。PA3FF 目标是学习对功能部件敏感的连续 3D 特征场。

Core method

  • 用 3D part proposals 监督训练 Part-Aware 3D Feature Field;
  • 特征距离直接编码“是否同一功能部件”的概率结构;
  • 在策略层引入 PADP(Part-Aware Diffusion Policy),将该 3D 场作为关键条件输入。

Key equations and mechanisms

核心是部件感知对比学习:

其中正样本来自同功能部件点集,负样本来自跨部件点集;通过连续场预测把离散部件标签推广到稠密 3D 空间。

Experiment reading guide

建议先看:

  • 对 CLIP/DINOv2/Grounded-SAM 的表示替换对照;
  • 模拟到真实的部件定位误差与最终任务成功率耦合关系;
  • 除 imitation learning 外在 correspondence/segmentation 下游任务的迁移收益。

Limitations

  • 依赖高质量 part proposal 与标注体系;
  • 对点云质量与遮挡较敏感;
  • 在高自由度灵巧手场景中的实时性需进一步验证。

Future work

可把时序接触信号(触觉/力觉)并入 3D feature field,形成“部件语义+接触状态”联合表征,提升长时程接触任务稳定性。

Replication angle

复现时优先固定策略网络,仅替换表征(2D vs PA3FF),再测 sample efficiency 曲线,能更清楚看出表征贡献。

Graph: Paper Node 2602.14193