Title: Learning Part-Aware Dense 3D Feature Field for Generalizable Articulated Object Manipulation
Authors: Yue Chen, Muqing Jiang, Kaifeng Zheng, et al.
arXiv: https://arxiv.org/abs/2602.14193
Problem framing
可动件操作(门/抽屉/旋钮)泛化难点在“功能部件对齐”:纯 2D foundation feature 提升到 3D 后常出现多视角不一致、分辨率低、几何语义错配。PA3FF 目标是学习对功能部件敏感的连续 3D 特征场。
Core method
- 用 3D part proposals 监督训练 Part-Aware 3D Feature Field;
- 特征距离直接编码“是否同一功能部件”的概率结构;
- 在策略层引入 PADP(Part-Aware Diffusion Policy),将该 3D 场作为关键条件输入。
Key equations and mechanisms
核心是部件感知对比学习:
其中正样本来自同功能部件点集,负样本来自跨部件点集;通过连续场预测把离散部件标签推广到稠密 3D 空间。
Experiment reading guide
建议先看:
- 对 CLIP/DINOv2/Grounded-SAM 的表示替换对照;
- 模拟到真实的部件定位误差与最终任务成功率耦合关系;
- 除 imitation learning 外在 correspondence/segmentation 下游任务的迁移收益。
Limitations
- 依赖高质量 part proposal 与标注体系;
- 对点云质量与遮挡较敏感;
- 在高自由度灵巧手场景中的实时性需进一步验证。
Future work
可把时序接触信号(触觉/力觉)并入 3D feature field,形成“部件语义+接触状态”联合表征,提升长时程接触任务稳定性。
Replication angle
复现时优先固定策略网络,仅替换表征(2D vs PA3FF),再测 sample efficiency 曲线,能更清楚看出表征贡献。
Figure links
- https://arxiv.org/pdf/2602.14193.pdf (Fig.1, p1)
- ./out/telegram-cards/2026-02-18/pa3ff_fig.jpg
Graph: Paper Node 2602.14193