Learning Part-Aware Dense 3D Feature Field for Generalizable Articulated Object Manipulation

Title: Learning Part-Aware Dense 3D Feature Field for Generalizable Articulated Object Manipulation
Authors: Yue Chen, Muqing Jiang, Kaifeng Zheng, et al.
arXiv: https://arxiv.org/abs/2602.14193

Problem framing

可动件操作（门/抽屉/旋钮）泛化难点在“功能部件对齐”：纯 2D foundation feature 提升到 3D 后常出现多视角不一致、分辨率低、几何语义错配。PA3FF 目标是学习对功能部件敏感的连续 3D 特征场。

Core method

用 3D part proposals 监督训练 Part-Aware 3D Feature Field；
特征距离直接编码“是否同一功能部件”的概率结构；
在策略层引入 PADP（Part-Aware Diffusion Policy），将该 3D 场作为关键条件输入。

Key equations and mechanisms

核心是部件感知对比学习：

L_{p a r t} = - lo g \frac{exp ( sim ( f _{i} , f _{j} ) / τ )}{\sum _{k} exp ( sim ( f _{i} , f _{k} ) / τ )}

其中正样本来自同功能部件点集，负样本来自跨部件点集；通过连续场预测把离散部件标签推广到稠密 3D 空间。

Experiment reading guide

建议先看：

对 CLIP/DINOv2/Grounded-SAM 的表示替换对照；
模拟到真实的部件定位误差与最终任务成功率耦合关系；
除 imitation learning 外在 correspondence/segmentation 下游任务的迁移收益。

Limitations

依赖高质量 part proposal 与标注体系；
对点云质量与遮挡较敏感；
在高自由度灵巧手场景中的实时性需进一步验证。

Future work

可把时序接触信号（触觉/力觉）并入 3D feature field，形成“部件语义+接触状态”联合表征，提升长时程接触任务稳定性。

Replication angle

复现时优先固定策略网络，仅替换表征（2D vs PA3FF），再测 sample efficiency 曲线，能更清楚看出表征贡献。

Figure links

https://arxiv.org/pdf/2602.14193.pdf (Fig.1, p1)
./out/telegram-cards/2026-02-18/pa3ff_fig.jpg

Graph: Paper Node 2602.14193