Touch2Insert Zero-Shot Peg Insertion by Touching Intersections of Peg and Hole

Title: Touch2Insert: Zero-Shot Peg Insertion by Touching Intersections of Peg and Hole
Authors: Masaru Yajima, Yuma Shin, Rei Kawakami, Asako Kanezaki, Kei Ota
arXiv: https://arxiv.org/abs/2603.03627

1) 问题与动机（工程含义）

工业装配中的插接问题很现实：

视线遮挡，孔位不明显；
尺寸公差和机械顺应性变化；
训练集不一定覆盖全部 connector。

这篇工作将问题从“依赖视觉泛化”转成“依赖触觉几何可验证性”：

用触觉在关键接触阶段恢复几何关系；
尽可能减少对任务专用训练的依赖。

对你来说，这类方法的核心价值在于：零样本扩展能力和对视觉退化场景的鲁棒性。

2) 方法机制（逐步重建）

从摘要可抓到一条明确链路：

使用触觉信息定位 peg-hole 的交线/局部几何；
重建交线截面并估计相对位姿；
通过几何配准与控制闭环修正位姿；
形成从粗对齐到精插入的两阶段策略。

这和纯视觉方案的本质不同：触觉不替代感知，而是替代“最后 5% 最关键的闭环阶段”。

3) 数学化理解

可抽象为：

Δ ξ_{t} = f_{θ} (o_{t}^{tactile}), u_{t} = K Δ ξ_{t}

其中 $Δ ξ_{t}$ 与 $K$ 分别代表位姿误差与增益项：通过触觉误差映射进行闭环修正。

重点是估计器 $f_{θ}$ 的稳健性：

如果触觉噪声偏大，
或几何接触退化，
则闭环易出现高频修正抖动。

4) 结果与证据阅读点

摘要中提及该方法在仿真与真实机器人上评估，报告了不同连接器下的可迁移表现，真实场景平均成功率约 86.7%。因此建议你重点追问：

是否仍保持在高遮挡/高公差场景；
是否只对特定 connector 家族有效；
zero-shot 能否延续到你任务中的零件形态。

5) 风险与边界

触觉传感噪声、接触瞬态会引入位姿跳变；
高速需求下控制带宽不足会累积误差；
与复杂材料/表面纹理交互时，几何重建质量可能下降。

6) 可复现实验（你可直接做）

先固定三类间隙和两个公差区间做消融；
记录第一次接触到成功插入所需迭代步和成功率；
再评估一个“新几何”上的 zero-shot 表现。

7) 下一步给你的建议

建议把你当前装配 pipeline 改造成：

视觉粗位姿（快速）
触觉交线重建（精修）
若失败，触觉重新对齐并限制重试次数。

这会比“纯视觉再试很多次”更容易收敛。

Figures (optional)

暂不强制图示。若你要验证效果，建议图 1：不同公差下成功率；图 2：触觉迭代次数分布。

Research action for Wanpeng

先做一个小时的 pilot：在你现有插接数据里挑 2-3 个几何类型，测该流程是否在不重训情况下维持稳定修正，得到每次失败的“可复用修正规则”。

Graph: Paper Node 2603.03627