Title: Touch2Insert: Zero-Shot Peg Insertion by Touching Intersections of Peg and Hole
Authors: Masaru Yajima, Yuma Shin, Rei Kawakami, Asako Kanezaki, Kei Ota
arXiv: https://arxiv.org/abs/2603.03627

1) 问题与动机(工程含义)

工业装配中的插接问题很现实:

  • 视线遮挡,孔位不明显;
  • 尺寸公差和机械顺应性变化;
  • 训练集不一定覆盖全部 connector。

这篇工作将问题从“依赖视觉泛化”转成“依赖触觉几何可验证性”:

  • 用触觉在关键接触阶段恢复几何关系;
  • 尽可能减少对任务专用训练的依赖。

对你来说,这类方法的核心价值在于:零样本扩展能力对视觉退化场景的鲁棒性

2) 方法机制(逐步重建)

从摘要可抓到一条明确链路:

  1. 使用触觉信息定位 peg-hole 的交线/局部几何;
  2. 重建交线截面并估计相对位姿;
  3. 通过几何配准与控制闭环修正位姿;
  4. 形成从粗对齐到精插入的两阶段策略。

这和纯视觉方案的本质不同:触觉不替代感知,而是替代“最后 5% 最关键的闭环阶段”。

3) 数学化理解

可抽象为:

其中 分别代表位姿误差与增益项:通过触觉误差映射进行闭环修正。

重点是估计器 的稳健性:

  • 如果触觉噪声偏大,
  • 或几何接触退化,
  • 则闭环易出现高频修正抖动。

4) 结果与证据阅读点

摘要中提及该方法在仿真与真实机器人上评估,报告了不同连接器下的可迁移表现,真实场景平均成功率约 86.7%。因此建议你重点追问:

  • 是否仍保持在高遮挡/高公差场景;
  • 是否只对特定 connector 家族有效;
  • zero-shot 能否延续到你任务中的零件形态。

5) 风险与边界

  • 触觉传感噪声、接触瞬态会引入位姿跳变;
  • 高速需求下控制带宽不足会累积误差;
  • 与复杂材料/表面纹理交互时,几何重建质量可能下降。

6) 可复现实验(你可直接做)

  • 先固定三类间隙和两个公差区间做消融;
  • 记录第一次接触到成功插入所需迭代步和成功率;
  • 再评估一个“新几何”上的 zero-shot 表现。

7) 下一步给你的建议

建议把你当前装配 pipeline 改造成:

  • 视觉粗位姿(快速)
  • 触觉交线重建(精修)
  • 若失败,触觉重新对齐并限制重试次数。

这会比“纯视觉再试很多次”更容易收敛。

Figures (optional)

  • 暂不强制图示。若你要验证效果,建议图 1:不同公差下成功率;图 2:触觉迭代次数分布。

Research action for Wanpeng

先做一个小时的 pilot:在你现有插接数据里挑 2-3 个几何类型,测该流程是否在不重训情况下维持稳定修正,得到每次失败的“可复用修正规则”。

Graph: Paper Node 2603.03627