Title: Touch2Insert: Zero-Shot Peg Insertion by Touching Intersections of Peg and Hole
Authors: Masaru Yajima, Yuma Shin, Rei Kawakami, Asako Kanezaki, Kei Ota
arXiv: https://arxiv.org/abs/2603.03627
1) 问题与动机(工程含义)
工业装配中的插接问题很现实:
- 视线遮挡,孔位不明显;
- 尺寸公差和机械顺应性变化;
- 训练集不一定覆盖全部 connector。
这篇工作将问题从“依赖视觉泛化”转成“依赖触觉几何可验证性”:
- 用触觉在关键接触阶段恢复几何关系;
- 尽可能减少对任务专用训练的依赖。
对你来说,这类方法的核心价值在于:零样本扩展能力和对视觉退化场景的鲁棒性。
2) 方法机制(逐步重建)
从摘要可抓到一条明确链路:
- 使用触觉信息定位 peg-hole 的交线/局部几何;
- 重建交线截面并估计相对位姿;
- 通过几何配准与控制闭环修正位姿;
- 形成从粗对齐到精插入的两阶段策略。
这和纯视觉方案的本质不同:触觉不替代感知,而是替代“最后 5% 最关键的闭环阶段”。
3) 数学化理解
可抽象为:
其中 与 分别代表位姿误差与增益项:通过触觉误差映射进行闭环修正。
重点是估计器 的稳健性:
- 如果触觉噪声偏大,
- 或几何接触退化,
- 则闭环易出现高频修正抖动。
4) 结果与证据阅读点
摘要中提及该方法在仿真与真实机器人上评估,报告了不同连接器下的可迁移表现,真实场景平均成功率约 86.7%。因此建议你重点追问:
- 是否仍保持在高遮挡/高公差场景;
- 是否只对特定 connector 家族有效;
- zero-shot 能否延续到你任务中的零件形态。
5) 风险与边界
- 触觉传感噪声、接触瞬态会引入位姿跳变;
- 高速需求下控制带宽不足会累积误差;
- 与复杂材料/表面纹理交互时,几何重建质量可能下降。
6) 可复现实验(你可直接做)
- 先固定三类间隙和两个公差区间做消融;
- 记录第一次接触到成功插入所需迭代步和成功率;
- 再评估一个“新几何”上的 zero-shot 表现。
7) 下一步给你的建议
建议把你当前装配 pipeline 改造成:
- 视觉粗位姿(快速)
- 触觉交线重建(精修)
- 若失败,触觉重新对齐并限制重试次数。
这会比“纯视觉再试很多次”更容易收敛。
Figures (optional)
- 暂不强制图示。若你要验证效果,建议图 1:不同公差下成功率;图 2:触觉迭代次数分布。
Research action for Wanpeng
先做一个小时的 pilot:在你现有插接数据里挑 2-3 个几何类型,测该流程是否在不重训情况下维持稳定修正,得到每次失败的“可复用修正规则”。
Graph: Paper Node 2603.03627