Title Direct Contact-Tolerant Motion Planning With Vision Language Models
Authors He Li, Jian Sun, Chengyang Li, Guoliang Li, Qiyu Ruan, Shuai Wang, Chengzhong Xu
arXiv https://arxiv.org/abs/2603.05017

本文尝试把 VLM 直接引入接触容忍运动规划(CTMP),减少对传统间接空间表示(预建图、人工障碍集)的依赖。核心组件是视觉语言分区 + 点云级接触容忍推理。

价值在于工程导向明确:复杂拥挤场景中“允许可控接触”往往比“绝对无接触”更高效。若 VLM 语义分区可靠,这条路线能提升规划适应性。

潜在问题也明显:VLM 在细粒度几何接触判断上的稳定性仍是短板,且开放词汇语义可能引入不可控偏差。

建议动作

  • 保留为 Medium,适合快速扫读,不建议优先复现。

Graph: Paper Node 2603.05017