Title: Large-Language-Model-Guided State Estimation for Partially Observable Task and Motion Planning
Authors: Yoonwoo Kim, Raghav Arora, Roberto Martín-Martín, Peter Stone, Ben Abbatematteo, Yoonchang Sung
arXiv: https://arxiv.org/abs/2603.03704

Problem framing

部分可观测TAMP里,机器人会看到大量“当前无关但未来可能关键”的对象;传统估计器往往忽略它们,导致后续规划缺上下文。

Core method

该文让LLM提供常识先验,辅助状态估计器判断“哪些未观测对象可能存在于何处”,再与几何/任务约束融合更新belief,从而提升长程规划可行性。

Key equations and mechanisms

可写成belief更新: 其中 表示由语言常识上下文 导出的先验因子,等价于对POMDP信念施加语义重加权。

Experiment reading guide

优先看“隐藏物体推断”相关任务:是否减少无效探索、是否缩短任务完成路径、是否提升首次成功率。

Limitations

LLM先验可能带偏见;若常识与具体环境冲突,可能误导belief。

Future work

可引入不确定性校准与先验置信门控,仅在观测证据不足时启用强语义先验。

Replication angle

复现时建议把LLM先验替换为规则库与随机先验做对照,验证收益确实来自语义知识而非额外计算预算。

图示:arXiv 页面无稳定直链图片。

Graph: Paper Node 2603.03704