Title: Any House Any Task: Scalable Long-Horizon Planning for Abstract Human Tasks
Authors: Zhihong Liu, Yang Li, Rengming Huang, Cewu Lu, Panpan Cai
arXiv: https://arxiv.org/abs/2602.12244
Problem framing
开放家庭场景下,任务规划难点在于规模和歧义同步增长:房间大、对象多、约束复杂,传统 LLM 规划长度一长就崩。该文聚焦“可扩展长时程家庭任务规划”。
Core method
AHAT 通过分层任务表示与可扩展搜索/校验机制,把抽象人类指令分解为可执行步骤,并在大环境下维持规划一致性。核心贡献在于把“可行性检查”与“语义分解”绑定,而非单纯 prompt 增强。
Key equations and mechanisms
论文更偏系统方法,数学展开较少。可抽象为: 其中 同时编码任务满足度和约束一致性, 则是计划长度/复杂度惩罚。
Experiment reading guide
看三类指标:
- 规划成功率随环境规模增长的退化斜率;
- 长计划(高步数)下的完成率;
- 指令歧义与约束冲突场景下的鲁棒性。
Limitations
- 对环境图谱或对象状态估计质量有依赖;
- 与低层控制闭环接口描述可能不足;
- 在真实机器人大规模部署成本未完全量化。
Future work
建议结合 VLA 低层策略、在线 re-planning 与不确定性感知,形成真正端到端家居具身系统。
Replication angle
复现可先在模拟器复现实验协议,再替换成本体可执行动作原语,检查计划-执行偏差累积。
Figure links
- 关键图(本地提取,可在 Obsidian 渲染):
../../out/telegram-cards/2026-02-14/2602.12244/AHAT_method_overview_final.png - arXiv 页面无稳定直链图片(已从 source 提取)
Graph: Paper Node 2602.12244