Title: Any House Any Task: Scalable Long-Horizon Planning for Abstract Human Tasks
Authors: Zhihong Liu, Yang Li, Rengming Huang, Cewu Lu, Panpan Cai
arXiv: https://arxiv.org/abs/2602.12244

Problem framing

开放家庭场景下,任务规划难点在于规模和歧义同步增长:房间大、对象多、约束复杂,传统 LLM 规划长度一长就崩。该文聚焦“可扩展长时程家庭任务规划”。

Core method

AHAT 通过分层任务表示与可扩展搜索/校验机制,把抽象人类指令分解为可执行步骤,并在大环境下维持规划一致性。核心贡献在于把“可行性检查”与“语义分解”绑定,而非单纯 prompt 增强。

Key equations and mechanisms

论文更偏系统方法,数学展开较少。可抽象为: 其中 同时编码任务满足度和约束一致性, 则是计划长度/复杂度惩罚。

Experiment reading guide

看三类指标:

  • 规划成功率随环境规模增长的退化斜率;
  • 长计划(高步数)下的完成率;
  • 指令歧义与约束冲突场景下的鲁棒性。

Limitations

  • 对环境图谱或对象状态估计质量有依赖;
  • 与低层控制闭环接口描述可能不足;
  • 在真实机器人大规模部署成本未完全量化。

Future work

建议结合 VLA 低层策略、在线 re-planning 与不确定性感知,形成真正端到端家居具身系统。

Replication angle

复现可先在模拟器复现实验协议,再替换成本体可执行动作原语,检查计划-执行偏差累积。

  • 关键图(本地提取,可在 Obsidian 渲染):../../out/telegram-cards/2026-02-14/2602.12244/AHAT_method_overview_final.png
  • arXiv 页面无稳定直链图片(已从 source 提取)

Graph: Paper Node 2602.12244