Any House Any Task Scalable Long-Horizon Planning for Abstract Human Tasks

Title: Any House Any Task: Scalable Long-Horizon Planning for Abstract Human Tasks
Authors: Zhihong Liu, Yang Li, Rengming Huang, Cewu Lu, Panpan Cai
arXiv: https://arxiv.org/abs/2602.12244

Problem framing

开放家庭场景下，任务规划难点在于规模和歧义同步增长：房间大、对象多、约束复杂，传统 LLM 规划长度一长就崩。该文聚焦“可扩展长时程家庭任务规划”。

Core method

AHAT 通过分层任务表示与可扩展搜索/校验机制，把抽象人类指令分解为可执行步骤，并在大环境下维持规划一致性。核心贡献在于把“可行性检查”与“语义分解”绑定，而非单纯 prompt 增强。

Key equations and mechanisms

论文更偏系统方法，数学展开较少。可抽象为： $π^{*} = ar g max_{π \in Π} U (π ∣ g, E) - λ C (π)$ 其中 $U$ 同时编码任务满足度和约束一致性， $C$ 则是计划长度/复杂度惩罚。

Experiment reading guide

看三类指标：

规划成功率随环境规模增长的退化斜率；
长计划（高步数）下的完成率；
指令歧义与约束冲突场景下的鲁棒性。

Limitations

对环境图谱或对象状态估计质量有依赖；
与低层控制闭环接口描述可能不足；
在真实机器人大规模部署成本未完全量化。

Future work

建议结合 VLA 低层策略、在线 re-planning 与不确定性感知，形成真正端到端家居具身系统。

Replication angle

复现可先在模拟器复现实验协议，再替换成本体可执行动作原语，检查计划-执行偏差累积。

Figure links

关键图（本地提取，可在 Obsidian 渲染）：../../out/telegram-cards/2026-02-14/2602.12244/AHAT_method_overview_final.png
arXiv 页面无稳定直链图片（已从 source 提取）

Graph: Paper Node 2602.12244