Affordance-Graphed Task Worlds - Self-Evolving Task Generation for Scalable Embodied Learning

Title: Affordance-Graphed Task Worlds - Self-Evolving Task Generation for Scalable Embodied Learning
Authors: Xiang Liu, Sen Cui, Guocai Yao, Zhong Cao, Jingheng Ma, Yuan Gao, Jiaheng Lai, Yongchao Wang, Lechao Cheng
arXiv: https://arxiv.org/abs/2602.12065

Problem framing

纯真实世界采集不可扩展，生成式仿真又常产生逻辑不一致长时程任务。本文试图用结构化任务图约束“任务生成—策略学习—反馈修正”全流程。

Core method

AGT-World 把任务空间表示为 affordance graph：复杂目标分解为可验证原子操作，再用自进化机制（混合反馈）迭代修正任务与策略。

Key equations and mechanisms

可抽象为图上策略学习：

\mathcal{T}=(\mathcal{V},\mathcal{E}),\quad \pi^* = rg\max_\pi \sum_{(u,v)\in\mathcal{E}} w_{uv} R_{uv}(\pi)

其中边权体现可供性与执行可行性，减少随机任务提案造成的无效训练样本。

Experiment reading guide

关注：

长时程任务逻辑一致性指标；
与随机生成任务相比的样本效率/成功率提升；
自进化回路在迭代轮次上的稳定性。

Limitations

任务图构建质量决定上限；
真机迁移时仍需处理仿真-现实差距。

Future work

可引入语言反馈与真实执行日志联合更新图结构，形成闭环数据引擎。

Replication angle

可先从单场景多任务做图构建 ablation，再扩到跨场景迁移，观察图结构复用率。

Figure links

arXiv 页面无稳定直链图片

Graph: Paper Node 2602.12065