Title SeedPolicy: Horizon Scaling via Self-Evolving Diffusion Policy for Robot Manipulation
Authors Youqiang Gui, Yuxuan Zhou, Shen Cheng, Xinyang Yuan, Haoqiang Fan, Peng Cheng, Shuaicheng Liu
arXiv https://arxiv.org/abs/2603.05117

SeedPolicy 聚焦 diffusion policy 在长时序 observation 下性能退化的问题,提出 SEGA 模块维护时间演化潜状态,以门控注意力压缩历史信息。核心是“固定容量状态 + 递推更新”替代直接堆长窗口。

它可抽象为:

如果该递推状态确实保留任务关键因果片段,就能在 horizon 增长时保持稳定。

工程价值明显,但机制新意相对中等(属于对时序建模瓶颈的结构改良)。是否进入 High 取决于其在真实长程任务上的增益是否显著且稳定。

建议动作

  • 建议“选择性精读”:优先看长时程任务与遮挡干扰下的收益曲线。

Graph: Paper Node 2603.05117