SeedPolicy - Horizon Scaling via Self-Evolving Diffusion Policy for Robot Manipulation

Title SeedPolicy: Horizon Scaling via Self-Evolving Diffusion Policy for Robot Manipulation
Authors Youqiang Gui, Yuxuan Zhou, Shen Cheng, Xinyang Yuan, Haoqiang Fan, Peng Cheng, Shuaicheng Liu
arXiv https://arxiv.org/abs/2603.05117

SeedPolicy 聚焦 diffusion policy 在长时序 observation 下性能退化的问题，提出 SEGA 模块维护时间演化潜状态，以门控注意力压缩历史信息。核心是“固定容量状态 + 递推更新”替代直接堆长窗口。

它可抽象为：

z_{t} = f_{e x t g a t e - a tt n} (z_{t - 1}, o_{t}), a_{t} \sim π_{h e t a} (a ∣ z_{t})

如果该递推状态确实保留任务关键因果片段，就能在 horizon 增长时保持稳定。

工程价值明显，但机制新意相对中等（属于对时序建模瓶颈的结构改良）。是否进入 High 取决于其在真实长程任务上的增益是否显著且稳定。

建议动作

建议“选择性精读”：优先看长时程任务与遮挡干扰下的收益曲线。

Graph: Paper Node 2603.05117