Title: SkillVLA Tackling Combinatorial Diversity in Dual-Arm Manipulation via Skill Reuse
Authors: Xuanran Zhai, Zekai Huang, Longyan Wu, Qianyou Zhao, Qiaojun Yu, Jieji Ren, Ce Hao, Harold Soh
arXiv: https://arxiv.org/abs/2603.03836

Problem framing

双臂任务的关键难点不是单臂能力不足,而是左右臂技能组合呈指数级增长;传统双臂VLA未显式建模组合结构,导致泛化效率低。

Core method

SkillVLA以技能复用为核心,把双臂策略分解为可组合技能单元,并通过任务条件进行组合调度,从而在新任务上用较少新数据实现迁移。

Key equations and mechanisms

可抽象为组合策略: 其中 是左右臂技能潜变量, 为协同约束。关键在于先学可复用技能,再学组合器。

Experiment reading guide

关注组合泛化基准:训练只见部分技能配对,测试未见配对;看成功率下降幅度是否显著小于端到端双臂基线。

Limitations

技能拆分粒度若设错会影响上限;过细导致调度复杂,过粗又失去组合收益。

Future work

可加入层级时间抽象,让长时任务在高层先规划双臂技能序列,再由低层精调执行。

Replication angle

先在小规模双臂任务复现“见过技能、未见组合”设置,这是验证方法价值最直接的实验。

图示:arXiv 页面无稳定直链图片。

Graph: Paper Node 2603.03836