Title: SkillVLA Tackling Combinatorial Diversity in Dual-Arm Manipulation via Skill Reuse
Authors: Xuanran Zhai, Zekai Huang, Longyan Wu, Qianyou Zhao, Qiaojun Yu, Jieji Ren, Ce Hao, Harold Soh
arXiv: https://arxiv.org/abs/2603.03836
Problem framing
双臂任务的关键难点不是单臂能力不足,而是左右臂技能组合呈指数级增长;传统双臂VLA未显式建模组合结构,导致泛化效率低。
Core method
SkillVLA以技能复用为核心,把双臂策略分解为可组合技能单元,并通过任务条件进行组合调度,从而在新任务上用较少新数据实现迁移。
Key equations and mechanisms
可抽象为组合策略: 其中 是左右臂技能潜变量, 为协同约束。关键在于先学可复用技能,再学组合器。
Experiment reading guide
关注组合泛化基准:训练只见部分技能配对,测试未见配对;看成功率下降幅度是否显著小于端到端双臂基线。
Limitations
技能拆分粒度若设错会影响上限;过细导致调度复杂,过粗又失去组合收益。
Future work
可加入层级时间抽象,让长时任务在高层先规划双臂技能序列,再由低层精调执行。
Replication angle
先在小规模双臂任务复现“见过技能、未见组合”设置,这是验证方法价值最直接的实验。
图示:arXiv 页面无稳定直链图片。
Graph: Paper Node 2603.03836