SkillVLA Tackling Combinatorial Diversity in Dual-Arm Manipulation via Skill Reuse

Title: SkillVLA Tackling Combinatorial Diversity in Dual-Arm Manipulation via Skill Reuse
Authors: Xuanran Zhai, Zekai Huang, Longyan Wu, Qianyou Zhao, Qiaojun Yu, Jieji Ren, Ce Hao, Harold Soh
arXiv: https://arxiv.org/abs/2603.03836

Problem framing

双臂任务的关键难点不是单臂能力不足，而是左右臂技能组合呈指数级增长；传统双臂VLA未显式建模组合结构，导致泛化效率低。

Core method

SkillVLA以技能复用为核心，把双臂策略分解为可组合技能单元，并通过任务条件进行组合调度，从而在新任务上用较少新数据实现迁移。

Key equations and mechanisms

可抽象为组合策略： $a_{t} = Π (z_{t}^{L}, z_{t}^{R}, c_{t}), z_{t}^{L} \sim p_{L} (\cdot ∣ o_{t}, l), z_{t}^{R} \sim p_{R} (\cdot ∣ o_{t}, l)$ 其中 $z^{L}, z^{R}$ 是左右臂技能潜变量， $c_{t}$ 为协同约束。关键在于先学可复用技能，再学组合器。

Experiment reading guide

关注组合泛化基准：训练只见部分技能配对，测试未见配对；看成功率下降幅度是否显著小于端到端双臂基线。

Limitations

技能拆分粒度若设错会影响上限；过细导致调度复杂，过粗又失去组合收益。

Future work

可加入层级时间抽象，让长时任务在高层先规划双臂技能序列，再由低层精调执行。

Replication angle

先在小规模双臂任务复现“见过技能、未见组合”设置，这是验证方法价值最直接的实验。

图示：arXiv 页面无稳定直链图片。

Graph: Paper Node 2603.03836