2602.12062 HoloBrain-0具身先验VLA技术报告

Title: HoloBrain-0 Technical Report
Authors: Xuewu Lin, Tianwei Lin, Yun Du, Hongyu Xie, Yiwei Jin, Jiawei Li, et al.
arXiv: https://arxiv.org/abs/2602.12062

arXiv 页面无稳定直链图片。

Problem framing

通用 VLA 往往忽略机器人几何与运动学先验，导致跨本体泛化与部署效率受限。

Core method

HoloBrain-0 显式注入具身先验：多视角相机参数 + URDF 运动学描述，结合 pre-train/post-train 范式，形成从基础模型到下游任务适配的完整栈。

Key equations and mechanisms

可理解为条件策略：

a_{t} \sim π_{θ} (a_{t} ∣ o_{t}, l_{t}, e),

其中 $e$ 是具身条件（相机外参、关节拓扑、链路约束）。通过把 $e$ 显式输入，提升跨平台可迁移性。

Experiment reading guide

0.2B 小模型逼近大模型性能的条件；
在 LIBERO/GenieSim 与真实长时程任务间的一致性；
哪些任务最依赖具身先验（高精度接触/遮挡场景）。

Limitations

技术报告类工作可能缺少严格消融细节；
跨硬件泛化仍受传感器标定与控制频率影响。

Future work

更系统地量化“具身先验注入量 vs 泛化收益”；
与世界模型/验证器体系结合做端到端可解释决策。

Graph: Paper Node 2602.12062