Title: HoloBrain-0 Technical Report
Authors: Xuewu Lin, Tianwei Lin, Yun Du, Hongyu Xie, Yiwei Jin, Jiawei Li, et al.
arXiv: https://arxiv.org/abs/2602.12062

arXiv 页面无稳定直链图片。

Problem framing

通用 VLA 往往忽略机器人几何与运动学先验,导致跨本体泛化与部署效率受限。

Core method

HoloBrain-0 显式注入具身先验:多视角相机参数 + URDF 运动学描述,结合 pre-train/post-train 范式,形成从基础模型到下游任务适配的完整栈。

Key equations and mechanisms

可理解为条件策略:

其中 是具身条件(相机外参、关节拓扑、链路约束)。通过把 显式输入,提升跨平台可迁移性。

Experiment reading guide

  • 0.2B 小模型逼近大模型性能的条件;
  • 在 LIBERO/GenieSim 与真实长时程任务间的一致性;
  • 哪些任务最依赖具身先验(高精度接触/遮挡场景)。

Limitations

  • 技术报告类工作可能缺少严格消融细节;
  • 跨硬件泛化仍受传感器标定与控制频率影响。

Future work

  • 更系统地量化“具身先验注入量 vs 泛化收益”;
  • 与世界模型/验证器体系结合做端到端可解释决策。

Graph: Paper Node 2602.12062