Title: HoloBrain-0 Technical Report
Authors: Xuewu Lin, Tianwei Lin, Yun Du, Hongyu Xie, Yiwei Jin, Jiawei Li, et al.
arXiv: https://arxiv.org/abs/2602.12062
arXiv 页面无稳定直链图片。
Problem framing
通用 VLA 往往忽略机器人几何与运动学先验,导致跨本体泛化与部署效率受限。
Core method
HoloBrain-0 显式注入具身先验:多视角相机参数 + URDF 运动学描述,结合 pre-train/post-train 范式,形成从基础模型到下游任务适配的完整栈。
Key equations and mechanisms
可理解为条件策略:
其中 是具身条件(相机外参、关节拓扑、链路约束)。通过把 显式输入,提升跨平台可迁移性。
Experiment reading guide
- 0.2B 小模型逼近大模型性能的条件;
- 在 LIBERO/GenieSim 与真实长时程任务间的一致性;
- 哪些任务最依赖具身先验(高精度接触/遮挡场景)。
Limitations
- 技术报告类工作可能缺少严格消融细节;
- 跨硬件泛化仍受传感器标定与控制频率影响。
Future work
- 更系统地量化“具身先验注入量 vs 泛化收益”;
- 与世界模型/验证器体系结合做端到端可解释决策。
Graph: Paper Node 2602.12062