Title: Where Bits Matter in World Model Planning - A Paired Mixed-Bit Study for Efficient Spatial Reasoning
Authors: Suraj Ranganath, Anish Patnaik, Vaishak Menon
arXiv: https://arxiv.org/abs/2602.11882
Problem framing
这篇聚焦“量化到底伤在哪里”:世界模型规划在低比特下退化,关键不只在总 bit 数,还在 bit 分配位置(encoder/transition/head)。这是具身部署里很现实的算力问题。
Core method
作者在 DINO-WM + Wall planning 上做 paired-goal mixed-bit 评测,系统比较 uniform、mixed、asymmetric、layerwise 量化,在不同 planner 预算下观察成功率与规划质量变化。
Key equations and mechanisms
经验规律呈三段:8/6-bit 近 FP16,3-bit 崩塌,4-bit 进入“分配敏感区”。可写成近似关系:
\Delta J pprox f(B_{enc},B_{dyn},B_{head}) eq f(B_{total})即性能损失 由模块位宽向量决定,而非仅总位宽。4-bit 区间保 encoder 精度通常更关键,体现感知表征瓶颈主导规划退化。
Experiment reading guide
重点看:
- 不同 bit 分配在同等模型大小下的 paired 对比;
- 22-cell replication 中符号翻转(mixed vs uniform)背后的预算依赖;
- 失败案例是否集中在长时程空间推理步骤。
Limitations
- 任务主要是 Wall planning,外推到接触密集操控还需证据;
- 理论解释仍偏经验统计,尚缺更强误差传播上界。
Future work
可把 mixed-bit 设计并入 VLA/world-model 联合训练,形成“任务自适应精度分配”策略(online bit allocation)。
Replication angle
建议先复现实验网格,再做 encoder-only 高精度 ablation,验证是否可在相同显存下换取更高闭环成功率。
Figure links
- 关键图(source 提取):
../../out/telegram-cards/2026-02-15/2602.11882-fig1.png
Graph: Paper Node 2602.11882