Title: Where Bits Matter in World Model Planning - A Paired Mixed-Bit Study for Efficient Spatial Reasoning
Authors: Suraj Ranganath, Anish Patnaik, Vaishak Menon
arXiv: https://arxiv.org/abs/2602.11882

Problem framing

这篇聚焦“量化到底伤在哪里”:世界模型规划在低比特下退化,关键不只在总 bit 数,还在 bit 分配位置(encoder/transition/head)。这是具身部署里很现实的算力问题。

Core method

作者在 DINO-WM + Wall planning 上做 paired-goal mixed-bit 评测,系统比较 uniform、mixed、asymmetric、layerwise 量化,在不同 planner 预算下观察成功率与规划质量变化。

Key equations and mechanisms

经验规律呈三段:8/6-bit 近 FP16,3-bit 崩塌,4-bit 进入“分配敏感区”。可写成近似关系:

\Delta J pprox f(B_{enc},B_{dyn},B_{head}) eq f(B_{total})

即性能损失 由模块位宽向量决定,而非仅总位宽。4-bit 区间保 encoder 精度通常更关键,体现感知表征瓶颈主导规划退化。

Experiment reading guide

重点看:

  • 不同 bit 分配在同等模型大小下的 paired 对比;
  • 22-cell replication 中符号翻转(mixed vs uniform)背后的预算依赖;
  • 失败案例是否集中在长时程空间推理步骤。

Limitations

  • 任务主要是 Wall planning,外推到接触密集操控还需证据;
  • 理论解释仍偏经验统计,尚缺更强误差传播上界。

Future work

可把 mixed-bit 设计并入 VLA/world-model 联合训练,形成“任务自适应精度分配”策略(online bit allocation)。

Replication angle

建议先复现实验网格,再做 encoder-only 高精度 ablation,验证是否可在相同显存下换取更高闭环成功率。

  • 关键图(source 提取):../../out/telegram-cards/2026-02-15/2602.11882-fig1.png

Graph: Paper Node 2602.11882