Title: Risk-Aware World Model Predictive Control for Generalizable End-to-End Autonomous Driving
Authors: Jiangxin Sun, Feng Xue, Teng Long, Chang Liu, Jian-Fang Hu, Wei-Shi Zheng
arXiv: https://arxiv.org/abs/2602.23259

Problem framing

端到端自动驾驶 imitation-only 路线在长尾风险场景泛化不足。该工作希望把“世界模型可预测性”与“风险约束控制”显式耦合,降低 rare-event 失效。

Core method

核心思想:在世界模型 rollout 上执行风险感知 MPC,既拟合专家行为,又在规划时规避高风险轨迹。

抽象目标:

其中 是风险项(如碰撞概率/尾部损失近似),由世界模型支持前瞻估计。

Key equations and mechanisms

关键机制是把 imitation 学到的“常规行为先验”与 MPC 的“风险重规划”分层:

  • 常态场景保持效率;
  • 长尾场景通过风险项放大安全边际。

Experiment reading guide

建议重点核查:

  1. 长尾场景(遮挡突发、并线干扰)提升是否显著;
  2. 安全指标与驾驶舒适性之间的权衡曲线;
  3. 世界模型误差对风险评估偏差的敏感性。

Limitations

  • 风险估计质量强依赖世界模型外推能力;
  • MPC 实时性在高动态交通中可能受算力约束;
  • 风险权重需任务化调参。

Future work

  • 引入 conformal 风险校准减少置信偏差;
  • 多模态不确定性分解(感知/预测/控制);
  • 面向机器人通用导航任务迁移。

Replication angle

复现实验可固定感知与动力学模块,仅比较 imitation-only、risk-agnostic MPC、risk-aware MPC 三组在同一长尾评测集上的 CVaR 碰撞指标。

arXiv 页面无稳定直链图片。

Graph: Paper Node 2602.23259