Risk-Aware World Model Predictive Control for Generalizable End-to-End Autonomous Driving

Title: Risk-Aware World Model Predictive Control for Generalizable End-to-End Autonomous Driving
Authors: Jiangxin Sun, Feng Xue, Teng Long, Chang Liu, Jian-Fang Hu, Wei-Shi Zheng
arXiv: https://arxiv.org/abs/2602.23259

Problem framing

端到端自动驾驶 imitation-only 路线在长尾风险场景泛化不足。该工作希望把“世界模型可预测性”与“风险约束控制”显式耦合，降低 rare-event 失效。

Core method

核心思想：在世界模型 rollout 上执行风险感知 MPC，既拟合专家行为，又在规划时规避高风险轨迹。

抽象目标：

a_{0 : H} min t = 0 \sum H ℓ_{t a s k} (s_{t}, a_{t}) + λ R (s_{t}, a_{t})

其中 $R$ 是风险项（如碰撞概率/尾部损失近似），由世界模型支持前瞻估计。

Key equations and mechanisms

关键机制是把 imitation 学到的“常规行为先验”与 MPC 的“风险重规划”分层：

常态场景保持效率；
长尾场景通过风险项放大安全边际。

Experiment reading guide

建议重点核查：

长尾场景（遮挡突发、并线干扰）提升是否显著；
安全指标与驾驶舒适性之间的权衡曲线；
世界模型误差对风险评估偏差的敏感性。

Limitations

风险估计质量强依赖世界模型外推能力；
MPC 实时性在高动态交通中可能受算力约束；
风险权重需任务化调参。

Future work

引入 conformal 风险校准减少置信偏差；
多模态不确定性分解（感知/预测/控制）；
面向机器人通用导航任务迁移。

Replication angle

复现实验可固定感知与动力学模块，仅比较 imitation-only、risk-agnostic MPC、risk-aware MPC 三组在同一长尾评测集上的 CVaR 碰撞指标。

arXiv 页面无稳定直链图片。

Graph: Paper Node 2602.23259