Safety Beyond the Training Data Robust Out-of-Distribution MPC via Conformalized System Level Synthesis

Title: Safety Beyond the Training Data: Robust Out-of-Distribution MPC via Conformalized System Level Synthesis
Authors: Anutam Srinivasan, Antoine Leeman, Glen Chou
arXiv: https://arxiv.org/abs/2602.12047

Problem framing

这篇工作直击机器人学习控制的核心痛点：训练分布内模型预测很准，但一旦进入 OOD 区域，MPC 的约束可行性与安全性迅速恶化。作者把问题定义为“学习模型误差可校准 + 控制优化可收缩”的联合设计，而不是只在控制器端做保守裕度。

Core method

核心是把加权 conformal prediction (CP) 生成的高置信误差集合，嵌入 system level synthesis (SLS) 形式的鲁棒非线性 MPC：

学习状态-控制相关的协方差模型，估计局部误差尺度；
用 weighted CP 形成分位数误差上界；
在 SLS 中按预测时域做约束收紧，且收紧体积经过优化，避免过保守。

Key equations and mechanisms

机制可概括为： $x_{t + 1} = f_{θ} (x_{t}, u_{t}) + w_{t}, w_{t} \in W_{t}^{1 - α}$ 其中 $W_{t}^{1 - α}$ 由 CP 提供覆盖保证。MPC 优化时对约束集合做 Minkowski 收缩，保证在 $1 - α$ 置信下满足安全约束。SLS 参数化把“闭环响应可实现性”显式化，减少了传统 tube-MPC 在学习模型下的保守失配。

Experiment reading guide

优先看三组结果：

OOD 扰动强度上升时的约束违规率曲线；
不同误差集合构造（固定球/椭球/CP）的可行性-性能折中；
长时域任务中累计成本与失败率的共同变化。如果你关心落地，重点看“约束收紧体积优化”是否真正改善了保守性。

Limitations

CP 质量仍依赖校准集与协方差模型；
在线复杂度高于普通学习型 MPC；
理论覆盖保证与真实系统非平稳漂移之间仍有 gap。

Future work

可沿三条线推进：分布漂移下的在线再校准、接触动力学场景的非高斯误差集、以及多机器人耦合约束下的分布鲁棒 SLS。

Replication angle

复现建议先做“简化动力学 + 人工 OOD 扰动”基准，验证覆盖率与违规率是否匹配；再迁移到操作或移动平台。关键工程点在于 CP 校准流水线和 SLS 求解器稳定性。

Figure links

关键图（本地提取，可在 Obsidian 渲染）：../../out/telegram-cards/2026-02-14/2602.12047/ellip_ball_comparison_overlay.png
arXiv 页面无稳定直链图片（已从 source 提取）

Graph: Paper Node 2602.12047