Title: Safety Beyond the Training Data: Robust Out-of-Distribution MPC via Conformalized System Level Synthesis
Authors: Anutam Srinivasan, Antoine Leeman, Glen Chou
arXiv: https://arxiv.org/abs/2602.12047

Problem framing

这篇工作直击机器人学习控制的核心痛点:训练分布内模型预测很准,但一旦进入 OOD 区域,MPC 的约束可行性与安全性迅速恶化。作者把问题定义为“学习模型误差可校准 + 控制优化可收缩”的联合设计,而不是只在控制器端做保守裕度。

Core method

核心是把加权 conformal prediction (CP) 生成的高置信误差集合,嵌入 system level synthesis (SLS) 形式的鲁棒非线性 MPC:

  1. 学习状态-控制相关的协方差模型,估计局部误差尺度;
  2. 用 weighted CP 形成分位数误差上界;
  3. 在 SLS 中按预测时域做约束收紧,且收紧体积经过优化,避免过保守。

Key equations and mechanisms

机制可概括为: 其中 由 CP 提供覆盖保证。MPC 优化时对约束集合做 Minkowski 收缩,保证在 置信下满足安全约束。SLS 参数化把“闭环响应可实现性”显式化,减少了传统 tube-MPC 在学习模型下的保守失配。

Experiment reading guide

优先看三组结果:

  • OOD 扰动强度上升时的约束违规率曲线;
  • 不同误差集合构造(固定球/椭球/CP)的可行性-性能折中;
  • 长时域任务中累计成本与失败率的共同变化。 如果你关心落地,重点看“约束收紧体积优化”是否真正改善了保守性。

Limitations

  • CP 质量仍依赖校准集与协方差模型;
  • 在线复杂度高于普通学习型 MPC;
  • 理论覆盖保证与真实系统非平稳漂移之间仍有 gap。

Future work

可沿三条线推进:分布漂移下的在线再校准、接触动力学场景的非高斯误差集、以及多机器人耦合约束下的分布鲁棒 SLS。

Replication angle

复现建议先做“简化动力学 + 人工 OOD 扰动”基准,验证覆盖率与违规率是否匹配;再迁移到操作或移动平台。关键工程点在于 CP 校准流水线和 SLS 求解器稳定性。

  • 关键图(本地提取,可在 Obsidian 渲染):../../out/telegram-cards/2026-02-14/2602.12047/ellip_ball_comparison_overlay.png
  • arXiv 页面无稳定直链图片(已从 source 提取)

Graph: Paper Node 2602.12047