System Identification under Constraints and Disturbance

Title: System Identification under Constraints and Disturbance: A Bayesian Estimation Approach
Authors: Sergi Martinez, Steve Tonneau, Carlos Mastalli
arXiv: https://arxiv.org/abs/2602.16358

Problem framing

这篇工作瞄准机器人系统辨识里最常见的断裂点：把动力学可解释性、接触/闭环约束、摩擦非线性和可扩展计算同时放进一个统一估计器。很多实践流程把“状态估计”和“参数辨识”分开做，结果是在接触丰富场景（腿足、移动操作）里，参数可观测性与一致性都明显退化。

Core method

作者提出贝叶斯 SysID 框架，把逆动力学一致性、接触约束、闭环约束直接作为 stage-wise hard constraints；同时引入能量观测回归器提升参数可观测性，并对惯性/驱动参数支持等式与不等式先验。估计器核心不是传统批量高斯近似，而是带约束结构的递推解法。

Key equations and mechanisms

统一优化可写成：

x_{0 : T}, θ min t = 0 \sum T ∥ y_{t} - h (x_{t}, θ) ∥_{R^{- 1}}^{2} + ∥ θ - θ_{0} ∥_{Σ_{0}^{- 1}}^{2}

subject to

f (x_{t}, x_{t + 1}, u_{t}, θ) = 0, c_{e q} (x_{t}, θ) = 0, c_{in} (x_{t}, θ) \leq 0.

关键机制是参数化 equality-constrained Riccati recursion：在保持带状稀疏结构下把时域复杂度压到线性级，实用上比“全量稠密求解+数值微分”更稳、更快。

Experiment reading guide

先看 Unitree B1+Z1 的对比：收敛速度、惯量误差、摩擦误差、接触一致性四个指标都优于 forward-dynamics 与 decoupled baseline。再看把辨识模型接入 MPC 后的轨迹跟踪提升，能看出该方法价值不止“离线标定”，而是直接改善闭环控制。

Limitations

对高质量关节/力传感与动力学建模完整性依赖较强；如果接触模型与真实差距大，硬约束可能带来偏置而非鲁棒性提升。

Future work

可延展到在线自适应 SysID（边运行边更新后验）、跨本体参数迁移，以及与 learned residual dynamics 的混合建模。

Replication angle

优先复现实验里的“能量观测增强 + 约束 Riccati”两项增益来源；若在你自己的腿足平台落地，建议先做无接触段校准，再逐步加入接触段约束，观察可观测性变化。

图链接（可直链渲染）：

https://arxiv.org/html/2602.16358v1/Figures/Results/kangaroo_seq_lr.png

Graph: Paper Node 2602.16358

System Identification under Constraints and Disturbance - A Bayesian Estimation Approach