Title: System Identification under Constraints and Disturbance: A Bayesian Estimation Approach
Authors: Sergi Martinez, Steve Tonneau, Carlos Mastalli
arXiv: https://arxiv.org/abs/2602.16358

Problem framing

这篇工作瞄准机器人系统辨识里最常见的断裂点:把动力学可解释性、接触/闭环约束、摩擦非线性和可扩展计算同时放进一个统一估计器。很多实践流程把“状态估计”和“参数辨识”分开做,结果是在接触丰富场景(腿足、移动操作)里,参数可观测性与一致性都明显退化。

Core method

作者提出贝叶斯 SysID 框架,把逆动力学一致性、接触约束、闭环约束直接作为 stage-wise hard constraints;同时引入能量观测回归器提升参数可观测性,并对惯性/驱动参数支持等式与不等式先验。估计器核心不是传统批量高斯近似,而是带约束结构的递推解法。

Key equations and mechanisms

统一优化可写成:

subject to

关键机制是参数化 equality-constrained Riccati recursion:在保持带状稀疏结构下把时域复杂度压到线性级,实用上比“全量稠密求解+数值微分”更稳、更快。

Experiment reading guide

先看 Unitree B1+Z1 的对比:收敛速度、惯量误差、摩擦误差、接触一致性四个指标都优于 forward-dynamics 与 decoupled baseline。再看把辨识模型接入 MPC 后的轨迹跟踪提升,能看出该方法价值不止“离线标定”,而是直接改善闭环控制。

Limitations

对高质量关节/力传感与动力学建模完整性依赖较强;如果接触模型与真实差距大,硬约束可能带来偏置而非鲁棒性提升。

Future work

可延展到在线自适应 SysID(边运行边更新后验)、跨本体参数迁移,以及与 learned residual dynamics 的混合建模。

Replication angle

优先复现实验里的“能量观测增强 + 约束 Riccati”两项增益来源;若在你自己的腿足平台落地,建议先做无接触段校准,再逐步加入接触段约束,观察可观测性变化。

图链接(可直链渲染):

Graph: Paper Node 2602.16358