Title: Interface-Aware Trajectory Reconstruction of Limited Demonstrations for Robot Learning
Authors: Demiana R. Barsoum, Mahdieh Nejati Javaremi, Larisa Y. C. Loke, Brenna D. Argall
arXiv: https://arxiv.org/abs/2602.23287

Problem framing

辅助机器人场景里,用户常用低维输入设备(如 sip-and-puff)控制高自由度机械臂,导致示教轨迹携带“接口限制噪声”,并非真实操作意图。直接 imitation 会把这种次优路径学进去。

Core method

论文提出 interface-aware trajectory reconstruction:显式建模“用户意图轨迹”与“接口投影轨迹”的差异,在有限示教下重建更接近真实意图的高维轨迹,再用于学习策略。

Key equations and mechanisms

可写为受限反演问题:

其中 是接口观测控制信号, 为接口映射算子, 编码运动平滑与任务可行性先验。关键点是把“输入受限”作为观测模型,而不是把观测直接当 ground truth。

Experiment reading guide

重点关注:少样本示教条件下的成功率、轨迹效率(路径长度/时间)、以及对不同接口噪声强度的鲁棒性。

Limitations

  • 映射算子 的建模质量决定上限;
  • 用户个体差异较大时需个性化校准;
  • 当前更多验证在特定辅助任务,通用操作场景还需扩展。

Future work

与 online preference learning 结合可形成“边用边纠偏”的自适应辅助控制;也可引入不确定性估计,识别高风险重建区间并请求人类确认。

Replication angle

复现建议先做合成退化实验(完整轨迹 → 低维接口投影),再比较重建误差与策略成功率,确认方法能否真正恢复“意图变量”。

arXiv 页面无稳定直链图片。

Graph: Paper Node 2602.23287