Title: Interface-Aware Trajectory Reconstruction of Limited Demonstrations for Robot Learning
Authors: Demiana R. Barsoum, Mahdieh Nejati Javaremi, Larisa Y. C. Loke, Brenna D. Argall
arXiv: https://arxiv.org/abs/2602.23287
Problem framing
辅助机器人场景里,用户常用低维输入设备(如 sip-and-puff)控制高自由度机械臂,导致示教轨迹携带“接口限制噪声”,并非真实操作意图。直接 imitation 会把这种次优路径学进去。
Core method
论文提出 interface-aware trajectory reconstruction:显式建模“用户意图轨迹”与“接口投影轨迹”的差异,在有限示教下重建更接近真实意图的高维轨迹,再用于学习策略。
Key equations and mechanisms
可写为受限反演问题:
其中 是接口观测控制信号, 为接口映射算子, 编码运动平滑与任务可行性先验。关键点是把“输入受限”作为观测模型,而不是把观测直接当 ground truth。
Experiment reading guide
重点关注:少样本示教条件下的成功率、轨迹效率(路径长度/时间)、以及对不同接口噪声强度的鲁棒性。
Limitations
- 映射算子 的建模质量决定上限;
- 用户个体差异较大时需个性化校准;
- 当前更多验证在特定辅助任务,通用操作场景还需扩展。
Future work
与 online preference learning 结合可形成“边用边纠偏”的自适应辅助控制;也可引入不确定性估计,识别高风险重建区间并请求人类确认。
Replication angle
复现建议先做合成退化实验(完整轨迹 → 低维接口投影),再比较重建误差与策略成功率,确认方法能否真正恢复“意图变量”。
arXiv 页面无稳定直链图片。
Graph: Paper Node 2602.23287