Interface Aware Trajectory Reconstruction of Limited Demonstrations for Robot Learning

Title: Interface-Aware Trajectory Reconstruction of Limited Demonstrations for Robot Learning
Authors: Demiana R. Barsoum, Mahdieh Nejati Javaremi, Larisa Y. C. Loke, Brenna D. Argall
arXiv: https://arxiv.org/abs/2602.23287

Problem framing

辅助机器人场景里，用户常用低维输入设备（如 sip-and-puff）控制高自由度机械臂，导致示教轨迹携带“接口限制噪声”，并非真实操作意图。直接 imitation 会把这种次优路径学进去。

Core method

论文提出 interface-aware trajectory reconstruction：显式建模“用户意图轨迹”与“接口投影轨迹”的差异，在有限示教下重建更接近真实意图的高维轨迹，再用于学习策略。

Key equations and mechanisms

可写为受限反演问题：

τ^{*} = ar g τ min ∥ P (τ) - u ∥^{2} + λ R (τ),

其中 $u$ 是接口观测控制信号， $P$ 为接口映射算子， $R$ 编码运动平滑与任务可行性先验。关键点是把“输入受限”作为观测模型，而不是把观测直接当 ground truth。

Experiment reading guide

重点关注：少样本示教条件下的成功率、轨迹效率（路径长度/时间）、以及对不同接口噪声强度的鲁棒性。

Limitations

映射算子 $P$ 的建模质量决定上限；
用户个体差异较大时需个性化校准；
当前更多验证在特定辅助任务，通用操作场景还需扩展。

Future work

与 online preference learning 结合可形成“边用边纠偏”的自适应辅助控制；也可引入不确定性估计，识别高风险重建区间并请求人类确认。

Replication angle

复现建议先做合成退化实验（完整轨迹 → 低维接口投影），再比较重建误差与策略成功率，确认方法能否真正恢复“意图变量”。

arXiv 页面无稳定直链图片。

Graph: Paper Node 2602.23287