Title: IRIS: Learning-Driven Task-Specific Cinema Robot Arm for Visuomotor Motion Control
Authors: Qilong Cheng, Matthew Mackay, Ali Bereyhi
arXiv: https://arxiv.org/abs/2602.17537
Problem framing
影视机位机器人存在“高成本工业平台 vs. 低门槛创作需求”的落差。IRIS 关注任务特化型低成本机械臂,目标是在人类示教下学习平滑、可复现的镜头轨迹。
Core method
硬件侧采用 3D 打印 6-DoF 机械臂;算法侧采用 ACT 风格 chunked visuomotor imitation,通过目标条件输入学习对象中心相机运动,而非手工几何编程。
Key equations and mechanisms
方法核心可抽象为 chunk-level 模仿目标:
把长时程轨迹分块预测可降低逐帧噪声放大,并提升运动连贯性。
Experiment reading guide
先看成本/精度/负载三指标,再看不同摄影动作上的泛化结果,最后看失败案例(快速运动、遮挡)理解边界。
Limitations
方法更偏工程整合,理论机制深度有限;在复杂动态场景下,纯示教策略可能受分布外干扰显著。
Future work
可与语言条件镜头语义结合,演化为轻量 VLA 摄影代理;也可加入安全约束层避免近人机位风险。
Replication angle
建议先复现静态目标镜头,再逐步增加目标移动与遮挡扰动,评估 chunk 长度对平滑性和延迟的影响。
Figure
arXiv 页面无稳定直链图片;建议参考 PDF Fig.1/Fig.4:https://arxiv.org/pdf/2602.17537.pdf
Graph: Paper Node 2602.17537