Title: Observing and Controlling Features in Vision-Language-Action Models
Authors: Hugo Buurmeijer, Carmen Amo Alonso, Aiden Swann, Marco Pavone
arXiv: https://arxiv.org/abs/2603.05487

论文尝试把 mechanistic interpretability 引入 VLA,目标是识别内部特征与行为输出的因果联系,并探索可控干预。

若方法成立,其价值不在“可解释可视化”本身,而在能否支持失败诊断与策略修复:例如定位导致误操作的特征子空间,再通过特征编辑降低风险动作。

这对长期研究方向有意义,但短期部署价值取决于干预是否稳定、是否具备跨任务迁移。建议作为机制研究中优先级中等的跟踪项。

Graph: Paper Node 2603.05487