Title: MALLVI a multi agent framework for integrated generalized robotics manipulation Authors: Iman Ahmadi, Mehrshad Taji, Arad Mahdinezhad Kashani, AmirHossein Jadidi, Saina Kashani, Babak Khalaj arXiv: https://arxiv.org/abs/2602.16898
Problem framing
MALLVI 关注的是 LLM/VLM 机器人操作中的闭环脆弱性问题:单代理规划易开环漂移,失败后往往整链重规划成本高。方法上引入 Decomposer/Localizer/Thinker/Reflector 多代理协同,Reflector 仅激活相关子代理做局部纠错。
Core method
机制上可视作分层 POMDP 控制:高层语义分解,低层视觉定位,执行后由 VLM 反馈判定继续/回退。其关键不是“更大模型”,而是错误恢复路径更短。
Key equations and mechanisms
实验建议关注 zero-shot manipulation 成功率提升是否主要来自反思环节;再看失败类型分布是否从感知误差转向执行误差。
Experiment reading guide
局限:多代理 pipeline 引入时延与调用成本;在实时强控制任务中可能受限。
Limitations
未来可与 VLA policy 合并成端到端“可反思执行器”,并加入不确定性阈值触发机制。
Future work
复现切入:先复现单代理 baseline,再逐步加 Reflector 做 ablation。
Replication angle
Figure
https://arxiv.org/html/2602.16898/x1.png
Graph: Paper Node 2602.16898