MALLVI a multi agent framework for integrated generalized robotics manipulation

Title: MALLVI a multi agent framework for integrated generalized robotics manipulation Authors: Iman Ahmadi, Mehrshad Taji, Arad Mahdinezhad Kashani, AmirHossein Jadidi, Saina Kashani, Babak Khalaj arXiv: https://arxiv.org/abs/2602.16898

Problem framing

MALLVI 关注的是 LLM/VLM 机器人操作中的闭环脆弱性问题：单代理规划易开环漂移，失败后往往整链重规划成本高。方法上引入 Decomposer/Localizer/Thinker/Reflector 多代理协同，Reflector 仅激活相关子代理做局部纠错。

Core method

机制上可视作分层 POMDP 控制：高层语义分解，低层视觉定位，执行后由 VLM 反馈判定继续/回退。其关键不是“更大模型”，而是错误恢复路径更短。

Key equations and mechanisms

实验建议关注 zero-shot manipulation 成功率提升是否主要来自反思环节；再看失败类型分布是否从感知误差转向执行误差。

Experiment reading guide

局限：多代理 pipeline 引入时延与调用成本；在实时强控制任务中可能受限。

Limitations

未来可与 VLA policy 合并成端到端“可反思执行器”，并加入不确定性阈值触发机制。

Future work

复现切入：先复现单代理 baseline，再逐步加 Reflector 做 ablation。

Replication angle

Figure

https://arxiv.org/html/2602.16898/x1.png

Graph: Paper Node 2602.16898