Title: WildOS: Open-Vocabulary Object Search in the Wild
Authors: Hardik Shah, Erica Tevere, Deegan Atha, Marcel Kaufmann, Shehryar Khattak, Manthan Patel, Marco Hutter, Jonas Frey, Patrick Spieler
arXiv: https://arxiv.org/abs/2602.19308
Problem framing
户外长距离对象搜索里,单纯 frontier exploration 往往“走得到但找不到”。论文将问题定义为语义检索与可通行性约束耦合:既要知道“去哪可能有目标”,也要知道“怎么安全过去”。
Core method
WildOS 将开放词汇检测/语义线索与导航规划统一到一套在线系统:
- 语义层给出目标存在概率热区;
- 几何/可行层给出 traversal 代价;
- 决策层选择信息增益与风险折中最优动作。
Key equations and mechanisms
可抽象成:
其中 表示目标识别信息增益, 为运动代价, 为地形/障碍风险。
Experiment reading guide
优先看:
- 无先验地图下的搜索成功率与时间;
- 开放词汇目标替换时的鲁棒性;
- 与纯几何探索基线在“长距离+稀有目标”条件下差距。
Limitations
- 开放词汇语义模块对域外视觉分布仍敏感。
- 极端天气/光照下感知失效会级联影响规划。
- 系统集成复杂,工程复现门槛偏高。
Future work
- 引入不确定性感知地图,做 risk-aware 语义探索;
- 融合语言先验(如“垃圾桶通常靠墙”)提升检索效率;
- 从单机扩展到多机器人协同搜索。
Replication angle
先做 ablation:固定导航器,仅替换语义打分模块;再逐步加入开放词汇与风险代价项,验证每个模块的边际贡献。
Key Figure: https://arxiv.org/html/2602.19308/x1.png
Alt Figure: https://arxiv.org/html/2602.19308/x2.png
Graph: Paper Node 2602.19308