Title: WildOS: Open-Vocabulary Object Search in the Wild
Authors: Hardik Shah, Erica Tevere, Deegan Atha, Marcel Kaufmann, Shehryar Khattak, Manthan Patel, Marco Hutter, Jonas Frey, Patrick Spieler
arXiv: https://arxiv.org/abs/2602.19308

Problem framing

户外长距离对象搜索里,单纯 frontier exploration 往往“走得到但找不到”。论文将问题定义为语义检索与可通行性约束耦合:既要知道“去哪可能有目标”,也要知道“怎么安全过去”。

Core method

WildOS 将开放词汇检测/语义线索与导航规划统一到一套在线系统:

  • 语义层给出目标存在概率热区;
  • 几何/可行层给出 traversal 代价;
  • 决策层选择信息增益与风险折中最优动作。

Key equations and mechanisms

可抽象成:

其中 表示目标识别信息增益, 为运动代价, 为地形/障碍风险。

Experiment reading guide

优先看:

  1. 无先验地图下的搜索成功率与时间;
  2. 开放词汇目标替换时的鲁棒性;
  3. 与纯几何探索基线在“长距离+稀有目标”条件下差距。

Limitations

  • 开放词汇语义模块对域外视觉分布仍敏感。
  • 极端天气/光照下感知失效会级联影响规划。
  • 系统集成复杂,工程复现门槛偏高。

Future work

  • 引入不确定性感知地图,做 risk-aware 语义探索;
  • 融合语言先验(如“垃圾桶通常靠墙”)提升检索效率;
  • 从单机扩展到多机器人协同搜索。

Replication angle

先做 ablation:固定导航器,仅替换语义打分模块;再逐步加入开放词汇与风险代价项,验证每个模块的边际贡献。

Key Figure: https://arxiv.org/html/2602.19308/x1.png
Alt Figure: https://arxiv.org/html/2602.19308/x2.png

Graph: Paper Node 2602.19308