哈尔滨工业大学(深圳)智能媒体技术研究中心

当前位置: 首页 > 新闻通知 > 科学研究 > 正文
科学研究

哈工深无人机目标导航新基准!UAV-ON:开放世界空中智能体目标导向导航基准测试

2025-08-30 17:51

哈工深无人机目标导航新基准!UAV-ON:开放世界空中智能体目标导向导航基准测试

  • 作者:Jianqiang Xiao, Yuexuan Sun, Yixin Shao, Boxi Gan, Rongqiang Liu, Yanjing Wu, Weili Gua, Xiang Deng·

  • 单位:哈尔滨工业大学(深圳)

  • 论文标题:UAV-ON: A Benchmark for Open-World Object Goal Navigation with Aerial Agents

  • 论文链接:https://arxiv.org/pdf/2508.00288

  • 代码链接:https://github.com/Kyaren/UAV_ON


主要贡献

  • 提出首个大规模的开放世界环境中基于语义目标指令的 无人机目标导航基准UAV-ON 。UAV-ON定义了超过11000个导航任务,涵盖14个高保真户外场景,这些场景具有多样化的布局和真实的物体放置。
  • UAV-ON要求无人机在 复杂的真实环境 中执行离散的、参数化的动作,通过物理模拟进行导航,同时处理障碍物规避和碰撞动力学等现实挑战。
  • 提出了 一组无人机目标导航的基线策略 ,包括随机策略、基于CLIP的语义启发算法(CLIP-H),以及提出的空中目标导航智能体(AOA)。

摘要:空中导航是嵌入式智能中一种基本但尚未充分探索的能力,使特工能够在大规模、非结构化的环境中作战传统导航范式不足。然而,大多数现有的研究遵循视觉和语言导航(VLN)范式,该范式严重依赖顺序语言指令,限制了其可扩展性和自主性。为了弥补这一差距,我们引入了UAV-ON,这是大规模Object的基准空中特工在开放世界环境中的目标导航(ObjectNav),其中代理基于高级语义目标进行操作,而不依赖于VLN中的详细指导。UAV-ON包括14个高保真虚幻引擎具有不同语义区域和复杂空间布局的环境,涵盖城市、自然和混合用途环境。它定义了1270个带注释的目标对象,每个都以一个实例级指令为特征,该指令对类别、物理足迹和视觉描述符,允许有根据的推理。这些说明作为语义目标,引入现实歧义和复杂推理空中特工面临的挑战。为了评估基准,我们实现了几个基线方法,包括空中目标导航代理(AOA)——一种模块化策略它将指令语义与以自我为中心的长期观察相结合,目标导向的探索。实证结果表明,所有基线在这方面都存在困难设置,突出航空导航和语义的复合挑战目标接地。UAV-ON旨在推进可扩展无人机自主性的研究

由复杂现实世界环境中的语义目标描述驱动。

哈尔滨工业大学(深圳)智能媒体技术研究中心
联系我们

电话: +86-755-26032463 邮编: 518055

中国深圳西丽深圳大学城哈工大校区L栋