0

0

地平线Aux-Think:为什么测试时推理反而让机器人「误入歧途」?丨开发者说

蓮花仙者

蓮花仙者

发布时间:2025-07-10 16:12:38

|

729人浏览过

|

来源于php中文网

原创

地平线aux-think:为什么测试时推理反而让机器人「误入歧途」?丨开发者说

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

地平线Aux-Think:为什么测试时推理反而让机器人「误入歧途」?丨开发者说

• 论文题目:

Aux-Think: 探索数据高效视觉语言导航的推理策略

• 论文链接:

https://www.php.cn/link/5e0096402339448552f8dff7015d901d

• 项目主页:

https://www.php.cn/link/680c256fb6e2c27e27a9d268e8379690

视觉语言导航(VLN)中的推理机制研究

在视觉语言导航任务中,智能体需依据自然语言指令在复杂场景中进行实时路径决策。尽管推理机制已在多个领域取得成功,但在VLN任务中其作用尚未被深入研究。我们首次系统性地分析了不同推理策略对VLN任务的影响,并发现当前主流的两种推理方法(Pre-Think与Post-Think)在测试阶段反而会降低导航性能,导致任务失败。针对这一问题,我们提出了Aux-Think框架,通过结构创新有效解决了推理带来的负面影响。

地平线Aux-Think:为什么测试时推理反而让机器人「误入歧途」?丨开发者说

Aux-Think在多种推理策略中表现更优

地平线Aux-Think:为什么测试时推理反而让机器人「误入歧途」?丨开发者说

Aux-Think实现了数据效率与成功率的最佳平衡

测试阶段推理存在的难题

设想一位驾驶员在行驶过程中不断回顾交通法规并反复分析路况才做出判断。虽然这种做法有助于理解环境,但在面对陌生或复杂情况时,过度依赖理论分析可能导致判断失误。

在视觉语言导航任务中,推理过程类似于“复习规则”,而实际操作则对应于“驾驶行为”。虽然推理旨在帮助智能体理解任务要求,但当进入训练未覆盖的状态时,思维链可能产生幻觉。特别是在不熟悉环境中,过度依赖推理不仅无法提升决策质量,反而会干扰行动、累积误差,最终导致导航失败。这种“推理失效”现象正是Aux-Think所致力于解决的核心问题。

地平线Aux-Think:为什么测试时推理反而让机器人「误入歧途」?丨开发者说

神笔马良
神笔马良

神笔马良 - AI让剧本一键成片。

下载

长推理链中的微小错误(标红)也会引发决策偏差

Aux-Think的解决方案

为应对上述挑战,我们提出了一种全新的推理训练框架——Aux-Think。其核心思想是:在训练阶段利用推理辅助模型学习,而在测试阶段让智能体直接基于已掌握的知识进行决策,不再执行推理生成。具体设计如下:

训练阶段:通过引导模型完成推理任务,使其内化推理逻辑。

测试阶段:仅依赖训练阶段习得的知识进行动作预测,跳过推理步骤。

该设计有效规避了测试阶段推理带来的不确定性,使智能体能够更专注于任务本身,减少推理过程中的潜在干扰。

地平线Aux-Think:为什么测试时推理反而让机器人「误入歧途」?丨开发者说

上图展示了一个典型导航任务:“穿过房间,走到右侧拱门并停在玻璃桌旁”。三种策略在相同环境下表现出显著差异:Pre-Think模型试图在行动前完整规划路径,误判为“前进75cm”,却忽略了当前尚未穿越房间;Post-Think模型在执行后才意识到未见拱门,但错误已不可逆;而Aux-Think在训练阶段学习推理逻辑,测试阶段直接根据观察判断“右转15度”,精准识别目标位置,顺利完成任务。

实验结果验证有效性

大量实验证明,Aux-Think在数据利用效率和导航性能方面均优于现有方法。即便使用较少训练数据,Aux-Think仍能在多个VLN基准测试中达到单目视觉方法中的最高成功率。通过将推理过程限制在训练阶段,该方法有效缓解了测试阶段的推理幻觉与错误传播,在长距离动态导航任务中展现出更强泛化能力与稳定性。

地平线Aux-Think:为什么测试时推理反而让机器人「误入歧途」?丨开发者说

R2R-CE指标显示:在视觉语言导航任务的R2R验证集(Val-Unseen)上,Aux-Think以更少训练数据取得领先的成功率(SR)。

RxR-CE指标显示:由于RxR比R2R更大更复杂,Aux-Think在该验证集上的成功率优势更为明显,体现出卓越的泛化能力。

总结与未来方向

Aux-Think为解决测试阶段推理带来的导航问题提供了新思路。通过训练阶段引入推理指导、测试阶段去除推理负担的设计,使智能体能够更专注地执行任务,从而提升导航稳定性与准确性。这一成果为机器人在实际应用中的表现奠定了坚实基础,也为具身智能推理策略的研究提供了重要参考。

相关专题

更多
http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1922

2024.08.16

c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

79

2026.01.09

c++框架学习教程汇总
c++框架学习教程汇总

本专题整合了c++框架学习教程汇总,阅读专题下面的文章了解更多详细内容。

46

2026.01.09

学python好用的网站推荐
学python好用的网站推荐

本专题整合了python学习教程汇总,阅读专题下面的文章了解更多详细内容。

122

2026.01.09

学python网站汇总
学python网站汇总

本专题整合了学python网站汇总,阅读专题下面的文章了解更多详细内容。

12

2026.01.09

python学习网站
python学习网站

本专题整合了python学习相关推荐汇总,阅读专题下面的文章了解更多详细内容。

16

2026.01.09

俄罗斯手机浏览器地址汇总
俄罗斯手机浏览器地址汇总

汇总俄罗斯Yandex手机浏览器官方网址入口,涵盖国际版与俄语版,适配移动端访问,一键直达搜索、地图、新闻等核心服务。

71

2026.01.09

漫蛙稳定版地址大全
漫蛙稳定版地址大全

漫蛙稳定版地址大全汇总最新可用入口,包含漫蛙manwa漫画防走失官网链接,确保用户随时畅读海量正版漫画资源,建议收藏备用,避免因域名变动无法访问。

373

2026.01.09

php学习网站大全
php学习网站大全

精选多个优质PHP入门学习网站,涵盖教程、实战与文档,适合零基础到进阶开发者,助你高效掌握PHP编程。

47

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
XML教程
XML教程

共142课时 | 5.5万人学习

【web前端】Node.js快速入门
【web前端】Node.js快速入门

共16课时 | 2万人学习

ECMAScript6 / ES6---十天技能课堂
ECMAScript6 / ES6---十天技能课堂

共25课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号