首页 > 新闻 > IT新闻 > 正文

英伟达开源 NitroGen,统一的视觉到行动模型

霞舞
发布: 2025-12-22 18:45:02
原创
581人浏览过

英伟达研究团队近日正式对外开源了全新基础模型——nitrogen。据官方介绍,nitrogen 是一款统一的“视觉到动作”模型,能够直接从原始游戏画面帧中理解内容并实时输出对应的手柄操作指令,实现端到端的游戏交互。

英伟达开源 NitroGen,统一的视觉到行动模型

该模型以“玩游戏”为根本训练目标,覆盖范围极为广泛,涵盖《巫师3:狂猎》《赛博朋克2077》等在内的1000余款游戏,类型横跨RPG、竞速、大逃杀(吃鸡)、2D平台及3D开放世界等多种游戏形态。

NitroGen 的研发初衷并非单纯追求更高胜率或更优游戏表现的“AI玩家”,而是致力于探索一种更具泛化能力的具身智能训练路径——即在海量、多样化的虚拟仿真环境中,习得跨越不同物理规则与交互逻辑的通用运动控制策略。

研究人员观察到,原本为机器人控制任务设计的 GR00T N1.5 模型,在未经显著调整的前提下,便能在机制迥异的各类游戏中展现出极强的任务迁移能力,这为 NitroGen 的架构设计提供了关键启发。

Stable Video
Stable Video

Stability AI 发布的开源AI视频大模型,用文字或图像创建视频,把你的概念变成迷人的电影

Stable Video 227
查看详情 Stable Video

英伟达开源 NitroGen,统一的视觉到行动模型

NitroGen 的核心构成包含三大要素:

  • 一个规模超4万小时、高质量、完全公开的真实游戏视频数据集;
  • 一个专为连续动作空间优化、具备强大运动建模能力的基础模型;
  • 一套通用 Gym API 接口,支持将任意游戏二进制程序封装为可执行环境,用于高效 rollout 推理与训练。

该数据集囊括800多款游戏,其中每款均提供不少于1小时的高质量行为轨迹;另有15款热门游戏的数据时长突破1000小时。值得一提的是,NitroGen 实现了全式开源:预训练权重、完整动作标注数据集、训练与推理代码、以及详尽的技术白皮书全部开放。

项目主页:https://www.php.cn/link/dd31058a4e2ad163eb0c08c07dea8dfb
源码地址:点击下载

以上就是英伟达开源 NitroGen,统一的视觉到行动模型的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号