首页 > 新闻 > 硬件新闻 > 正文

NVIDIA官宣新GPU Rubin CPX!多达128GB显存、推理性能高达百万token

花韻仙語
发布: 2025-09-10 12:58:30
原创
286人浏览过

9月10日消息,传闻中的128gb显存rtx 5090并不存在。不过,nvidia确实推出了一款配备128gb显存的ai专用gpu。

据悉,NVIDIA下一代GPU架构代号为“Rubin”,预计将于明年正式亮相。

但就在今日,NVIDIA官方发布了“Rubin CPX”——这是一款专为长窗口AI推理和智能体工作负载设计的上下文处理GPU。

该产品基于全新的Rubin架构打造,采用单芯片方案。虽然CUDA核心数量尚未公布,但它配备了四个NVENC编码器和四个NVDEC解码器,以优化视频处理流程,并搭载了高达128GB的GDDR7显存。

根据NVIDIA公布的数据,Rubin CPX在NVFP4精度下峰值算力可达30 PFlops(每秒3亿亿次运算),能够支持百万级token的推理任务。

此外,在处理长上下文场景时,其注意力机制性能相较GB300 NVL72最多提升3倍。

AI Word
AI Word

一款强大的 AI 智能内容创作平台,致力于帮助用户高效生成高质量、原创且符合 SEO 规范的各类文章。

AI Word 226
查看详情 AI Word

需要指出的是,Rubin CPX目前仅为官方发布阶段,实际产品要到2026年底才会正式上市——没错,正是明年年底。

此前,NVIDIA已透露下一代Rubin GPU与Vera CPU已在台积电成功完成流片,进展符合预期。

NVIDIA官宣新GPU Rubin CPX!多达128GB显存、推理性能高达百万token

以上就是NVIDIA官宣新GPU Rubin CPX!多达128GB显存、推理性能高达百万token的详细内容,更多请关注php中文网其它相关文章!

相关标签:
数码产品性能查询
数码产品性能查询

该软件包括了市面上所有手机CPU,手机跑分情况,电脑CPU,电脑产品信息等等,方便需要大家查阅数码产品最新情况,了解产品特性,能够进行对比选择最具性价比的商品。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号