1月8日最新消息,内存价格大幅攀升带动显存成本上涨,致使amd与nvidia两大gpu厂商承压。此前我们已报道amd的应对方案——保证供货不断档,但终端售价或将上调。
那么NVIDIA又将如何应对?在刚刚落幕的CES展会上,黄仁勋透露了一项关键举措:重启RTX 30系列显卡产线,其中RTX 3060将成为重点回归型号。
这款显卡曾长期稳居Steam平台最受欢迎游戏显卡榜首,是60系产品中口碑与销量兼具的经典之作。它基于三星8nm制程打造,在1080p分辨率下仍能流畅运行当前主流游戏(当然,若执意开启全极致画质,那另当别论)。
除重推旧款外,黄仁勋还释放了一个更具战略意义的信号:将AI能力下沉至前代显卡平台。他坦言这需要投入大量工程资源,技术上虽具挑战性,但完全可行,值得深入探索。
事实上,NVIDIA早已悄然落地相关动作——近期一项看似低调却意义深远的更新正式上线:为全系RTX显卡加入NVFP4支持,且覆盖范围远不止新一代RTX 50系列,RTX 40及RTX 30系列同样获得兼容。
关于FP4算法的价值,我们此前已有解读:相比FP16、FP8,它可在显著提升AI推理性能的同时,大幅压缩显存占用——理论显存需求仅为FP16的1/4,且精度损失微乎其微。
而NVFP4则是NVIDIA自主优化的FP4实现方案,效能更进一步。需注意的是,该技术仅在Blackwell架构显卡中为原生支持,RTX 40与RTX 30系列则通过软件层模拟实现。

启用NVFP4后,实际表现如何?NVIDIA官方公布了实测数据:不同AI模型下的加速效果存在差异,最低提升幅度达30%–40%,部分场景甚至实现性能翻倍;在Qwen Image模型中,最高提速幅度高达360%。

更值得关注的是显存占用的断崖式下降:Flux.1模型从23GB降至9GB,Flux.2模型由87GB骤减至26GB,Qwen Image亦从40GB压缩至18GB。整体来看,显存节省比例普遍达50%以上,部分模型甚至可减少约2/3。












