comfyui、ltx-2、llama.cpp、ollama、hyperlink 等迎来全面 rtx 加速,解锁 ai pc 上的视频、图像与文本生成应用场景

2025 年堪称 PC 端 AI 技术跃进的关键之年。
PC 级小语言模型(SLM)的推理准确率相较 2024 年实现近两倍增长,大幅弥合了与顶尖云端大语言模型(LLM)之间的能力鸿沟。与此同时,面向本地部署的 AI 开发工具生态日趋成熟——Ollama、ComfyUI、llama.cpp、Unsloth 等平台热度激增,用户下载量同比翻番,而 PC 端模型下载人次更飙升至 2024 年的十倍之多。
上述演进正加速推动生成式 AI 在 2026 年深度融入大众创作者、游戏玩家及高效能生产力用户的日常场景。
在 CES 展会上,NVIDIA 宣布面向 GeForce RTX、NVIDIA RTX PRO 及 NVIDIA DGX Spark 设备推出一揽子 AI 性能升级方案,旨在显著释放 PC 端生成式 AI 的运行潜力,并大幅缓解显存压力,具体涵盖:
依托 PyTorch-CUDA 深度优化,并在 ComfyUI 中原生集成 NVFP4 / FP8 低精度计算支持,图像与视频生成类 AI 工作流性能最高提升达 3 倍,显存占用最多减少 60%;在 ComfyUI 内置 RTX 视频超分辨率(RTX VSR)功能,实现实时 4K 视频生成加速;针对 Lightricks 行业标杆级音视频生成模型 LTX-2 的开源权重版本完成专项调优,正式发布 NVIDIA NVFP8 量化模型;推出基于 Blender 3D 场景驱动的 4K AI 视频生成 AI Blueprint,赋予创作者对输出质量与风格的精细把控力;通过底层加速 Ollama 与 llama.cpp,小语言模型(SLM)推理效率最高提升 35%;为 Nexa.ai 全新推出的 Hyperlink 视频语义搜索功能提供端到端 RTX 加速支持。
这些升级使用户得以在本地无缝执行前沿的视频、图像与自然语言处理任务,同时充分享有 RTX AI PC 所带来的数据隐私保障、运行安全可靠以及毫秒级响应延迟等核心优势。
RTX PC 实现 3 倍提速的 4K 视频生成
尽管生成式 AI 已能产出极具视觉冲击力的视频内容,但纯依赖文本提示的在线服务往往难以实现精准构图与风格控制;而生成 4K 分辨率视频,在以往几乎无法在消费级 PC 上落地——受限于模型参数规模庞大,常规显存容量根本无法承载。
1月6日,NVIDIA 正式发布一套由 RTX 全链路加速的视频生成工作流,助力创作者既可精准调控画面逻辑与艺术表达,又能以三倍速完成高质量 4K 视频输出,且仅需极低显存开销。
该工作流适配现代创作流程:从分镜脚本出发,逐帧生成照片级写实关键帧,最终合成连贯、高保真的 4K 视频。整套系统由三大模块化 AI Blueprint 构成,支持艺术家按需组合、灵活调整:
3D 物体生成器:用于快速构建场景所需三维资产;
3D 引导的图像生成器:用户可在 Blender 中搭建完整三维环境,并据此生成高度逼真的关键帧图像;
视频生成器:依据用户设定的起始与终止关键帧自动生成中间动画序列,并借助 NVIDIA RTX Video 技术实时升频至 4K 分辨率。
该工作流由 Lightricks 全新发布的 LTX-2 模型驱动,该模型已于 1 月 6 日同步开放下载。
LTX-2 标志着本地 AI 视频创作迈入全新阶段——其生成质量已可媲美主流云端模型,单次可输出长达 20 秒、细节丰富、动态自然的 4K 视频。模型原生集成音频合成能力、支持多关键帧输入,并搭载经可控低秩适配(LoRA)增强的高级条件控制机制,让创作者彻底摆脱云端依赖,即可获得电影级画质与专业级可控性。
整套工作流底层由 ComfyUI 提供图形化节点调度与执行引擎。过去数月,NVIDIA 与 ComfyUI 团队协同深度优化,使其在 NVIDIA GPU 上的整体运行效率提升达 40%。最新版 ComfyUI 已全面支持 NVFP4 与 NVFP8 精度格式:在 RTX 50 系列 GPU 上启用 NVFP4 可带来 3 倍性能跃升与 60% 显存节省;启用 NVFP8 则可实现 2 倍加速与 40% 显存压缩。

目前,NVFP4 与 NVFP8 格式的预训练检查点(Checkpoints)已在 ComfyUI 中向用户开放,首批覆盖 Lightricks 的 LTX-2、Black Forest Labs 的 FLUX.1 与 FLUX.2,以及阿里巴巴的 Qwen-Image 和 Z-Image 等热门模型。用户可直接在 ComfyUI 内一键下载,后续还将持续扩展支持范围。

视频生成完成后,用户可通过 ComfyUI 新增的 RTX Video 节点,在数秒内完成超分辨率放大至 4K。该智能图像增强(Upscaler)功能支持实时运行,可自动锐化边缘、抑制压缩伪影,输出清晰锐利的高分辨率画面。RTX Video 功能将于下月正式集成进 ComfyUI 主干版本。
为突破 GPU 显存瓶颈,NVIDIA 与 ComfyUI 团队还联合强化了 weight streaming(权重流式加载)机制。启用后,当显存不足时,系统将智能调用主机内存作为补充缓存,从而让主流 RTX 显卡亦可稳定运行超大规模模型与复杂多阶段节点图。
该视频生成工作流预计将于下月开放完整下载;而 LTX-2 视频模型的开源权重包,以及 ComfyUI 对 RTX 的全部加速更新现已上线。
重塑 PC 文件与视频搜索范式
数十年来,PC 端文件检索方式始终未发生本质变革,仍高度依赖文件名匹配与零散元数据,导致用户查找一年前某份特定文档变得异常低效甚至徒劳。
Hyperlink 是 Nexa.ai 推出的本地化智能搜索代理,它将 RTX PC 转变为一个可自然语言交互的知识中枢。用户可使用日常口语提问,系统不仅返回结果,更附带可验证的原始引用来源。Hyperlink 支持自动扫描并索引文档、PPT、PDF 及图像文件,让搜索真正回归内容本身,而非猜测命名规则。所有数据全程离线处理、永久驻留于用户设备,确保绝对隐私与安全。此外,Hyperlink 已完成 RTX 加速适配:在 RTX 5090 GPU 上,每 GB 文本与图像文件索引耗时约 30 秒,查询响应时间低至 3 秒;相较之下,纯 CPU 方案每 GB 索引需耗时约 1 小时,查询响应则长达 90 秒。在 CES 2026 上,Nexa.ai 发布 Hyperlink 全新测试版,首次引入视频内容理解能力——支持在本地视频中识别物体、解析动作、提取语音语义。该功能可助视频创作者秒级定位所需 B-roll 镜头,亦能让玩家轻松回溯并分享夺冠瞬间。
欢迎访问 Nexa.ai 官网注册,申请 Hyperlink 私有测试资格。访问权限将自本月起分批开放。
小语言模型(SLM)推理性能跃升 35%

NVIDIA 深度联动开源社区,围绕 llama.cpp 与 Ollama 两大主流框架,为 RTX GPU 及 NVIDIA DGX Spark 桌面级超级计算机上的小语言模型推理带来显著加速。本次优化对混合专家架构(MoE)模型尤为友好,包括 NVIDIA 近期开源的 Nemotron 3 系列模型。
过去四个月内,llama.cpp 上 SLM 推理性能提升达 35%,Ollama 平台提升 30%。Ollama 相关更新已正式发布;llama.cpp 则同步上线多项用户体验优化,大幅缩短大语言模型加载时间。
上述加速成果将随 LM Studio 下一版本同步上线,并迅速赋能各类智能体应用,例如全新 MSI AI Robot 应用——该应用同样受益于 llama.cpp 的底层优化,使用户能更直观地管理 MSI 设备设置;即将发布的版本还将整合最新性能增强特性。
NVIDIA Broadcast 2.1:虚拟补光技术普惠更多 PC 用户

NVIDIA Broadcast 利用 AI 技术实时优化麦克风拾音与摄像头画质,已成为直播与远程会议场景的首选工具。
2.1 版本重点优化了虚拟补光(Virtual Lighting)功能:不仅向下兼容 RTX 3060 及以上显卡,还拓展了光照适应范围,支持更宽泛的色温调节区间,并采用更新的 HDRi 基础贴图,可模拟专业直播中常见的双主灯布光效果。点击此处下载 NVIDIA Broadcast 最新版本。
国内头部直播平台 Bilibili 即将集成该升级版虚拟补光效果,让更多 GeForce RTX 用户在直播中呈现更自然、更具表现力的面部光影。对 Broadcast 特效开发感兴趣的开发者,可查阅最新版软件开发工具包(SDK)。
DGX Spark:将家庭创意工坊升级为桌面级 AI 超级工作站
随着每月涌现的更强 AI 模型不断登陆 PC 端,开发者对高性能、高灵活性本地 AI 环境的需求持续攀升。DGX Spark 是一款紧凑型 AI 超级计算机,可轻松置于桌面,与主力台式机或笔记本电脑协同工作,让用户在现有设备基础上开展模型实验、智能体原型设计及高负载 AI 内容生成任务。
Spark 尤其适合希望测试大语言模型、构建智能体工作流的开发者,或需要在素材生成与后期编辑之间并行作业的艺术家——确保主力 PC 始终保持编辑流畅性。
在 CES 2026 上,NVIDIA 发布 DGX Spark 重大 AI 性能更新,相较其三个月前首发版本,综合性能最高提升达 2.6 倍。

NVIDIA 同步推出全新 DGX Spark Playbooks,包含推测解码(Speculative Decoding)实践指南,以及利用双 Spark 模块协同微调大模型的完整示例方案。
如需获取 NVIDIA RTX AI PC 最新资讯,请关注微博、抖音及哔哩哔哩官方账号。
软件产品详情请参阅官方声明。









