NVIDIA RTX 加速 PC 端 4K AI 视频生成 LTX-2 与 ComfyUI全面升级

霞舞

发布时间：2026-01-06 18:24:09

649人浏览过

来源于php中文网

原创

comfyui、ltx-2、llama.cpp、ollama、hyperlink 等迎来全面 rtx 加速，解锁 ai pc 上的视频、图像与文本生成应用场景

NVIDIA RTX 加速 PC 端 4K AI 视频生成 LTX-2 与 ComfyUI全面升级

2025 年堪称 PC 端 AI 技术跃进的关键之年。

PC 级小语言模型（SLM）的推理准确率相较 2024 年实现近两倍增长，大幅弥合了与顶尖云端大语言模型（LLM）之间的能力鸿沟。与此同时，面向本地部署的 AI 开发工具生态日趋成熟——Ollama、ComfyUI、llama.cpp、Unsloth 等平台热度激增，用户下载量同比翻番，而 PC 端模型下载人次更飙升至 2024 年的十倍之多。

上述演进正加速推动生成式 AI 在 2026 年深度融入大众创作者、游戏玩家及高效能生产力用户的日常场景。

在 CES 展会上，NVIDIA 宣布面向 GeForce RTX、NVIDIA RTX PRO 及 NVIDIA DGX Spark 设备推出一揽子 AI 性能升级方案，旨在显著释放 PC 端生成式 AI 的运行潜力，并大幅缓解显存压力，具体涵盖：

依托 PyTorch-CUDA 深度优化，并在 ComfyUI 中原生集成 NVFP4 / FP8 低精度计算支持，图像与视频生成类 AI 工作流性能最高提升达 3 倍，显存占用最多减少 60%；在 ComfyUI 内置 RTX 视频超分辨率（RTX VSR）功能，实现实时 4K 视频生成加速；针对 Lightricks 行业标杆级音视频生成模型 LTX-2 的开源权重版本完成专项调优，正式发布 NVIDIA NVFP8 量化模型；推出基于 Blender 3D 场景驱动的 4K AI 视频生成 AI Blueprint，赋予创作者对输出质量与风格的精细把控力；通过底层加速 Ollama 与 llama.cpp，小语言模型（SLM）推理效率最高提升 35%；为 Nexa.ai 全新推出的 Hyperlink 视频语义搜索功能提供端到端 RTX 加速支持。

这些升级使用户得以在本地无缝执行前沿的视频、图像与自然语言处理任务，同时充分享有 RTX AI PC 所带来的数据隐私保障、运行安全可靠以及毫秒级响应延迟等核心优势。

RTX PC 实现 3 倍提速的 4K 视频生成

尽管生成式 AI 已能产出极具视觉冲击力的视频内容，但纯依赖文本提示的在线服务往往难以实现精准构图与风格控制；而生成 4K 分辨率视频，在以往几乎无法在消费级 PC 上落地——受限于模型参数规模庞大，常规显存容量根本无法承载。

1月6日，NVIDIA 正式发布一套由 RTX 全链路加速的视频生成工作流，助力创作者既可精准调控画面逻辑与艺术表达，又能以三倍速完成高质量 4K 视频输出，且仅需极低显存开销。

该工作流适配现代创作流程：从分镜脚本出发，逐帧生成照片级写实关键帧，最终合成连贯、高保真的 4K 视频。整套系统由三大模块化 AI Blueprint 构成，支持艺术家按需组合、灵活调整：

3D 物体生成器：用于快速构建场景所需三维资产；
3D 引导的图像生成器：用户可在 Blender 中搭建完整三维环境，并据此生成高度逼真的关键帧图像；
视频生成器：依据用户设定的起始与终止关键帧自动生成中间动画序列，并借助 NVIDIA RTX Video 技术实时升频至 4K 分辨率。

该工作流由 Lightricks 全新发布的 LTX-2 模型驱动，该模型已于 1 月 6 日同步开放下载。

LTX-2 标志着本地 AI 视频创作迈入全新阶段——其生成质量已可媲美主流云端模型，单次可输出长达 20 秒、细节丰富、动态自然的 4K 视频。模型原生集成音频合成能力、支持多关键帧输入，并搭载经可控低秩适配（LoRA）增强的高级条件控制机制，让创作者彻底摆脱云端依赖，即可获得电影级画质与专业级可控性。

整套工作流底层由 ComfyUI 提供图形化节点调度与执行引擎。过去数月，NVIDIA 与 ComfyUI 团队协同深度优化，使其在 NVIDIA GPU 上的整体运行效率提升达 40%。最新版 ComfyUI 已全面支持 NVFP4 与 NVFP8 精度格式：在 RTX 50 系列 GPU 上启用 NVFP4 可带来 3 倍性能跃升与 60% 显存节省；启用 NVFP8 则可实现 2 倍加速与 40% 显存压缩。

NVIDIA RTX 加速 PC 端 4K AI 视频生成 LTX-2 与 ComfyUI全面升级

目前，NVFP4 与 NVFP8 格式的预训练检查点（Checkpoints）已在 ComfyUI 中向用户开放，首批覆盖 Lightricks 的 LTX-2、Black Forest Labs 的 FLUX.1 与 FLUX.2，以及阿里巴巴的 Qwen-Image 和 Z-Image 等热门模型。用户可直接在 ComfyUI 内一键下载，后续还将持续扩展支持范围。

NVIDIA RTX 加速 PC 端 4K AI 视频生成 LTX-2 与 ComfyUI全面升级

视频生成完成后，用户可通过 ComfyUI 新增的 RTX Video 节点，在数秒内完成超分辨率放大至 4K。该智能图像增强（Upscaler）功能支持实时运行，可自动锐化边缘、抑制压缩伪影，输出清晰锐利的高分辨率画面。RTX Video 功能将于下月正式集成进 ComfyUI 主干版本。

为突破 GPU 显存瓶颈，NVIDIA 与 ComfyUI 团队还联合强化了 weight streaming（权重流式加载）机制。启用后，当显存不足时，系统将智能调用主机内存作为补充缓存，从而让主流 RTX 显卡亦可稳定运行超大规模模型与复杂多阶段节点图。

该视频生成工作流预计将于下月开放完整下载；而 LTX-2 视频模型的开源权重包，以及 ComfyUI 对 RTX 的全部加速更新现已上线。

重塑 PC 文件与视频搜索范式

数十年来，PC 端文件检索方式始终未发生本质变革，仍高度依赖文件名匹配与零散元数据，导致用户查找一年前某份特定文档变得异常低效甚至徒劳。

Tabnine

AI编程助手，代码自动补全

下载

Hyperlink 是 Nexa.ai 推出的本地化智能搜索代理，它将 RTX PC 转变为一个可自然语言交互的知识中枢。用户可使用日常口语提问，系统不仅返回结果，更附带可验证的原始引用来源。Hyperlink 支持自动扫描并索引文档、PPT、PDF 及图像文件，让搜索真正回归内容本身，而非猜测命名规则。所有数据全程离线处理、永久驻留于用户设备，确保绝对隐私与安全。此外，Hyperlink 已完成 RTX 加速适配：在 RTX 5090 GPU 上，每 GB 文本与图像文件索引耗时约 30 秒，查询响应时间低至 3 秒；相较之下，纯 CPU 方案每 GB 索引需耗时约 1 小时，查询响应则长达 90 秒。在 CES 2026 上，Nexa.ai 发布 Hyperlink 全新测试版，首次引入视频内容理解能力——支持在本地视频中识别物体、解析动作、提取语音语义。该功能可助视频创作者秒级定位所需 B-roll 镜头，亦能让玩家轻松回溯并分享夺冠瞬间。

欢迎访问 Nexa.ai 官网注册，申请 Hyperlink 私有测试资格。访问权限将自本月起分批开放。

小语言模型（SLM）推理性能跃升 35%

NVIDIA RTX 加速 PC 端 4K AI 视频生成 LTX-2 与 ComfyUI全面升级

NVIDIA 深度联动开源社区，围绕 llama.cpp 与 Ollama 两大主流框架，为 RTX GPU 及 NVIDIA DGX Spark 桌面级超级计算机上的小语言模型推理带来显著加速。本次优化对混合专家架构（MoE）模型尤为友好，包括 NVIDIA 近期开源的 Nemotron 3 系列模型。

过去四个月内，llama.cpp 上 SLM 推理性能提升达 35%，Ollama 平台提升 30%。Ollama 相关更新已正式发布；llama.cpp 则同步上线多项用户体验优化，大幅缩短大语言模型加载时间。

上述加速成果将随 LM Studio 下一版本同步上线，并迅速赋能各类智能体应用，例如全新 MSI AI Robot 应用——该应用同样受益于 llama.cpp 的底层优化，使用户能更直观地管理 MSI 设备设置；即将发布的版本还将整合最新性能增强特性。

NVIDIA Broadcast 2.1：虚拟补光技术普惠更多 PC 用户

NVIDIA RTX 加速 PC 端 4K AI 视频生成 LTX-2 与 ComfyUI全面升级