0

0

NVIDIA RTX 加速 PC 端 4K AI 视频生成 LTX-2 与 ComfyUI全面升级

霞舞

霞舞

发布时间:2026-01-06 18:24:09

|

649人浏览过

|

来源于php中文网

原创

comfyui、ltx-2、llama.cpp、ollama、hyperlink 等迎来全面 rtx 加速,解锁 ai pc 上的视频、图像与文本生成应用场景

NVIDIA RTX 加速 PC 端 4K AI 视频生成 LTX-2 与 ComfyUI全面升级

2025 年堪称 PC 端 AI 技术跃进的关键之年。

PC 级小语言模型(SLM)的推理准确率相较 2024 年实现近两倍增长,大幅弥合了与顶尖云端大语言模型(LLM)之间的能力鸿沟。与此同时,面向本地部署的 AI 开发工具生态日趋成熟——Ollama、ComfyUI、llama.cpp、Unsloth 等平台热度激增,用户下载量同比翻番,而 PC 端模型下载人次更飙升至 2024 年的十倍之多。

上述演进正加速推动生成式 AI 在 2026 年深度融入大众创作者、游戏玩家及高效能生产力用户的日常场景。

在 CES 展会上,NVIDIA 宣布面向 GeForce RTX、NVIDIA RTX PRO 及 NVIDIA DGX Spark 设备推出一揽子 AI 性能升级方案,旨在显著释放 PC 端生成式 AI 的运行潜力,并大幅缓解显存压力,具体涵盖:

依托 PyTorch-CUDA 深度优化,并在 ComfyUI 中原生集成 NVFP4 / FP8 低精度计算支持,图像与视频生成类 AI 工作流性能最高提升达 3 倍,显存占用最多减少 60%;在 ComfyUI 内置 RTX 视频超分辨率(RTX VSR)功能,实现实时 4K 视频生成加速;针对 Lightricks 行业标杆级音视频生成模型 LTX-2 的开源权重版本完成专项调优,正式发布 NVIDIA NVFP8 量化模型;推出基于 Blender 3D 场景驱动的 4K AI 视频生成 AI Blueprint,赋予创作者对输出质量与风格的精细把控力;通过底层加速 Ollama 与 llama.cpp,小语言模型(SLM)推理效率最高提升 35%;为 Nexa.ai 全新推出的 Hyperlink 视频语义搜索功能提供端到端 RTX 加速支持。

这些升级使用户得以在本地无缝执行前沿的视频、图像与自然语言处理任务,同时充分享有 RTX AI PC 所带来的数据隐私保障、运行安全可靠以及毫秒级响应延迟等核心优势。

RTX PC 实现 3 倍提速的 4K 视频生成

尽管生成式 AI 已能产出极具视觉冲击力的视频内容,但纯依赖文本提示的在线服务往往难以实现精准构图与风格控制;而生成 4K 分辨率视频,在以往几乎无法在消费级 PC 上落地——受限于模型参数规模庞大,常规显存容量根本无法承载。

1月6日,NVIDIA 正式发布一套由 RTX 全链路加速的视频生成工作流,助力创作者既可精准调控画面逻辑与艺术表达,又能以三倍速完成高质量 4K 视频输出,且仅需极低显存开销。

该工作流适配现代创作流程:从分镜脚本出发,逐帧生成照片级写实关键帧,最终合成连贯、高保真的 4K 视频。整套系统由三大模块化 AI Blueprint 构成,支持艺术家按需组合、灵活调整:

3D 物体生成器:用于快速构建场景所需三维资产;
3D 引导的图像生成器:用户可在 Blender 中搭建完整三维环境,并据此生成高度逼真的关键帧图像;
视频生成器:依据用户设定的起始与终止关键帧自动生成中间动画序列,并借助 NVIDIA RTX Video 技术实时升频至 4K 分辨率。

该工作流由 Lightricks 全新发布的 LTX-2 模型驱动,该模型已于 1 月 6 日同步开放下载。

LTX-2 标志着本地 AI 视频创作迈入全新阶段——其生成质量已可媲美主流云端模型,单次可输出长达 20 秒、细节丰富、动态自然的 4K 视频。模型原生集成音频合成能力、支持多关键帧输入,并搭载经可控低秩适配(LoRA)增强的高级条件控制机制,让创作者彻底摆脱云端依赖,即可获得电影级画质与专业级可控性。

整套工作流底层由 ComfyUI 提供图形化节点调度与执行引擎。过去数月,NVIDIA 与 ComfyUI 团队协同深度优化,使其在 NVIDIA GPU 上的整体运行效率提升达 40%。最新版 ComfyUI 已全面支持 NVFP4 与 NVFP8 精度格式:在 RTX 50 系列 GPU 上启用 NVFP4 可带来 3 倍性能跃升与 60% 显存节省;启用 NVFP8 则可实现 2 倍加速与 40% 显存压缩。

NVIDIA RTX 加速 PC 端 4K AI 视频生成 LTX-2 与 ComfyUI全面升级

目前,NVFP4 与 NVFP8 格式的预训练检查点(Checkpoints)已在 ComfyUI 中向用户开放,首批覆盖 Lightricks 的 LTX-2、Black Forest Labs 的 FLUX.1 与 FLUX.2,以及阿里巴巴的 Qwen-Image 和 Z-Image 等热门模型。用户可直接在 ComfyUI 内一键下载,后续还将持续扩展支持范围。

NVIDIA RTX 加速 PC 端 4K AI 视频生成 LTX-2 与 ComfyUI全面升级

视频生成完成后,用户可通过 ComfyUI 新增的 RTX Video 节点,在数秒内完成超分辨率放大至 4K。该智能图像增强(Upscaler)功能支持实时运行,可自动锐化边缘、抑制压缩伪影,输出清晰锐利的高分辨率画面。RTX Video 功能将于下月正式集成进 ComfyUI 主干版本。

为突破 GPU 显存瓶颈,NVIDIA 与 ComfyUI 团队还联合强化了 weight streaming(权重流式加载)机制。启用后,当显存不足时,系统将智能调用主机内存作为补充缓存,从而让主流 RTX 显卡亦可稳定运行超大规模模型与复杂多阶段节点图。

该视频生成工作流预计将于下月开放完整下载;而 LTX-2 视频模型的开源权重包,以及 ComfyUI 对 RTX 的全部加速更新现已上线。

重塑 PC 文件与视频搜索范式

数十年来,PC 端文件检索方式始终未发生本质变革,仍高度依赖文件名匹配与零散元数据,导致用户查找一年前某份特定文档变得异常低效甚至徒劳。

Tabnine
Tabnine

AI编程助手,代码自动补全

下载

Hyperlink 是 Nexa.ai 推出的本地化智能搜索代理,它将 RTX PC 转变为一个可自然语言交互的知识中枢。用户可使用日常口语提问,系统不仅返回结果,更附带可验证的原始引用来源。Hyperlink 支持自动扫描并索引文档、PPT、PDF 及图像文件,让搜索真正回归内容本身,而非猜测命名规则。所有数据全程离线处理、永久驻留于用户设备,确保绝对隐私与安全。此外,Hyperlink 已完成 RTX 加速适配:在 RTX 5090 GPU 上,每 GB 文本与图像文件索引耗时约 30 秒,查询响应时间低至 3 秒;相较之下,纯 CPU 方案每 GB 索引需耗时约 1 小时,查询响应则长达 90 秒。在 CES 2026 上,Nexa.ai 发布 Hyperlink 全新测试版,首次引入视频内容理解能力——支持在本地视频中识别物体、解析动作、提取语音语义。该功能可助视频创作者秒级定位所需 B-roll 镜头,亦能让玩家轻松回溯并分享夺冠瞬间。

欢迎访问 Nexa.ai 官网注册,申请 Hyperlink 私有测试资格。访问权限将自本月起分批开放。

小语言模型(SLM)推理性能跃升 35%

NVIDIA RTX 加速 PC 端 4K AI 视频生成 LTX-2 与 ComfyUI全面升级

NVIDIA 深度联动开源社区,围绕 llama.cpp 与 Ollama 两大主流框架,为 RTX GPU 及 NVIDIA DGX Spark 桌面级超级计算机上的小语言模型推理带来显著加速。本次优化对混合专家架构(MoE)模型尤为友好,包括 NVIDIA 近期开源的 Nemotron 3 系列模型。

过去四个月内,llama.cpp 上 SLM 推理性能提升达 35%,Ollama 平台提升 30%。Ollama 相关更新已正式发布;llama.cpp 则同步上线多项用户体验优化,大幅缩短大语言模型加载时间。

上述加速成果将随 LM Studio 下一版本同步上线,并迅速赋能各类智能体应用,例如全新 MSI AI Robot 应用——该应用同样受益于 llama.cpp 的底层优化,使用户能更直观地管理 MSI 设备设置;即将发布的版本还将整合最新性能增强特性。

NVIDIA Broadcast 2.1:虚拟补光技术普惠更多 PC 用户

NVIDIA RTX 加速 PC 端 4K AI 视频生成 LTX-2 与 ComfyUI全面升级

NVIDIA Broadcast 利用 AI 技术实时优化麦克风拾音与摄像头画质,已成为直播与远程会议场景的首选工具。

2.1 版本重点优化了虚拟补光(Virtual Lighting)功能:不仅向下兼容 RTX 3060 及以上显卡,还拓展了光照适应范围,支持更宽泛的色温调节区间,并采用更新的 HDRi 基础贴图,可模拟专业直播中常见的双主灯布光效果。点击此处下载 NVIDIA Broadcast 最新版本。

国内头部直播平台 Bilibili 即将集成该升级版虚拟补光效果,让更多 GeForce RTX 用户在直播中呈现更自然、更具表现力的面部光影。对 Broadcast 特效开发感兴趣的开发者,可查阅最新版软件开发工具包(SDK)。

DGX Spark:将家庭创意工坊升级为桌面级 AI 超级工作站

随着每月涌现的更强 AI 模型不断登陆 PC 端,开发者对高性能、高灵活性本地 AI 环境的需求持续攀升。DGX Spark 是一款紧凑型 AI 超级计算机,可轻松置于桌面,与主力台式机或笔记本电脑协同工作,让用户在现有设备基础上开展模型实验、智能体原型设计及高负载 AI 内容生成任务。

Spark 尤其适合希望测试大语言模型、构建智能体工作流的开发者,或需要在素材生成与后期编辑之间并行作业的艺术家——确保主力 PC 始终保持编辑流畅性。

在 CES 2026 上,NVIDIA 发布 DGX Spark 重大 AI 性能更新,相较其三个月前首发版本,综合性能最高提升达 2.6 倍。

NVIDIA RTX 加速 PC 端 4K AI 视频生成 LTX-2 与 ComfyUI全面升级

NVIDIA 同步推出全新 DGX Spark Playbooks,包含推测解码(Speculative Decoding)实践指南,以及利用双 Spark 模块协同微调大模型的完整示例方案。

如需获取 NVIDIA RTX AI PC 最新资讯,请关注微博抖音哔哩哔哩官方账号。

软件产品详情请参阅官方声明。

相关专题

更多
常用的数据库软件
常用的数据库软件

常用的数据库软件有MySQL、Oracle、SQL Server、PostgreSQL、MongoDB、Redis、Cassandra、Hadoop、Spark和Amazon DynamoDB。更多关于数据库软件的内容详情请看本专题下面的文章。php中文网欢迎大家前来学习。

957

2023.11.02

pytorch是干嘛的
pytorch是干嘛的

pytorch是一个基于python的深度学习框架,提供以下主要功能:动态图计算,提供灵活性。强大的张量操作,实现高效处理。自动微分,简化梯度计算。预构建的神经网络模块,简化模型构建。各种优化器,用于性能优化。想了解更多pytorch的相关内容,可以阅读本专题下面的文章。

428

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习
Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架,是一种通常用于图像识别和语言处理等应用程序的机器学习。 使用Python 编写,因此对于大多数机器学习开发者而言,学习和使用起来相对简单。 PyTorch 的独特之处在于,它完全支持GPU,并且使用反向模式自动微分技术,因此可以动态修改计算图形。

18

2025.12.22

java学习网站推荐汇总
java学习网站推荐汇总

本专题整合了java学习网站相关内容,阅读专题下面的文章了解更多详细内容。

1

2026.01.08

java学习网站汇总
java学习网站汇总

本专题整合了java学习网站相关内容,阅读专题下面的文章了解更多详细内容。

0

2026.01.08

正则表达式 删除
正则表达式 删除

本专题整合了正则表达式删除教程大全,阅读专题下面的文章了解更多详细教程。

1

2026.01.08

java 元空间 永久代
java 元空间 永久代

本专题整合了java中元空间和永久代的区别,阅读专题下面的文章了解更多详细内容。

2

2026.01.08

java 永久代和元空间
java 永久代和元空间

本专题整合了java中元空间和永久代的区别,阅读专题下面的文章了解更多详细内容。

0

2026.01.08

java成品网站源码资源大全
java成品网站源码资源大全

本专题整合了java成品网站源码相关内容,阅读专题下面的文章了解更多详细内容。

4

2026.01.08

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
SciPy 教程
SciPy 教程

共10课时 | 1万人学习

R 教程
R 教程

共45课时 | 4.6万人学习

SQL 教程
SQL 教程

共61课时 | 3.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号