
百度蒸汽机今日宣布其“全球首个中文音视频一体化视频生成模型”迎来新一轮升级,正式推出通用 AI 长视频生成功能。
此次更新标志着行业重大突破,首次实现真正意义上的无限时长 AI 视频生成。以往AI视频技术受限于5秒或10秒的短片段输出,或需依赖首尾帧控制进行续写,而本次升级通过引入流式生成技术,彻底打破这一瓶颈,支持用户持续生成长度不受限的高质量视频内容。

就在一个月前,百度蒸汽机已完成2.0版本迭代,成为业内首个实现多人有声视频一体化生成的模型。

该2.0版本依托多模态时空规划、中文场景深度优化以及音视频端到端建模等多项核心技术,在复杂运镜控制、电影级人物表情演绎、多样化镜头语言和高清流畅画质方面实现显著提升,全面支持多人物、多语音、多动作同步生成,推动AIGC在视频创作领域的应用迈向新阶段。










