巨人网络发布三大 Muli-Modal 模型-IT新闻-PHP中文网

巨人网络发布三大 Muli-Modal 模型

聖光之護

发布： 2025-11-27 18:27:49

原创

252人浏览过

巨人网络发布三大 muli-modal 模型

巨人网络AI Lab携手清华大学SATLab及西北工业大学，共同发布了三项音视频多模态生成技术成果——YingVideo-MV、YingMusic-SVC与YingMusic-Singer，并宣布相关研究将逐步在GitHub、HuggingFace等平台开源。

此次推出的YingVideo-MV模型，仅需一段音乐和一张人物图像，便可自动生成节奏协调、画面流畅的音乐视频片段。该模型通过对音乐的节奏、情绪和结构进行深度解析，实现镜头运动与音频的高度匹配，支持推、拉、摇、移等多种专业级运镜效果，并引入长时序一致性机制，显著减少了长时间生成中常见的人物形变与画面跳帧问题。

在音频领域，YingMusic-SVC具备“真实歌曲可用”的零样本歌声转换能力。经过对真实音乐环境的全面优化，该模型能有效过滤伴奏、和声与混响带来的干扰，大幅降低破音和高音失真现象，为音乐翻唱、风格迁移等创作提供了高质量、高稳定性的技术支持。

远航CMS(yhcms)(分站版)2.6.5

远航CMS(yhcms)是一套基于PHP+MYSQL为核心开发的专业营销型企业建站系统。是国内首家免费+开源自带分站系统的php内容管理系统。长期以来不断的完善、创新，远航CMS会为您带来全新的体验！产品十大优势：模板分离：模板程序分离，深度二次开发三网合一：电脑/手机/微信多终端访问自定义广告：图片/文字/动画定时发布：SEO维护，无需人工值守多词生成：栏目关键词多方案生成SEO设置：自定义U