腾讯混元团队正式开源hy-motion1.0(hunyuan-motion-1.0),这是一款参数量达十亿级别的文本驱动3d动作生成大模型。
该模型融合Diffusion Transformer(DiT)架构与流匹配(Flow Matching)技术,仅需输入一段简洁自然语言描述,即可输出高精度、高连贯性且风格多样的3D角色骨骼动画,原生支持Blender、Unity、Unreal Engine等主流3D创作平台,大幅降低专业级动画内容的生产门槛。

HY-Motion1.0采用三阶段渐进式训练范式:第一阶段在超3000小时涵盖广泛场景的动作数据集上完成大规模预训练,建立鲁棒的通用运动先验;第二阶段基于400小时精挑细选的高质量动作样本进行微调,显著增强动作细节表现力与时间连续性;第三阶段引入基于人类反馈的强化学习(RLHF),结合定制化奖励模型,进一步提升生成结果的物理合理性与语义准确性。
模型能力覆盖六大动作类别、逾200种具体行为,涵盖基础位移类(如行走、奔跑)、体育竞技类(如篮球投篮、网球挥拍)、健身户外类(如瑜伽伸展、攀岩)、社交休闲类(如挥手致意、拥抱)、日常生活类(如开门、倒水)以及游戏角色专属动作(如持剑格挡、僵尸蹒跚)。所有输出统一采用SMPL-H骨骼格式,支持单原子动作、多步组合序列及多肢体并发动作生成。
社区实测反馈表明,模型对常见生活化指令响应精准:例如“慢跑”“弯腰坐到椅子上”“原地向上跳跃两次”,生成动作自然流畅、节奏合理;面对更具挑战性的影视级表达——如《黑客帝国》经典“子弹时间后仰”镜头,亦能准确还原关键姿态并保持运动连贯性。
在量化评估中,其指令理解与执行能力达78.6%(SSAE指标),动作质量平均得分3.43分(满分5分),整体性能全面优于MoMask、DART等当前主流开源方案,尤其在复杂语义解析与跨动作类别泛化能力方面优势明显。
对于职业级运动动作(如跳台滑雪腾空姿态、跳水翻转、小轮车腾跃),模型尚存一定还原局限,部分关节过渡偶现轻微不自然现象,但相较前代模型,其物理可信度已实现质的飞跃。
作为端到端可部署模型,HY-Motion1.0特别适配游戏开发流程:可快速批量生成NPC日常行为动画(如巡逻、交谈、拾取物品),显著缩短前期预研周期与版本迭代耗时;主角级动画虽仍需美术微调优化,但已支持零兼容性导入引擎,为MMO、ACT等类型游戏提供高效动捕替代方案。此外,在影视分镜预演、广告人物走位设计、VR/AR交互内容构建等场景中亦展现出广泛应用潜力。
同步发布的轻量版本HY-Motion-1.0-Lite(参数量0.46B),在保持核心能力的同时大幅提升推理效率与部署友好度。
源码地址:点击下载










