腾讯混元正式对外开源其最新一代翻译模型——hy-mt1.5,涵盖两款不同规模的模型:tencent-hy-mt1.5-1.8b 与 tencent-hy-mt1.5-7b。该系列支持共计33种语言之间的双向互译,并额外覆盖5类民族语言与汉语、方言之间的翻译任务,语种范围不仅包括中、英、日等主流语言,还延伸至捷克语、马拉地语、爱沙尼亚语、冰岛语等低资源小语种。
据官方说明,HY-MT1.5-1.8B专为移动端及消费级硬件优化设计,经量化压缩后可直接部署于终端设备,实现离线实时翻译能力,仅需约1GB运行内存即可稳定流畅运行。在参数量极为精简的前提下,其翻译质量已优于多数商用翻译API。此外,该模型展现出卓越的推理效率与成本效益:在处理50个token时,平均响应时间低至0.18秒,而同类主流商用模型普遍耗时约0.4秒。
HY-MT1.5-7B则是在此前斩获WMT25全球机器翻译大赛30语种冠军模型基础上的全面升级版本,核心聚焦于提升译文准确性,显著降低注释残留、语种混杂等常见问题,进一步增强实际落地可用性。
在部分真实应用场景中,用户可同步调用1.8B(端侧)与7B(云侧)两个版本,构建端云协同的混合推理架构,从而兼顾响应速度与翻译质量,在效果一致性与系统稳定性方面实现双重保障。
在Flores200、WMT25及多组民汉翻译基准测试集上,Tencent-HY-MT1.5-1.8B整体表现超越当前主流中等规模开源模型及商用翻译API,翻译质量达到闭源超大模型Gemini-3.0-Pro的90分位水平;尤其在WMT25与民汉专项测试中,其性能仅略逊于Gemini-3.0-Pro,大幅领先其他竞品模型。


HY-MT1.5系列在翻译精度与响应时效之间实现了高度协同的平衡。以FLORES-200评测为例,HY-MT1.5-1.8B取得约78%的得分,同时维持平均0.18秒的极低延迟,显著优于行业常见商用翻译API。
面向多样化使用需求,两款模型均原生支持术语库注入、长上下文对话翻译、以及带格式文本(如HTML网页内容)的结构化翻译,适配能力更加完善。
以下为混元 Tencent-HY-MT1.5-1.8B 与苹果iOS系统内置离线翻译功能的实测对比结果:

技术实现层面,HY-MT1.5-1.8B之所以能在轻量级架构下逼近大模型性能,关键在于引入了On-Policy Distillation(在线策略蒸馏)机制:以HY-MT1.5-7B作为Teacher模型,在训练过程中动态指导1.8B Student模型,避免其机械记忆标准答案;通过持续校准预测序列的概率分布偏差,使小模型在纠错中自主进化,真正实现能力跃升。

源码地址:点击下载










