腾讯混元1.5开源翻译模型：1GB内存手机即可流畅运行，精度媲美商用API

时间：2025-12-30 22:01

12月30日消息，腾讯混元今日宣布开源翻译模型 1 5 版本，共包含两个模型：Tencent-HY-MT1 5-1 8B 和 Tencent-HY-MT1 5-7B，支持 33 个语种互译以及 5

12月30日消息，腾讯混元今日宣布开源翻译模型1.5版本，包含两个模型：Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B。新版本支持33种语言互译以及5种闽/方言。除了常见的中、英、日语，此次还加入了捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。

目前两个模型均已上线腾讯混元，开发者也可以在Github和Huggingface等开源社区直接下载使用。

HY-MT1.5-1.8B 主要面向手机等消费级设备场景。经过量化，其支持端侧直接部署和离线实时翻译，仅需1GB内存即可流畅运行。官方宣称，在参数量极小的前提下，其效果已超越了大部分商用翻译API。

与主流商用翻译模型API对比，HY-MT1.5-1.8B 的推理速度更快，处理50个tokens的平均耗时仅0.18秒，而其他模型的耗时普遍在0.4秒左右。

HY-MT1.5-7B 模型效果相比前一版本有较大提升。该模型是此前获得WMT25大赛30个语种翻译冠军模型的升级版，重点提升了翻译准确率，大幅减少了译文中夹带注释和语种混杂的情况，实用性进一步增强。

在实际使用场景中，混元翻译1.8B和7B两个尺寸模型可以同时使用，以实现端侧和云侧模型的协同部署，从而提升模型效果的一致性与稳定性。

在常用的中外互译（如中英互译）以及Flores200、WMT25等测试集，以及闽汉语的语言测试集中，Tencent-HY-MT1.5-1.8B全面超越了中等尺寸开源模型和主流商用翻译API，达到了Gemini-3.0-Pro这类超大规模闭源模型90分位水平。在WMT25和闽汉翻译测试集上，其效果仅略微逊于Gemini-3.0-Pro，远超其他模型。

HY-MT1.5-1.8B 模型在FLORES-200质量评估中取得了约78%的分数，同时平均响应时间仅0.18秒，整体表现超越主流商用翻译API，适用于即时通讯、智能客服、移动翻译应用等高吞吐、实时翻译场景。

此外，针对各类场景，两个模型均实现了对术语库、长对话、带格式文本（例如网页）的翻译支持，功能更为全面：

首先是术语方面。腾讯混元翻译模型1.5版本具备术语库自定义能力。用户可以针对不同行业与专业场景（如医学、法律、金融、科技等）提前构建专属术语对照表，确保关键术语在翻译中保持高度一致与准确性。

用户可通过简单配置导入术语库，模型将在翻译过程中优先采纳用户定义的标准术语，从而提升专业文档、技术手册、合同文本等内容翻译的可靠性与权威性。

其次是上下文翻译能力。混元翻译模型具备长文本与对话上下文理解能力，可基于前文语境持续优化后续翻译结果，提升长对话、多轮问答、连续段落等场景下的翻译连贯性与一致性。

无论是会议记录、访谈内容、小说章节还是技术文档的长篇翻译，模型均能捕捉并保持上下文逻辑关系，避免出现指代不清、语义断裂或风格不统一的问题。

第三是带格式翻译能力。通过指令遵循能力，混元翻译模型得以在翻译前后保持格式信息不变，让翻译结果更加准确实用。

为了直观展示混元Tencent-HY-MT1.5-1.8B的翻译效果，最新展示中将其与苹果手机自带离线翻译的结果进行对比：

技术方面，HY-MT1.5-1.8B 能够用小尺寸实现大尺寸模型的效果，得益于On-Policy Distillation（大尺寸模型蒸馏）策略的引入。该策略让HY-MT1.5-7B作为Teacher模型，实时引导1.8B的Student模型，使其避免死记硬背标准答案，而是通过纠正在预测序列分布时的偏移，让小模型从错误中学习，持续提升能力。