游乐游手机版
首页/科技数码/文章详情

腾讯混元开源翻译模型1.5发布:多领域世界翻译冠军开源

时间:2025-12-31 10:19
12月30日,腾讯混元宣布推出并开源翻译模型1 5,共包含两个模型:Tencent-HY-MT1 5-1 8B和Tencent-HY-MT1 5-7B,两个模型均支持33个语种互译以及5种民汉 方言

12月30日,腾讯混元宣布推出并开源翻译模型1.5版本,该系列包含两个模型:Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B。这两个模型均支持覆盖33种语言的双向互译,以及5种主要的民/方言翻译。除了常见的中文、英文、日语等,模型还支持捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种的翻译。模型现已在腾讯混元平台正式上线,开发者也可以通过开源社区直接下载使用。

根据介绍,HY-MT1.5-1.8B主要面向手机等消费级设备场景。经过量化处理后,它能够支持端侧直接部署和离线实时翻译,仅需1GB内存即可流畅运行。在参数量极小的前提下,其翻译效果已超越大部分商用翻译API。该模型在效率和性价比方面同样表现突出:与主流商用翻译模型API相比,HY-MT1.5-1.8B的推理速度更快,处理约50个token的平均耗时仅为0.18秒,而其他类似模型普遍耗时约0.4秒。

HY-MT1.5-7B模型的效果相比前一版本有较大提升。它是在此前获得WMT25比赛30个语种翻译冠军模型基础上的升级版,重点提升了翻译准确率,并大幅减少了译文中出现夹带注释或语种混杂的情况,实用性进一步增强。

在实际应用场景中,用户可以同时部署混元翻译的1.8B和7B两个尺寸模型,从而实现端侧和云侧模型的协同工作,这有助于提升模型效果的一致性及系统稳定性。

在常用的中外互译和英外互译测试集(如Flores200、WMT25)以及民汉语言测试集中,Tencent-HY-MT1.5-1.8B全面超越了中等尺寸开源模型和主流商用翻译API,达到了如Gemini-3.0-Pro这类超大规模闭源模型约90分的水平。在WMT25和民汉翻译测试集上,其效果仅略微落后于Gemini-3.0-Pro,远超其他同类模型。

HY-MT1.5系列模型在翻译质量与响应效率之间实现了出色的平衡。具体而言,HY-MT1.5-1.8B模型在FLORES-200质量评估中取得了约78%的得分,同时平均响应时间仅为0.18秒,超越了主流商用翻译API,展现出明显的速度优势。凭借优化的模型设计与推理逻辑,其领先的效率使其高度适用于即时通讯、智能客服、移动翻译应用等高吞吐、实时翻译场景。

实用性是混元翻译模型长期追求的目标。针对各类应用场景,两个模型均实现了对术语库、长对话、带格式文本(例如网页)翻译的支持,适用范围更加全面。

首先是术语翻译能力。腾讯混元翻译模型1.5具备强大的术语库自定义功能,用户可针对不同行业与专业场景(如医学、法律、金融、科技等)提前构建专属术语对照表,确保关键术语在翻译过程中保持高度一致性与准确性。

这一功能有效弥补了小尺寸模型在处理专业领域文本时的词汇短板,使其在保障轻量化部署的同时,也能胜任高要求的行业翻译任务。用户可通过简单配置导入术语库,模型将在翻译过程中优先采纳用户定义的标准术语,从而提升专业文档、技术手册、合同文本等内容翻译的可靠性与权威性。

其次是上下文翻译。混元翻译模型具备先进的长文本与对话上下文理解能力,可基于前文语境持续优化后续翻译结果,显著提升长对话、多轮问答、连续段落等场景下的翻译连贯性与一致性。无论是会议记录、访谈内容、小说章节还是技术文档的长篇翻译,模型均能有效捕捉并保持上下文逻辑关系,避免出现指代不清、语义断裂或风格不统一的问题。该能力尤其适用于实时对话翻译、长篇文献翻译及多轮交互场景,助力用户在跨语言沟通与内容处理中获得更自然、准确的翻译体验。

第三,是带格式翻译能力。通过精准的指令遵循能力,混元翻译模型得以保持翻译前后的格式信息不变,让翻译结果更加准确实用。

技术上,HY-MT1.5-1.8B能够用小尺寸实现大模型的效果,得益于On-Policy+Distillation(大模型蒸馏)策略的引入。该策略让HY-MT1.5-7B作为Teacher,实时引导1.8B的Student模型,使其避免死记硬背标准答案,而是通过纠正其在预测序列分布时的偏差,让小模型从错误中学习,切实提升能力。

值得注意的是,腾讯混元翻译模型此前不仅在国际机器翻译比赛中拿下30个语种第一名,也在首次开源一周内便登上了Hugging Face模型趋势榜首位。目前,混元翻译模型已经在腾讯内部多个业务场景落地应用,包括腾讯会议、企业微信、QQ浏览器、客服翻译等。此外,为便于开发者使用,本次开源的模型已经在Github和Hugging Face等开源社区上线,Arm、高通、Intel、沐曦等多个平台均支持部署。

来源:https://www.163.com/dy/article/KI2CQ23V053469RG.html
上一篇MiniMax拟港交所IPO募资60亿美元:阿里与阿布扎比基石投资 下一篇华夏航空拟购入3架A320客机:优化机队布局
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。