12月30日消息,腾讯混元今日宣布,正式开源其翻译模型1.5版本,此次开源包含两个具体模型:Tencent-HY-MT1.5-1.8B与Tencent-HY-MT1.5-7B。
目前,这两个模型已在腾讯混元平台正式上线,开发者也可以直接在Github和Huggingface等开源社区下载使用。
据了解,这一版本支持33种语言之间的互译,并涵盖5种闽汉/方言。除了中文、英文、日文等常见语种,其语言库还包含了捷克语、马拉地语、爱沙尼亚语、冰岛语等使用范围相对较小的语种。

其中,HY-MT1.5-1.8B模型主要面向手机等消费级设备场景。经过量化后,它支持端侧直接部署和离线实时翻译,仅需1GB内存即可流畅运行。更值得注意的是,在参数量极小的前提下,其翻译效果已超越了大部分商用翻译API。
同时,该模型也展现出极致的效率和性价比。与主流的商用翻译模型API相比,HY-MT1.5-1.8B 的推理速度更快,处理50个tokens的平均耗时仅为0.18秒,而其他同类模型通常需要0.4秒左右。
以下是混元Tencent-HY-MT1.5-1.8B与苹果iPhone自带离线翻译的结果对比:

HY-MT1.5-7B模型的效果相比前一版本有较大提升,它是此前获得WMT25比赛30个语种翻译冠军模型的升级版。新版重点提升了翻译准确率,大幅减少了译文中夹带注释和语种混杂的情况,实用性进一步增强。
最新表示,在部分用户实际使用场景下,混元翻译1.8B和7B两个尺寸模型可以搭配使用,从而实现端侧和云侧模型的协同部署,有效提升模型效果的一致性、稳定性与效率。



