首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
腾讯混元1.5开源翻译模型:1GB内存手机即可流畅运行,精度媲美商用API

腾讯混元1.5开源翻译模型:1GB内存手机即可流畅运行,精度媲美商用API

热心网友
44
转载
2025-12-30

12月30日消息,腾讯混元今日宣布开源翻译模型1.5版本,包含两个模型:Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B。新版本支持33种语言互译以及5种闽/方言。除了常见的中、英、日语,此次还加入了捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。

目前两个模型均已上线腾讯混元,开发者也可以在Github和Huggingface等开源社区直接下载使用。

HY-MT1.5-1.8B 主要面向手机等消费级设备场景。经过量化,其支持端侧直接部署和离线实时翻译,仅需1GB内存即可流畅运行。官方宣称,在参数量极小的前提下,其效果已超越了大部分商用翻译API。

与主流商用翻译模型API对比,HY-MT1.5-1.8B 的推理速度更快,处理50个tokens的平均耗时仅0.18秒,而其他模型的耗时普遍在0.4秒左右。

HY-MT1.5-7B 模型效果相比前一版本有较大提升。该模型是此前获得WMT25大赛30个语种翻译冠军模型的升级版,重点提升了翻译准确率,大幅减少了译文中夹带注释和语种混杂的情况,实用性进一步增强。

在实际使用场景中,混元翻译1.8B和7B两个尺寸模型可以同时使用,以实现端侧和云侧模型的协同部署,从而提升模型效果的一致性与稳定性。

在常用的中外互译(如中英互译)以及Flores200、WMT25等测试集,以及闽汉语的语言测试集中,Tencent-HY-MT1.5-1.8B全面超越了中等尺寸开源模型和主流商用翻译API,达到了Gemini-3.0-Pro这类超大规模闭源模型90分位水平。在WMT25和闽汉翻译测试集上,其效果仅略微逊于Gemini-3.0-Pro,远超其他模型。

HY-MT1.5-1.8B 模型在FLORES-200质量评估中取得了约78%的分数,同时平均响应时间仅0.18秒,整体表现超越主流商用翻译API,适用于即时通讯、智能客服、移动翻译应用等高吞吐、实时翻译场景。

此外,针对各类场景,两个模型均实现了对术语库、长对话、带格式文本(例如网页)的翻译支持,功能更为全面:

首先是术语方面。腾讯混元翻译模型1.5版本具备术语库自定义能力。用户可以针对不同行业与专业场景(如医学、法律、金融、科技等)提前构建专属术语对照表,确保关键术语在翻译中保持高度一致与准确性。

用户可通过简单配置导入术语库,模型将在翻译过程中优先采纳用户定义的标准术语,从而提升专业文档、技术手册、合同文本等内容翻译的可靠性与权威性。

其次是上下文翻译能力。混元翻译模型具备长文本与对话上下文理解能力,可基于前文语境持续优化后续翻译结果,提升长对话、多轮问答、连续段落等场景下的翻译连贯性与一致性。

无论是会议记录、访谈内容、小说章节还是技术文档的长篇翻译,模型均能捕捉并保持上下文逻辑关系,避免出现指代不清、语义断裂或风格不统一的问题。

第三是带格式翻译能力。通过指令遵循能力,混元翻译模型得以在翻译前后保持格式信息不变,让翻译结果更加准确实用。

为了直观展示混元Tencent-HY-MT1.5-1.8B的翻译效果,最新展示中将其与苹果手机自带离线翻译的结果进行对比:

技术方面,HY-MT1.5-1.8B 能够用小尺寸实现大尺寸模型的效果,得益于On-Policy Distillation(大尺寸模型蒸馏)策略的引入。该策略让HY-MT1.5-7B作为Teacher模型,实时引导1.8B的Student模型,使其避免死记硬背标准答案,而是通过纠正在预测序列分布时的偏移,让小模型从错误中学习,持续提升能力。

腾讯混元翻译模型此前不仅在国际机器翻译比赛拿下30个第1名,也在首次开源一周内便登上了HuggingFace模型趋势榜第一位。混元翻译模型已经在腾讯内部多个业务场景落地应用,包括腾讯会议、企业微信、QQ浏览器、客服翻译等。

为了便于开发者使用,本次开源的模型已经在Github和Huggingface等开源社区上线,Arm、高通、Intel、沐曦等多个平台均支持部署。

来源:https://www.donews.com/news/detail/1/6340977.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

腾讯混元联合发布首个古文字OCR评测基准Chronicles-OCR
业界动态
腾讯混元联合发布首个古文字OCR评测基准Chronicles-OCR

腾讯混元等机构联合发布首个覆盖汉字七体演化的古文字识别评测基准Chronicles-OCR。该基准包含2800张高质量图像,通过四大任务评估模型对古文字的视觉感知能力。评测显示主流模型识别准确率低、依赖表面纹理,推理模式反而降低性能。基准揭示了技术差距,为提升模型微观视觉能力、推动文化遗产数。

热心网友
05.19
腾讯混元Hy3预览版开源推理效率提升40%多场景表现优异
AI
腾讯混元Hy3预览版开源推理效率提升40%多场景表现优异

大模型领域的竞争,从来不只是参数规模的比拼,更是实用性与性价比的终极考验。最近,腾讯混元放出的新动作,或许为这场竞赛提供了一个值得关注的样本。 腾讯混元Hy3 preview发布并开源 4月23日,腾讯混元正式发布了Hy3 preview语言模型,并宣布开源。这个模型有点意思,它采用了快慢思考融合的

热心网友
05.18
腾讯混元Hy3预览版开源发布:智能体性能全面升级
AI
腾讯混元Hy3预览版开源发布:智能体性能全面升级

腾讯混元大模型家族迎来了新成员。4月23日,混元Hy3 preview语言模型正式发布并宣布开源。这不仅仅是一次常规迭代,而是混元技术路线重建后的首个成果,被定位为迄今“最智能”的模型。 从技术架构上看,Hy3 preview是一个融合了快慢思考机制的混合专家模型,总参数量达到295B,激活参数为2

热心网友
05.18
腾讯混元大模型正式发布并全面开放
科技数码
腾讯混元大模型正式发布并全面开放

腾讯的基础大模型,似乎终于迎来了转机。 5月7日,腾讯混元公布了一组数据:自上线以来,其最新模型Hy3 preview的Token调用量持续攀升,目前总量已超过上一代Hy2模型的10倍。其中,代码和智能体类场景的调用量增长尤为显著。 与此同时,来自第三方平台OpenRouter的公开数据也显示,在过

热心网友
05.18
腾讯混元CL-bench升级发布,大模型精准解读日常生活场景
AI
腾讯混元CL-bench升级发布,大模型精准解读日常生活场景

我们对于“AI个人助手”的想象,正变得越来越具体和迫切。 一个真正能融入日常生活的智能助手,必须能从我们生活的点滴痕迹中学习和理解,解决那些复杂场景下的实际问题。这听起来简单,实现起来却充满挑战。 在近期的AGI-Next前沿峰会上,腾讯的姚顺雨分享了一个生动的例子:当你询问AI“今天吃什么”时,真

热心网友
05.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

算力时代电力价值重估 能源如何支撑数字经济
AI
算力时代电力价值重估 能源如何支撑数字经济

近日,国家能源局联合发改委、工信部、国家数据局正式印发《关于促进人工智能与能源双向赋能的行动方案》。这份重磅文件的核心思路非常清晰:一方面,以坚实的能源基础支撑人工智能(AI)的快速发展;另一方面,利用AI技术赋能能源行业转型升级。其核心目标是推动能源、算力、应用场景、数据与算法模型五大关键要素深度

热心网友
05.20
智谱清影与Runway Gen3视频生成模型对比评测
AI
智谱清影与Runway Gen3视频生成模型对比评测

在挑选文生视频工具时,若您正在智谱清影与Runway Gen-3之间权衡,那么了解两者在生成效果上的具体差异,将有助于您做出更明智的选择。本文将从画质清晰度、细节纹理、运动自然度与视频连贯性等核心维度,通过实测对比为您详细解析。 一、画质与分辨率表现 首先对比硬性指标。智谱清影基于CogVideoX

热心网友
05.20
通义万象制作数据可视化科技背景的实用教程
AI
通义万象制作数据可视化科技背景的实用教程

想用通义万相生成一张科技感十足的数据可视化背景,但出来的画面总觉得少了点“内味儿”?数字界面、粒子流、电路纹理这些关键元素一个不见,画面平平无奇?这通常不是工具的问题,而是提示词没有精准锚定科技可视化的核心要素,或者模型参数没调到最佳状态。别急,下面这几种方法,能帮你把想法精准地“翻译”成画面。 一

热心网友
05.20
Vidu视频慢动作与快进效果制作教程
AI
Vidu视频慢动作与快进效果制作教程

想要在Vidu生成的视频中实现流畅的慢动作或快进效果?虽然模型界面没有提供直接调整播放速度的滑块,但通过巧妙的提示词设计、利用内置功能,或结合后期处理工具,你完全可以精准掌控视频的节奏与时间感。本文将为你详细解析四种实用方法,从生成前到生成后,全方位满足你的创作需求。 一、通过精准提示词引导运动节奏

热心网友
05.20
海螺AI学术论文查重降重功能实测与效果分析
AI
海螺AI学术论文查重降重功能实测与效果分析

当您使用海螺AI生成的英文论文在提交查重时遭遇高重复率或AIGC检测异常,请不要急于归咎于工具本身。核心原因在于,尽管AI生成的文本格式标准、语法地道,但其语言模式和常见短语组合,并未针对知网、维普、万方等中文查重数据库的语义比对逻辑进行专门优化。换言之,机器认为流畅自然的表达,在查重系统的算法看来

热心网友
05.20