腾讯开源18B大模型,1GB内存手机可离线运行,对标Qwen

智东西
作者|王涵
编辑|冰倩
智东西12月30日报道,刚刚,腾讯混元开源翻译模型1.5版本,共包含两个模型:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B,支持33个语种互译以及5种民汉/方言,除了中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。

▲Tencent-HY-MT1.5-1.8B开源(来源:Hugging Face)

▲Tencent-HY-MT1.5-7B开源(来源:Hugging Face)
HY-MT1.5-1.8B主要面向手机等消费级设备场景,支持端侧直接部署和离线实时翻译,仅需1GB内存即可流畅运行。
HY-MT1.5-7B模型是此前获得WMT25比赛30个语种翻译冠军模型的升级版,重点提升了翻译准确率,大幅减少了译文中夹带注释和语种混杂的情况,实用性进一步增加。
在部分用户实际使用场景下,混元翻译1.8B和7B两个尺寸模型同时使用,可以实现端侧和云侧模型的协同部署,提升模型的效果的一致性和稳定性。
基准测试方面,在中外互译和英外互译测试集Flores200、WMT25以及民汉语言的测试集中,Tencent-HY-MT1.5-1.8B全面超越Qwen3-32B,与Qwen3-235B-A22B等大尺寸闭源模型成绩不相上下。
同时,在处理效率上,与主流商用翻译模型API对比,HY-MT1.5-1.8B处理50个tokens的平均耗时只有0.18秒,其他模型的时间在0.4秒左右。
技术方面,HY-MT1.5-1.8B能够用小尺寸实现大尺寸模型的效果,得益于On-Policy Distillation(大尺寸模型蒸馏)策略的引入,HY-MT1.5-7B作为Teacher,能够实时引导1.8B的Student模型,让其避免死记硬背标准答案,通过纠正在预测序列分布时的偏移,让小模型从错误中学习,进而提升能力。

▲On-Policy Distillation(大尺寸模型蒸馏)策略(来源:腾讯混元)
目前两个模型均已在腾讯混元正式上线,在GitHub和Hugging Face等开源社区也可直接下载使用,Arm、高通、Intel、沐曦等多个平台均支持部署。
混元正式:
https://hunyuan.tencent.com/modelSquare/home/list
GitHub链接:
https://github.com/Tencent-Hunyuan/HY-MT
Hugging Face链接:
https://huggingface.co/collections/tencent/hy-mt15
一、互译成绩超越Qwen3-32B,响应速度仅0.18秒
在常用的中外互译和英外互译测试集Flores200、WMT25以及民汉语言的测试集中,Tencent-HY-MT1.5-1.8B全面超越Qwen3-32B等中等尺寸开源模型和主流商用翻译API,达到Qwen3-235B-A22B等大尺寸闭源模型的90分位水平。

▲Flores200、WMT25以及民汉语言的测试集成绩(来源:腾讯混元)
在翻译质量与响应效率上,HY-MT1.5-1.8B模型在FLORES-200质量评估中取得了约78%的分数,同时平均响应时间仅为0.18秒,超越主流商用翻译API。

▲FLORES-200质量评估成绩(来源:腾讯混元)
二、从医学术语到粤语对话,腾讯混元翻译模型1.5反应迅捷、准确率“能打”
凭借优化的模型设计和推理逻辑,腾讯混元翻译模型1.5适用于即时通讯、智能客服、移动翻译应用等高吞吐、实时翻译场景。
首先是术语,腾讯混元翻译模型1.5具备术语库自定义能力,用户可针对不同行业与专业场景(如医学、法律、金融、科技等)提前构建专属术语对照表,确保关键术语在翻译中保持高度一致与准确性。
这一功能有效弥补了小尺寸模型在处理专业领域文本时的词汇短板,使其在保障轻量化部署的同时,也能胜任高要求的行业翻译任务。
用户可通过简单配置导入术语库,模型将在翻译过程中优先采纳用户定义的标准术语,从而提升专业文档、技术手册、合同文本等内容翻译的可靠性与权威性。
▲术语翻译(来源:腾讯混元)
智东西也上手尝试了一下,我们上传了一系列医学术语,让其翻译成中文。在反应速度上,腾讯混元翻译模型1.5就很快输出了翻译结果,几乎没有反应时间。与原文对照看,其翻译的成果准确度为100%。

▲术语翻译(来源:智东西实测)
除了英语外,我们还上传了5句职场中高频出现的粤语对话,看看腾讯混元翻译模型1.5的方言翻译效果如何。结果显示,腾讯混元翻译模型1.5也可以很准确地翻译出粤语用词和语气,准确度同样“能打”。

▲粤语翻译(来源:智东西实测)
其次是上下文翻译能力。该能力适用于实时对话翻译、长篇文献翻译及多轮交互场景。混元翻译模型模型具备较好的长文本与对话上下文理解能力,可基于前文语境持续优化后续翻译结果,显著提升长对话、多轮问答、连续段落等场景下的翻译连贯性与一致性。
无论是会议记录、访谈内容、小说章节还是技术文档的长篇翻译,模型均能有效捕捉并保持上下文逻辑关系,避免出现指代不清、语义断裂或风格不统一的问题。
▲上下文翻译(来源:腾讯混元)
第三是,带格式翻译能力,通过精准的指令遵循能力,混元翻译模型得以保持翻译前后的格式信息不变,让翻译结果更加准确实用。
▲格式翻译(来源:腾讯混元)
为了直观展示混元Tencent-HY-MT1.5-1.8B的翻译效果,下面展示了与苹果手机自带离线翻译的结果对比:

▲与苹果自带翻译对比(来源:腾讯混元)
结语:腾讯开源降低了翻译模型应用门槛
腾讯此次开源的小尺寸翻译模型,降低了翻译模型在手机等终端上运行的门槛。
腾讯混元翻译模型此前不仅在国际机器翻译比赛拿下30个第1名,也在首次开源一周内便登上Hugging Face模型趋势榜第一位。
混元翻译模型已经在腾讯内部多个业务场景落地应用,包括腾讯会议、企业微信、QQ浏览器、客服翻译等。
相关攻略
三天前,《纽约时报》刊登了一篇看似平静却暗藏玄机的深度报道。它没有冲上热搜,也未引爆Hacker News,甚至在中文互联网的讨论中也踪迹寥寥。但恰恰是这篇文章,很可能成为2026年春天乃至未来数年,理解人工智能发展轨迹的一个关键性坐标。 文章的标题平实而直接——《How Do You Measur
一部展现清末民初文化学者辜鸿铭传奇一生的文献纪录片《辜鸿铭》,将于近日在中央新影发现之旅频道播出。 这部纪录片想做的,是借助影像的力量,带观众穿越百年的世界风云,跨越东西方文化的藩篱,去真正走近并理解辜鸿铭这个人。全片共6集,每集48分钟,从《生在南洋》《认识西洋》《寻祖归宗》,到《文以载道》《西风
一座城市如何被记住? 过去,答案或许是地标建筑;后来,可能是一支精美的宣传片。但如今,风向正在悄然转变——《太原之约》的出现,让我们看到了一种新的可能:城市,正在从“被讲述的对象”转变为“会讲故事的主体”。 从背景板到故事主角:一场叙事的深层变革 一部微短剧,究竟能为一座城市带来什么?《太原之约》开
在2026中关村论坛主会场,全球首创的AR+AI会议翻译系统正式亮相 2026中关村论坛的主会场,迎来了一项突破性部署。亮亮视野与智谱AI联合推出并落地了全球首个AR+AI会议翻译系统,为大会主论坛及多场平行论坛提供了核心的翻译保障。这套系统深度融合了AR眼镜与大模型能力,其指标颇为亮眼:支持54种
中关村论坛参会人员佩戴眼镜照片(亮亮视野展台提供) 本报(chinatimes net cn)记者张玫 北京报道 一场没有同传耳机的国际论坛 3月27日,由中国残联、北京市政府主办,北京市残联承办的2026中关村论坛年会科技助残论坛在北京举行。 如果你在现场,可能会发现一个有趣的现象:部分参会者并未
热门专题
热门推荐
在《燕云十六声》中领悟“菩提苦海”,需沉浸探索游戏世界。主线剧情构建认知框架,战斗观察、场景细节与NPC对话皆暗藏线索。通过多元视角拼凑因果,方能深入理解游戏蕴含的宏大叙事与深邃魅力。
2026年618大促的序幕刚刚拉开,初期战报已经透露出一些耐人寻味的信号。截至5月21日,海信电视在京东平板电视累计销售竞速榜上拔得头筹,其RGB-Mini LED爆款王——海信小墨E5S Pro,更是同时拿下了天猫平板电视和抖音大家电的5 20单品销冠。 这并非偶然。奥维云网的全渠道监测数据给出了
充电桩领域的“军备竞赛”再次迎来重磅升级。5月22日,极氪汽车正式发布了其全新一代液冷超级充电桩,将单枪峰值功率一举提升至行业领先的800kW,标志着超充技术迈入新阶段。 根据官方披露的核心信息,这款超充桩主要具备四大优势:极速补能、高效节能、广泛适配与多重安全。具体而言,其单枪峰值电流高达800A
获取电弧机剑主要有五种途径:推进主线任务以解锁线索;探索遗迹、工厂等特定区域;挑战特定副本与Boss;完成提及传说武器或遗物的支线任务;参与限时活动并达成要求。玩家可根据偏好选择或组合多种方式获取该武器。
小米汽车再次为潜在车主带来惊喜福利!即日起至5月31日,用户只需提前完成预约,并到店参与任意车型的试驾体验,即可免费获赠一款1:64精致合金车模。车模款式与颜色随机发放,为试驾过程增添一份专属的收藏乐趣,诚意十足。 参与本次活动需注意以下细则:试驾必须通过官方渠道提前预约;各授权门店的车模备货数量不





