清华腾讯混元获MLSys2026MoE推理冠军 NPU推理速度提升4.1倍
近日,国际机器学习系统顶级会议MLSys 2026公布了其MoE模型推理优化挑战赛的最终结果。由清华大学存储实验室与腾讯混元AI Infra团队共同提交的联合优化方案,凭借卓越的系统性能与创新性,在包括Stanford、MIT等全球顶尖团队的激烈角逐中拔得头筹,荣获全球冠军。

上图直观呈现了该冠军方案的核心优化架构,其关键技术模块包括E-Shard专家分片策略、连续DMA数据传输、PSUM与GEMV计算并发执行、冷启动流水线化以及智能预取控制等,共同构成了高效推理的基石。
本次夺冠的核心优势,不仅源于上述精密的系统层设计,更得益于一个关键的创新工具——团队联合研发的、基于智能体(Agent)的推理算子自动化优化器“Knight”。该工具实现了从优化策略自动生成、代码高效落地到效果复盘迭代的全流程闭环,极大地扩展了高性能优化方案的搜索空间,使得许多以往依赖人工经验难以触及的深度优化点得以自动发掘与实践。
优化成效极为显著。最终,该联合方案将MoE模型的端到端推理耗时从基准的14.91秒大幅降低至3.56秒,整体性能加速比达到4.1倍。尤为关键的是单步解码延迟的优化,从12.63毫秒降至5.45毫秒,这对提升大模型实时交互体验至关重要。此外,在模型权重加载阶段,DMA引擎的利用率提升至约80%,标志着硬件计算资源的利用效率获得了实质性优化。
能够在全球顶尖学府与研究机构的竞争中脱颖而出,充分证明了该方案的技术领先性与工程实用性。这份成绩不仅是一项荣誉,更清晰地表明我国在面向大语言模型的底层系统适配与核心算子深度优化领域,已构建起扎实的工程能力与技术壁垒。此项成果为未来在超大规模算力平台上,高效部署与推理万亿参数级别的混合专家大模型,提供了一个极具参考价值的高性能实现范本与工程路径。
相关攻略
近日,国际机器学习系统顶级会议MLSys 2026公布了其MoE模型推理优化挑战赛的最终结果。由清华大学存储实验室与腾讯混元AI Infra团队共同提交的联合优化方案,凭借卓越的系统性能与创新性,在包括Stanford、MIT等全球顶尖团队的激烈角逐中拔得头筹,荣获全球冠军。 上图直观呈现了该冠军方
腾讯混元团队于2026年5月推出移动端AI翻译工具“Hy翻译”。它作为微信小程序,无需安装,支持33种语言文本与语音即时互译,并可根据场景切换翻译风格。该工具深度融入微信生态,优化中文语境表达,目前免费开放,适合移动办公、跨境交流及日常出行等轻量即时翻译需求。
在众多国产AI大模型中,腾讯混元无疑是一个备受关注的核心选手。它究竟有何独特之处?又能为用户解决哪些实际问题?本文将为您进行全面解析。 腾讯混元是什么 腾讯混元大模型是腾讯公司完全自主研发的新一代大规模语言模型。其核心优势集中体现在三大方面:卓越的中文内容生成能力、应对复杂问题的深度逻辑推理,以及高
腾讯混元团队开源多语言翻译模型Hy-MT2,支持33种语言及5种民族语言互译。模型提供三种规格,其中1 8B版本量化后仅440MB,可手机本地部署,实现高效离线翻译。同步推出“腾讯Hy翻译”小程序,支持语音输入与风格定制,兼顾云端与本地场景。模型在多语言理解、专业翻译等方面较前代显著提升,并配套开源指令遵。
腾讯混元开源新一代翻译大模型Hy-MT2,提供1 8B、7B和30B-A3B三个版本,覆盖从手机端到云服务器的需求。模型支持33种语言互译及5种少数民族语言与方言,性能突出,其中轻量版经量化后仅约440MB,可离线部署于手机。功能包括语音输入翻译、自定义风格及单词解析,依托多尺寸架构、极端量化与多场景联合训练等技术。
热门专题
热门推荐
个性化学习已进入“动作”定制时代,系统通过动态分析学生数据构建个人知识图谱,实时规划学习路径、讲解方式与复习节奏。例如针对错题追溯前置薄弱点并调整讲解方法,实现从结果纠错到过程归因的转变,使大规模因材施教成为可执行、可量化的科学实践。
2025年,河北信息通信行业交出了一份令人瞩目的高质量发展答卷。核心发展指标持续领跑全国,稳居第一梯队,行业竞争优势与领先地位得到全面巩固,为河北省经济社会数字化转型构筑了坚实可靠的数字基石。 这份优异成绩,首先得益于信息基础设施的跨越式升级。全年行业固定资产投资完成115 2亿元,规模位列全国第九
北京时间2026年5月25日凌晨,中国空间站迎来又一里程碑时刻。神舟二十三号载人飞船经过约3 5小时的快速交会对接,于2时45分精准对接于天和核心舱的径向对接口。 对接约2 5小时后,舱门顺利开启。已在轨长期驻留的神舟二十一号乘组航天员,热情迎接了新战友入驻。此次“天宫会师”具有双重重要意义:它不仅
竖屏SLG手游《三国计》近期开启限时测试。其竖屏设计降低了操作门槛,便于单手游玩,同时保持了紧凑的界面布局与策略深度。玩家扮演乱世诸侯,目标是从生存壮大到问鼎中原。新手期建议紧跟主线任务,以解锁武将、兵种、科技等核心系统,并获取关键资源平稳度过开荒阶段。
一场历时四年、牵动全球游戏与科技界目光的动视暴雪股东集体诉讼案,迎来关键性进展。微软同意支付高达2 5亿美元的和解金,与提起诉讼的股东达成和解,为这场旷日持久的法律纠纷画上了阶段性句号。 根据2026年5月下旬于美国特拉华州衡平法院披露的和解协议文件,这笔巨额资金将用于赔偿在特定时间段内持有动视暴雪





