首页 游戏 软件 资讯 排行榜 专题
首页
AI
腾讯混元Hy3预览版开源推理效率提升40%多场景表现优异

腾讯混元Hy3预览版开源推理效率提升40%多场景表现优异

热心网友
11
转载
2026-05-18

大模型领域的竞争,从来不只是参数规模的比拼,更是实用性与性价比的终极考验。最近,腾讯混元放出的新动作,或许为这场竞赛提供了一个值得关注的样本。

腾讯混元Hy3 preview发布并开源

4月23日,腾讯混元正式发布了Hy3 preview语言模型,并宣布开源。这个模型有点意思,它采用了快慢思考融合的混合专家架构,总参数量达到2950亿,但每次推理激活的参数是210亿,最大能支持长达256K的上下文。更重要的是,这是腾讯混元团队在年初完成基础设施重建后,训练出的第一个模型,也被官方称为迄今“最智能”的一代。从复杂推理、指令遵循到代码和智能体能力,各方面都实现了大幅提升。

混元重建基础设施与原则

要理解Hy3 preview的意义,得先看看它背后的思路转变。今年2月,腾讯混元做了一次彻底的“重建”,不仅升级了预训练和强化学习的基础设施,更明确了三个追求实用性的核心原则:

第一,能力要体系化,不鼓励“偏科”;第二,评测要追求真实性,主动跳出那些容易被“刷榜”的公开榜单;第三,深度追求性价比,让模型架构和推理框架协同设计,从根本上降低任务成本。

可以说,Hy3 preview正是这套新思路下的首个成果。按照腾讯首席AI科学家姚顺雨的说法,这只是一个开端。通过开源和发布来收集反馈,目的是为了提升正式版的实用性,同时继续扩大训练规模,探索模型能力的上限。

Hy3 preview首发上线情况

模型好不好,落地见真章。目前,Hy3 preview已经在一系列腾讯系产品中首发上线,包括腾讯云、元宝、腾讯文档、QQ及QQ浏览器等。此外,像微信公众号、和平精英、腾讯新闻等主力产品也在陆续接入中。

对于开发者而言,好消息是它不仅支持接入OpenClaw、OpenCode等流行的开源智能体框架,也已经上架了腾讯云的大模型服务平台TokenHub,获取和使用的门槛大大降低。

Hy3 preview主打全面实用性

那么,这个被寄予厚望的模型,实际能力到底如何?多个维度的测评结果给出了答案。

首先,在上下文学习和指令遵循方面,表现相当出色。团队专门提出了CL-bench等评估体系,而Hy3 preview在这些测试中进步显著。

其次,复杂推理是它的强项。在FrontierScience-Olympiad、IMOAnswerBench这些高难度的理工科推理任务中,它都拿出了有竞争力的表现,甚至在清华大学求真书院的数学博资考等专业评测中取得了优异成绩。

最后,代码与智能体能力的提升可能是最突出的。在SWE-Bench、Terminal-Bench等主流代码基准,以及BrowseComp等搜索智能体测试中,它都取得了不错的结果。腾讯内部构建的多个贴近真实工程任务的评测集也表明,Hy3 preview在处理后端开发、高难度软件工程等问题时,展现出了很强的竞争力和性价比。

腾讯核心业务接入收益明显

“自产自用”往往是检验模型实用性的第一道关卡。在正式发布前,Hy3 preview已经在腾讯多个核心业务中进行了深度测试,收益颇为明显。

在元宝产品中,通过深度协同设计,模型的意图理解精准度和文本创作质量等硬指标都有提升,交互体验也更自然,更具“活人感”。

在CodeBuddy和WorkBuddy这类生产力工具上,效果更为直观:首token延迟降低了54%,端到端时长减少47%,成功率则提升到99.99%以上,甚至能稳定驱动长达495步的复杂智能体工作流。

其他业务线也传来了好消息:腾讯文档的AI PPT生成成功率提升了20%,耗时缩短20%;QQ AI助手在响应速度和流式输出效率上优化显著;甚至在和平精英的AI NPC场景中,无论局内局外,表现都相当出色。

推理效率提升,成本下降

当然,所有能力的提升,最终都要面对成本和效率的拷问。好在,得益于模型与推理框架的深度协同优化,Hy3 preview在这方面交出了一份不错的成绩单:整体推理效率提升了40%,成本相比上一代模型大幅下降。

在腾讯云TokenHub平台上,其价格已经颇具吸引力:输入价格最低至每百万tokens 1.2元,若命中缓存则仅需0.4元;输出价格最低为每百万tokens 4元。腾讯云还联合推出了定制的Token Plan套餐,个人版月费最低28元起,这无疑为开发者尝试智能体应用或打造“小而美”的工具,提供了一个更具性价比的选择。

从基础设施的重建,到实用性原则的贯彻,再到最终在成本与性能上取得的平衡,腾讯混元Hy3 preview的这次亮相,似乎不仅仅是一个新模型的发布,更像是一次对“大模型如何真正有用”这个命题的系统性回应。接下来的市场反馈,将检验这份答卷的最终分数。

来源:https://blog.csdn.net/techforward/article/details/160447071
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

腾讯混元大模型正式发布并全面开放
科技数码
腾讯混元大模型正式发布并全面开放

腾讯的基础大模型,似乎终于迎来了转机。 5月7日,腾讯混元公布了一组数据:自上线以来,其最新模型Hy3 preview的Token调用量持续攀升,目前总量已超过上一代Hy2模型的10倍。其中,代码和智能体类场景的调用量增长尤为显著。 与此同时,来自第三方平台OpenRouter的公开数据也显示,在过

热心网友
05.18
腾讯混元CL-bench升级发布,大模型精准解读日常生活场景
AI
腾讯混元CL-bench升级发布,大模型精准解读日常生活场景

我们对于“AI个人助手”的想象,正变得越来越具体和迫切。 一个真正能融入日常生活的智能助手,必须能从我们生活的点滴痕迹中学习和理解,解决那些复杂场景下的实际问题。这听起来简单,实现起来却充满挑战。 在近期的AGI-Next前沿峰会上,腾讯的姚顺雨分享了一个生动的例子:当你询问AI“今天吃什么”时,真

热心网友
05.17
腾讯混元Hy3 preview上线两周调用量激增 超上版本十倍
业界动态
腾讯混元Hy3 preview上线两周调用量激增 超上版本十倍

5月7日,腾讯混元公布了一组关于其最新模型Hy3 preview的数据,结果相当引人注目。自该模型上线以来,其Token调用量持续攀升,目前总量已达到上一代版本Hy2的10倍之多。 增长点在哪里?代码和智能体类场景的贡献尤为突出。在腾讯内部的WorkBuddy、Codebuddy以及Qclaw等应用

热心网友
05.16
腾讯混元大语言模型功能特点与应用场景详解
AI
腾讯混元大语言模型功能特点与应用场景详解

说到国内自研大模型,腾讯混元绝对是个绕不开的名字。作为腾讯全链路自研的成果,它在内容创作、逻辑推理、代码生成以及多轮对话这些核心能力上,表现相当亮眼,业界口碑一直在线。更值得一提的是,其API还集成了AI搜索联网插件,能直接调用微信公众号、视频号等腾讯生态内的优质内容,这让它在获取实时、深度的信息并

热心网友
05.16
前阿里通义视觉负责人薄列峰加盟腾讯混元团队
AI
前阿里通义视觉负责人薄列峰加盟腾讯混元团队

原阿里通义视觉负责人薄列峰已加入腾讯混元团队,向副总裁蒋杰汇报。薄列峰拥有顶尖学术与工业背景,曾主导多项重要AI项目。近期,腾讯混元还吸引了微软WizardLM团队核心成员等人才加入,正快速构建多模态技术阵容,展现建立独立技术体系的决心。

热心网友
05.16

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

微信群接龙数据自动整理工具OpenClaw一键生成表格
AI
微信群接龙数据自动整理工具OpenClaw一键生成表格

微信群里的接龙,方便是真方便,但整理起来,那叫一个头疼。手动复制粘贴,不仅耗时费力,还容易出错、遗漏,最后导出的表格格式五花八门,看着就心累。 有没有一种方法,能让这个过程自动化,让数据自己“跑”进表格里?答案是肯定的。借助一些工具,我们可以实现群内接龙数据的自动识别、解析和归档。下面,就来拆解一下

热心网友
05.18
VINE币怎么买?VINE价格预测2025到2030年及未来前景分析
web3.0
VINE币怎么买?VINE价格预测2025到2030年及未来前景分析

VineCoin(VINE币):重塑创作者经济的区块链新星 在数字资产的浪潮中,VineCoin(VINE币)正作为一个新兴项目崭露头角。它并非又一种简单的代币,其野心在于利用区块链技术,从根本上重塑内容创作与社交互动的经济规则。可以说,它致力于成为一个去中心化生态系统的核心引擎,目标是为全球的内容

热心网友
05.18
ToClaw文件整理术一键清理桌面杂乱文件实用教程
AI
ToClaw文件整理术一键清理桌面杂乱文件实用教程

ToClaw文件整理术:一键清理桌面杂乱文件的秘籍 | AI智能文件管理教程 利用AI智能助手整理电脑桌面文件,愿景虽好,但在实际应用中,你是否也遇到过分类不准确、指令执行失败,甚至文件被误移的困扰?请放心,这些问题往往源于几个关键的设置步骤尚未完善。掌握以下这套经过验证的ToClaw文件整理优化方

热心网友
05.18
全链网罢工计划不变 区块链去中心化争议持续
web3.0
全链网罢工计划不变 区块链去中心化争议持续

三星电子工会确认原定罢工计划未取消,但将遵守法院禁令,确保罢工不影响正常生产流程。劳资博弈进入微妙阶段,工会需在法律框架内施压,公司生产秩序暂获法律庇护,后续发展取决于双方谈判。

热心网友
05.18
千问AI如何助力社群运营实现自动回复与管理
AI
千问AI如何助力社群运营实现自动回复与管理

千问AI赋能社群自动化运营:一、关键词触发智能回复;二、定时任务精准推送;三、敏感词实时过滤预警;四、成员标签化智能分组。 社群运营工作繁杂,常常需要处理大量重复性任务,如解答常见问题、发布定时通知、监控群内动态等,这让运营者倍感压力。如何实现高效、智能的社群管理,解放人力?利用千问AI的强大功能,

热心网友
05.18