腾讯混元大模型重构完成 Hy3预览版正式上线

「Hy3 preview是混元大模型重建的第一步。」
姚顺雨交出了加入腾讯后的第一份模型答卷。
4月23日,腾讯混元Hy3 preview语言模型发布并开源。这款模型主打快慢思考融合的MoE架构,总参数295B,激活参数21B,最大支持256K上下文长度。官方称其整体性能达到了同尺寸模型的最佳水平。
从研发节奏看,Hy3 preview于2026年1月底正式启动训练,从训练到上线用了不到三个月。在腾讯内部,它被定义为混元大模型从“读万卷书”走向“行万&里路”、尝试解决真实世界复杂问题的开端。
而这款模型最受行业关注的核心标签在于,它是“天才少年”姚顺雨在2025年底加盟腾讯后,全程主导推出的第一代大模型。作为腾讯重金邀请的首席AI科学家,Hy3 preview既是他对重构后混元研发体系的首次完整实践,也承载着腾讯补齐AI短板、在大模型下半场实现追赶的核心期待。
姚顺雨表示,“Hy3 preview是混元大模型重建的第一步。我们希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助我们提升Hy3正式版的实用性。与此同时,我们也在继续扩大预训练和强化学习的规模,提升模型的智能上限,并通过与腾讯众多产品的深度Co-Design,持续提升模型在真实场景中的综合表现,并开始探索特色模型能力。”
一手实测Hy3 preview
从披露的核心信息来看,Hy3 preview从研发之初就围绕智能体(Agent)场景做了针对性设计,这也是它与此前混元系列模型最核心的差异。
在启动模型训练前,姚顺雨主导完成了混元预训练和强化学习基础设施的全面重建,同时定下了模型追求实用性的三大核心原则:
能力体系化:不推崇“偏科”,因为即便是代码智能体的单一应用,也涉及推理、长文、指令、对话、代码、工具等多种能力的深度协同;
评测真实性:主动跳出易被“刷榜”的公开榜单,通过自建题目、最新考试、人工评测、产品众测等多种方式评估和改进模型的“真实战斗力”;
性价比追求:实用性离不开商业合理性,深度协同模型架构和推理框架的设计,大幅降低任务成本,让智能用得起、用得好。
资料显示,Hy3 preview采用了总参数量295B、激活参数仅21B的MoE架构,同时融合了“快慢思考”机制。21B的激活参数,为模型高频次、长链路的Agent调用提供了低成本的运行底座;而“快慢思考”的融合设计,天然适配复杂逻辑推理与多步工具调用场景,即姚顺雨提出的ReAct(推理-行动)循环。
我们第一时间对Hy3 preview进行了实测。首先是一个覆盖数据抓取、数值计算、可视化生成、文本分析全链路的综合任务:“使用Python抓取过去90天纳斯达克100、伦敦金与沪深300的日线收盘数据。计算它们之间的皮尔逊相关系数,并用D3.js或ECharts生成一个单文件HTML动态热力图。最后,基于数据结果输出一段500字的跨市场资产配置Memo。”
实测过程显示,Hy3 preview在数据获取阶段反复受阻。接口认证失败后,模型接连切换akshare、yfinance等多个数据源,纳斯达克100数据因速率限制缺失而被迫用模拟数据替代,修错重试的循环消耗了大量时间。
在可视化交付上,Hy3 preview最终生成了三资产相关性热力图,但由于部分数据并非真实采样,热力图的准确性与可信度打了折扣。最核心的文本交付物缺失明显——提示词明确要求输出500字跨市场资产配置Memo,模型却只给出了几行Bullet point式的简略配置比例,没有成文的分析段落,任务交付在关键环节出现了缺位。
随后,我们尝试了另一个长链路Agent测试:启用浏览器模式,在SkillHub平台进行全链路深度抓取,完整理清腾讯文档Skill的Auth认证全流程与数据同步底层机制,最终输出一份标准化的技术原理分析文档。
在这次测试中,Hy3 preview展现了清晰的Agent自治与多步推理(ReAct)过程:先搜索SkillHub整体介绍;发现需要深入,又去精准抓取了Auth认证的开发者文档;接着去查了MCP Server的底层原理;最后才开始动笔写文档。这证明了Hy3 preview作为Agent的路由调度中心,其长链路规划和工具调用很稳定,没有在中途崩溃或陷入死循环,完整走完了“推理-行动-验证-输出”的闭环。
这一表现也与披露的产品落地数据形成了呼应:在CodeBuddy、WorkBuddy产品上,Hy3 preview首token延迟降低54%、端到端时长降低47%、任务成功率提升至99.99%+。在实际用户环境中,已稳定驱动最长495步的复杂Agent工作流,覆盖文档处理、数据分析、知识检索、工具链编排等多样化办公场景。
从这两组实测可以看出,Hy3 preview呈现出一种典型的“过渡态特征”。一方面,在复杂任务中,它已经具备了较为清晰的Agent执行路径:能够自主拆解问题、规划步骤,并在不同工具之间进行切换,整体链路没有明显中断。这种“从问题到流程”的能力,确实在向真实工作流靠近。
但另一方面,真正决定可用性的“最后一公里”仍然不够稳定——数据获取阶段的反复试错、关键结果的缺失、以及最终交付物的不完整,都说明模型在长链路执行中,仍然存在“做了一半”的问题。
目前,Hy3 preview已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、腾讯文档等产品首发上线,同时支持接入OpenClaw、OpenCode等主流开源智能体产品,并已上架腾讯云大模型服务平台TokenHub。价格方面,Hy3 preview输入价格最低1.2元/百万tokens,输入命中缓存价格0.4元/百万tokens,输出价格最低4元/百万tokens。
天才少年,和动起来的腾讯
这是备受关注的“天才少年”姚顺雨入职腾讯后主导的第一代大模型。作为2025年底腾讯重磅挖来的首席AI科学家,Hy3 preview是他入职后交出的第一份核心模型答卷,也承载着腾讯补齐AI短板、发力大模型基础研究的期待。
去年9-12月,姚顺雨入职腾讯,出任“CEO/总裁办公室”首席AI科学家,兼任AI Infra部与大语言模型部负责人,直接向总裁刘炽平汇报,全面统筹混元大模型研发工作。12月,腾讯完成组织架构重构,新设AI Infra部、AI Data部、数据计算平台部,姚顺雨全面掌控混元研发体系。上任后,他立即重构了AI Infra团队,搭建起预训练、精调、后训练、推理等完整研发链条,为后续模型研发奠定基础。
今年1月底,马化腾在年会上承认腾讯AI“动作慢了”,刘炽平同步披露混元3.0正在内部测试,计划4月对外推出。也是在1月底,Hy3 preview正式启动训练,从训练到上线用了不到三个月。
姚顺雨(1998年生)的履历自带“天才少年”标签,但客观来看,他的技术背景与腾讯当时的AI需求高度契合,这也是腾讯重金挖角的核心原因。腾讯此前混元负责人张正友(深耕计算机视觉领域)、蒋杰(侧重大数据方向)均非NLP/LLM原生背景,而姚顺雨是腾讯首位真正意义上的LLM原生技术领导者,其核心履历与研究方向,恰好匹配腾讯混元突破的核心需求。
在学术界,姚顺雨是顶级的语言智能体(Language Agents)研究者,著名的ReAct(推理-行动框架)和Tree of Thoughts(思维树)均出自其手;在OpenAI短暂的一年多里,他也深度参与了Operator、Deep Research等智能体产品研发,深入接触模型预训练与后训练环节,积累了一线工程化经验。
2025年4月,他曾发表文章《The Second Half》,明确提出,AI的竞争正在从“训练更强的模型”转向“定义并评估真实世界任务”,强调评估体系重构,反对盲目堆料模型规模。这一理念也贯穿了Hy3 preview的研发。
从前面的实测来看,Hy3 preview更像是一款验证技术方向的原型模型。把视角拉回腾讯自身,这种“未完全成熟”的状态,可能也有其内在合理性。一方面,Hy3 preview从训练到上线不到三个月,本身就是一次快速迭代的技术试水;另一方面,在经历了AI组织架构的全面重构之后,腾讯也需要这样一款模型,去验证新的研发链条是否通顺、锚定的Agent技术路线是否成立。
不过,在国内大模型已经进入贴身肉搏的当下,Hy3 preview的到来,只是腾讯AI补位的开始。无论是MoE架构的工程化优化,还是Agent场景的产业落地深度,国内头部厂商已经跑通了多轮迭代,腾讯想要追上甚至超车,仅凭一次模型更新远远不够。
*头图来源:GPT生成
相关攻略
「Hy3 preview是混元大模型重建的第一步。」 姚顺雨交出了加入腾讯后的第一份模型答卷。 4月23日,腾讯混元Hy3 preview语言模型发布并开源。这款模型主打快慢思考融合的MoE架构,总参数295B,激活参数21B,最大支持256K上下文长度。官方称其整体性能达到了同尺寸模型的最佳水平。
针对“AI一号位即将离职”的传言,腾讯官方已严正辟谣,称其纯属子虚乌有。传言涉及的关键人物姚顺雨现任腾讯首席AI科学家,负责AI基础设施与大语言模型部门。腾讯表示将保留追究造谣者法律责任的权利。
5月14日,一则关于腾讯AI业务“一号位”姚顺雨或将离职的传闻,在业内不胫而走。传言将离职原因指向了内部资源分配问题,称微信事业部拿走了部分算力资源。 消息发酵不久,腾讯方面便迅速作出了回应。当天下午,腾讯官方信息发布平台“鹅厂黑板报”发布文章,直接驳斥了这一说法。文章明确指出,所谓“AI一号位即将
新智元报道编辑:艾伦【新智元导读】3 月 12 日,据《白鲸实验室》独家爆料,DeepSeek V4 和姚顺雨领衔操刀的混元新模型,均预计将于下个月(2026 年 4 月)发布。3 月 11 日,O
作者 | 周一笑邮箱 | zhouyixiao@pingwest com2025年4月,还在OpenAI的姚顺雨发了一篇博文《The Second Half》,提出一个判断:AI进入下半场了,接
热门专题
热门推荐
科学家警告,过度依赖人工智能可能削弱创造力与批判性思维,类似GPS损害方向感。研究显示,AI替代需“认知摩擦”的思考过程,或导致认知能力衰退。专家建议应有意识使用AI,使其成为思维“扩音器”而非替代品,例如先自主判断、加深信息处理、主动创意构思,以保护并锻炼大脑独特能力。
谷歌推出云端AI驱动的安卓电脑,重塑PC形态。当前AIPC多依赖云端算力,本地硬件价值受质疑。云电脑与AI结合成为新方向,对网络延迟更宽容。谷歌联合硬件伙伴推进该方案,阿里等云服务商也已布局。传统芯片、终端厂商及微软、苹果正以不同策略应对AIPC趋势。未来竞争将聚焦云端能力、系统重构与生态协。
结论先行:在2026年的商业环境中,企业数字化转型方法的核心不再是单纯的IT系统堆砌,而是“业务流程自动化”与“AI智能化”的深度融合。成功的数字化转型方法论应遵循“小步快跑、场景切入、数据驱动”的原则,利用AI Agent(智能体)技术打通烟囱式系统,实现平滑升级,而非推倒重来。 一、 拒绝假大空
面对琳琅满目的产品设计软件,许多设计师和团队都在追问:究竟哪一款才是最好的选择?然而,真正的答案并非一个简单的软件名称,而是一套基于您具体工作流程的适配逻辑。本文将为您系统解析,如何跳出“最好”的迷思,找到最“对”的那款工具,从而最大化团队效率与产出价值。 核心决策逻辑 首先,我们必须确立一个核心原
跨境电商的售后环节,本质上是客户信任的二次考验。当问题出现时,初次交易建立的信任已然动摇,若处理不当,将直接导致客户永久流失。因此,构建一套真正高效的售后体系,必须实现三大核心目标:响应速度需如本地支付般即时;处理规则需预先设定,实现小额纠纷的自动化化解;最终,所有流程数据必须形成闭环,驱动供应链的





