腾讯混元大模型重构完成 Hy3预览版正式上线

首页

热心网友

转载

2026-05-18

「Hy3 preview是混元大模型重建的第一步。」

姚顺雨交出了加入腾讯后的第一份模型答卷。

4月23日，腾讯混元Hy3 preview语言模型发布并开源。这款模型主打快慢思考融合的MoE架构，总参数295B，激活参数21B，最大支持256K上下文长度。官方称其整体性能达到了同尺寸模型的最佳水平。

从研发节奏看，Hy3 preview于2026年1月底正式启动训练，从训练到上线用了不到三个月。在腾讯内部，它被定义为混元大模型从“读万卷书”走向“行万&里路”、尝试解决真实世界复杂问题的开端。

而这款模型最受行业关注的核心标签在于，它是“天才少年”姚顺雨在2025年底加盟腾讯后，全程主导推出的第一代大模型。作为腾讯重金邀请的首席AI科学家，Hy3 preview既是他对重构后混元研发体系的首次完整实践，也承载着腾讯补齐AI短板、在大模型下半场实现追赶的核心期待。

姚顺雨表示，“Hy3 preview是混元大模型重建的第一步。我们希望通过这次开源和发布，获得来自开源社区和用户的真实反馈，帮助我们提升Hy3正式版的实用性。与此同时，我们也在继续扩大预训练和强化学习的规模，提升模型的智能上限，并通过与腾讯众多产品的深度Co-Design，持续提升模型在真实场景中的综合表现，并开始探索特色模型能力。”

一手实测Hy3 preview

从披露的核心信息来看，Hy3 preview从研发之初就围绕智能体（Agent）场景做了针对性设计，这也是它与此前混元系列模型最核心的差异。

在启动模型训练前，姚顺雨主导完成了混元预训练和强化学习基础设施的全面重建，同时定下了模型追求实用性的三大核心原则：

能力体系化：不推崇“偏科”，因为即便是代码智能体的单一应用，也涉及推理、长文、指令、对话、代码、工具等多种能力的深度协同；
评测真实性：主动跳出易被“刷榜”的公开榜单，通过自建题目、最新考试、人工评测、产品众测等多种方式评估和改进模型的“真实战斗力”；
性价比追求：实用性离不开商业合理性，深度协同模型架构和推理框架的设计，大幅降低任务成本，让智能用得起、用得好。

资料显示，Hy3 preview采用了总参数量295B、激活参数仅21B的MoE架构，同时融合了“快慢思考”机制。21B的激活参数，为模型高频次、长链路的Agent调用提供了低成本的运行底座；而“快慢思考”的融合设计，天然适配复杂逻辑推理与多步工具调用场景，即姚顺雨提出的ReAct（推理-行动）循环。

我们第一时间对Hy3 preview进行了实测。首先是一个覆盖数据抓取、数值计算、可视化生成、文本分析全链路的综合任务：“使用Python抓取过去90天纳斯达克100、伦敦金与沪深300的日线收盘数据。计算它们之间的皮尔逊相关系数，并用D3.js或ECharts生成一个单文件HTML动态热力图。最后，基于数据结果输出一段500字的跨市场资产配置Memo。”

实测过程显示，Hy3 preview在数据获取阶段反复受阻。接口认证失败后，模型接连切换akshare、yfinance等多个数据源，纳斯达克100数据因速率限制缺失而被迫用模拟数据替代，修错重试的循环消耗了大量时间。

在可视化交付上，Hy3 preview最终生成了三资产相关性热力图，但由于部分数据并非真实采样，热力图的准确性与可信度打了折扣。最核心的文本交付物缺失明显——提示词明确要求输出500字跨市场资产配置Memo，模型却只给出了几行Bullet point式的简略配置比例，没有成文的分析段落，任务交付在关键环节出现了缺位。

随后，我们尝试了另一个长链路Agent测试：启用浏览器模式，在SkillHub平台进行全链路深度抓取，完整理清腾讯文档Skill的Auth认证全流程与数据同步底层机制，最终输出一份标准化的技术原理分析文档。

在这次测试中，Hy3 preview展现了清晰的Agent自治与多步推理（ReAct）过程：先搜索SkillHub整体介绍；发现需要深入，又去精准抓取了Auth认证的开发者文档；接着去查了MCP Server的底层原理；最后才开始动笔写文档。这证明了Hy3 preview作为Agent的路由调度中心，其长链路规划和工具调用很稳定，没有在中途崩溃或陷入死循环，完整走完了“推理-行动-验证-输出”的闭环。

这一表现也与披露的产品落地数据形成了呼应：在CodeBuddy、WorkBuddy产品上，Hy3 preview首token延迟降低54%、端到端时长降低47%、任务成功率提升至99.99%+。在实际用户环境中，已稳定驱动最长495步的复杂Agent工作流，覆盖文档处理、数据分析、知识检索、工具链编排等多样化办公场景。

从这两组实测可以看出，Hy3 preview呈现出一种典型的“过渡态特征”。一方面，在复杂任务中，它已经具备了较为清晰的Agent执行路径：能够自主拆解问题、规划步骤，并在不同工具之间进行切换，整体链路没有明显中断。这种“从问题到流程”的能力，确实在向真实工作流靠近。

但另一方面，真正决定可用性的“最后一公里”仍然不够稳定——数据获取阶段的反复试错、关键结果的缺失、以及最终交付物的不完整，都说明模型在长链路执行中，仍然存在“做了一半”的问题。

目前，Hy3 preview已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、腾讯文档等产品首发上线，同时支持接入OpenClaw、OpenCode等主流开源智能体产品，并已上架腾讯云大模型服务平台TokenHub。价格方面，Hy3 preview输入价格最低1.2元/百万tokens，输入命中缓存价格0.4元/百万tokens，输出价格最低4元/百万tokens。

天才少年，和动起来的腾讯

这是备受关注的“天才少年”姚顺雨入职腾讯后主导的第一代大模型。作为2025年底腾讯重磅挖来的首席AI科学家，Hy3 preview是他入职后交出的第一份核心模型答卷，也承载着腾讯补齐AI短板、发力大模型基础研究的期待。

去年9-12月，姚顺雨入职腾讯，出任“CEO/总裁办公室”首席AI科学家，兼任AI Infra部与大语言模型部负责人，直接向总裁刘炽平汇报，全面统筹混元大模型研发工作。12月，腾讯完成组织架构重构，新设AI Infra部、AI Data部、数据计算平台部，姚顺雨全面掌控混元研发体系。上任后，他立即重构了AI Infra团队，搭建起预训练、精调、后训练、推理等完整研发链条，为后续模型研发奠定基础。

今年1月底，马化腾在年会上承认腾讯AI“动作慢了”，刘炽平同步披露混元3.0正在内部测试，计划4月对外推出。也是在1月底，Hy3 preview正式启动训练，从训练到上线用了不到三个月。

姚顺雨（1998年生）的履历自带“天才少年”标签，但客观来看，他的技术背景与腾讯当时的AI需求高度契合，这也是腾讯重金挖角的核心原因。腾讯此前混元负责人张正友（深耕计算机视觉领域）、蒋杰（侧重大数据方向）均非NLP/LLM原生背景，而姚顺雨是腾讯首位真正意义上的LLM原生技术领导者，其核心履历与研究方向，恰好匹配腾讯混元突破的核心需求。

在学术界，姚顺雨是顶级的语言智能体（Language Agents）研究者，著名的ReAct（推理-行动框架）和Tree of Thoughts（思维树）均出自其手；在OpenAI短暂的一年多里，他也深度参与了Operator、Deep Research等智能体产品研发，深入接触模型预训练与后训练环节，积累了一线工程化经验。

2025年4月，他曾发表文章《The Second Half》，明确提出，AI的竞争正在从“训练更强的模型”转向“定义并评估真实世界任务”，强调评估体系重构，反对盲目堆料模型规模。这一理念也贯穿了Hy3 preview的研发。

从前面的实测来看，Hy3 preview更像是一款验证技术方向的原型模型。把视角拉回腾讯自身，这种“未完全成熟”的状态，可能也有其内在合理性。一方面，Hy3 preview从训练到上线不到三个月，本身就是一次快速迭代的技术试水；另一方面，在经历了AI组织架构的全面重构之后，腾讯也需要这样一款模型，去验证新的研发链条是否通顺、锚定的Agent技术路线是否成立。

不过，在国内大模型已经进入贴身肉搏的当下，Hy3 preview的到来，只是腾讯AI补位的开始。无论是MoE架构的工程化优化，还是Agent场景的产业落地深度，国内头部厂商已经跑通了多轮迭代，腾讯想要追上甚至超车，仅凭一次模型更新远远不够。

*头图来源：GPT生成

来源:https://www.163.com/dy/article/KR7LI3JB05119FMA.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：2026奔驰品牌日全新纯电GLC亮相新一代S级中国首秀下一篇：DeepSeek 模型更新解读 Tile Kernels 与 DeepEP V2 新特性