首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
腾讯AI重构后姚顺雨首份答卷出炉

腾讯AI重构后姚顺雨首份答卷出炉

热心网友
27
转载
2026-05-20

腾讯混元大模型家族迎来了一个备受关注的新成员。4月23日,腾讯正式发布并开源了混元Hy3 preview语言模型。这款模型主打快慢思考融合的MoE架构,总参数达2950亿,激活参数为210亿,最大支持256K上下文长度。官方宣称,其整体性能达到了同尺寸模型的最佳水平。

从研发节奏看,Hy3 preview于2026年1月底正式启动训练,从训练到上线用时不到三个月。腾讯内部将其定义为混元大模型从“读万卷书”走向“行万&里路”、尝试解决真实世界复杂问题的开端。

而这款模型最受行业瞩目的标签在于,它是“天才少年”姚顺雨在2025年底加盟腾讯后,全程主导推出的第一代大模型。作为腾讯重金邀请的首席AI科学家,Hy3 preview既是他对重构后混元研发体系的首次完整实践,也承载着腾讯补齐AI短板、在大模型下半场实现追赶的核心期待。

姚顺雨表示,Hy3 preview是混元大模型重建的第一步。团队希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,以提升Hy3正式版的实用性。与此同时,团队也在继续扩大预训练和强化学习的规模,提升模型的智能上限,并通过与腾讯众多产品的深度协同设计,持续提升模型在真实场景中的综合表现,并开始探索特色模型能力。

一、一手实测Hy3 preview

根据官方披露的核心信息,Hy3 preview从研发之初就围绕智能体(Agent)场景做了针对性设计,这也是它与此前混元系列模型最核心的差异。

在启动模型训练前,姚顺雨主导完成了混元预训练和强化学习基础设施的全面重建,同时定下了模型追求实用性的三大核心原则,构成了Hy3 preview的研发底层逻辑:

能力体系化:不推崇“偏科”,因为即便是代码智能体的单一应用,也涉及推理、长文、指令、对话、代码、工具等多种能力的深度协同;

评测真实性:主动跳出易被“刷榜”的公开榜单,通过自建题目、最新考试、人工评测、产品众测等多种方式评估和改进模型的“真实战斗力”;

性价比追求:实用性离不开商业合理性,深度协同模型架构和推理框架的设计,大幅降低任务成本,让智能用得起、用得好。

官方资料显示,Hy3 preview采用了总参数量2950亿、激活参数仅210亿的MoE架构,同时融合了“快慢思考”机制。210亿的激活参数,为模型高频次、长链路的Agent调用提供了低成本的运行底座;而“快慢思考”的融合设计,天然适配复杂逻辑推理与多步工具调用场景,也就是姚顺雨提出的ReAct(推理-行动)循环。

我们第一时间对Hy3 preview进行了实测。首先尝试了一个覆盖数据抓取、数值计算、可视化生成、文本分析全链路的综合任务:“使用Python抓取过去90天纳斯达克100、伦敦金与沪深300的日线收盘数据。计算它们之间的皮尔逊相关系数,并用D3.js或ECharts生成一个单文件HTML动态热力图。最后,基于数据结果输出一段500字的跨市场资产配置Memo。”

实测过程显示,Hy3 preview在数据获取阶段反复受阻。接口认证失败后,模型接连切换akshare、yfinance等多个数据源,纳斯达克100数据因速率限制缺失而被迫用模拟数据替代,修错重试的循环消耗了大量时间。

在可视化交付上,Hy3 preview最终生成了三资产相关性热力图,但由于部分数据并非真实采样,热力图的准确性与可信度打了折扣。最核心的文本交付物缺失明显——提示词明确要求输出500字跨市场资产配置Memo,但模型只给出了几行Bullet point式的简略配置比例,没有成文的分析段落,任务交付在关键环节出现了缺位。

随后,我们又尝试了另一个长链路Agent测试:启用浏览器模式,在SkillHub平台进行全链路深度抓取,完整理清腾讯文档Skill的Auth认证全流程与数据同步底层机制,最终输出一份标准化的技术原理分析文档。

在这次测试中,Hy3 preview展现了清晰的Agent自治与多步推理(ReAct)过程:先搜索SkillHub整体介绍;发现需要深入,又去精准抓取了Auth认证的开发者文档;接着去查了MCP Server的底层原理;最后才开始动笔写文档。这证明了Hy3 preview作为Agent的路由调度中心,其长链路规划和工具调用很稳定,没有在中途崩溃或陷入死循环,完整走完了“推理-行动-验证-输出”的闭环。

这一表现也与官方披露的产品落地数据形成了呼应:在CodeBuddy、WorkBuddy产品上,Hy3 preview首token延迟降低54%、端到端时长降低47%、任务成功率提升至99.99%+。在实际用户环境中,已稳定驱动最长495步的复杂Agent工作流,覆盖文档处理、数据分析、知识检索、工具链编排等多样化办公场景。

从这两组实测可以看出,Hy3 preview呈现出一种典型的“过渡态特征”。一方面,在复杂任务中,它已经具备了较为清晰的Agent执行路径:能够自主拆解问题、规划步骤,并在不同工具之间进行切换,整体链路没有明显中断。这种“从问题到流程”的能力,确实在向真实工作流靠近。

但另一方面,真正决定可用性的“最后一公里”仍然不够稳定——数据获取阶段的反复试错、关键结果的缺失、以及最终交付物的不完整,都说明模型在长链路执行中,仍然存在“做了一半”的问题。

目前,Hy3 preview已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、腾讯文档等产品首发上线,同时支持接入OpenClaw、OpenCode等主流开源智能体产品,并已上架腾讯云大模型服务平台TokenHub。价格方面,Hy3 preview输入价格最低1.2元/百万tokens,输入命中缓存价格0.4元/百万tokens,输出价格最低4元/百万tokens。

二、天才少年,和动起来的腾讯

这是备受关注的“天才少年”姚顺雨入职腾讯后主导的第一代大模型。作为2025年底腾讯重磅挖来的首席AI科学家,Hy3 preview是他入职后交出的第一份核心模型答卷,也承载着腾讯补齐AI短板、发力大模型基础研究的期待。

去年9-12月,姚顺雨入职腾讯,出任“CEO/总裁办公室”首席AI科学家,兼任AI Infra部与大语言模型部负责人,直接向总裁刘炽平汇报,全面统筹混元大模型研发工作。12月,腾讯完成组织架构重构,新设AI Infra部、AI Data部、数据计算平台部,姚顺雨全面掌控混元研发体系。上任后,他立即重构了AI Infra团队,搭建起预训练、精调、后训练、推理等完整研发链条,为后续模型研发奠定基础。

今年1月底,马化腾在年会上承认腾讯AI“动作慢了”,刘炽平同步披露混元3.0正在内部测试,计划4月对外推出。同样是在1月底,Hy3 preview正式启动训练,从训练到上线用了不到三个月。

姚顺雨(1998年生)的履历自带“天才少年”标签,但客观来看,他的技术背景与腾讯当时的AI需求高度契合,这也是腾讯重金挖角的核心原因——腾讯此前混元负责人张正友(深耕计算机视觉领域)、蒋杰(侧重大数据方向)均非NLP/LLM原生背景,而姚顺雨是腾讯首位真正意义上的LLM原生技术领导者,其核心履历与研究方向,恰好匹配腾讯混元突破的核心需求。

在学术界,姚顺雨是顶级的语言智能体(Language Agents)研究者,著名的ReAct(推理-行动框架)和Tree of Thoughts(思维树)均出自其手;在OpenAI短暂的一年多里,他也深度参与了Operator、Deep Research等智能体产品研发,深入接触模型预训练与后训练环节,积累了一线工程化经验。

2025年4月,他曾发表文章《The Second Half》,明确提出,AI的竞争正在从“训练更强的模型”转向“定义并评估真实世界任务”,强调评估体系重构,反对盲目堆料模型规模。

这一理念也贯穿了Hy3 preview的研发。Hy3 preview定位为一个总参数量2950亿、激活参数仅210亿的MoE模型。210亿的激活参数意味着模型具备了高频次、长链路Agent调用的低成本底座,同时其内部融合的“快慢思考”机制,天然适合处理复杂的逻辑推理与工具调用(如ReAct循环)。

从前面的实测来看,Hy3 preview更像是一款验证技术方向的原型模型。把视角拉回腾讯自身,这种“未完全成熟”的状态,可能也有其内在合理性。一方面,Hy3 preview从训练到上线不到三个月,本身就是一次快速迭代的技术试水;另一方面,在经历了AI组织架构的全面重构之后,腾讯也需要这样一款模型,去验证新的研发链条是否通顺、锚定的Agent技术路线是否成立。

不过,在国内大模型已经进入贴身肉搏的当下,Hy3 preview的到来,只是腾讯AI补位的开始。无论是MoE架构的工程化优化,还是Agent场景的产业落地深度,国内头部厂商已经跑通了多轮迭代,腾讯想要追上甚至超车,仅凭一次模型更新远远不够。

来源:https://www.geekpark.net/news/363076
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

腾讯AI重构后姚顺雨首份答卷出炉
AI资讯
腾讯AI重构后姚顺雨首份答卷出炉

腾讯混元大模型家族迎来了一个备受关注的新成员。4月23日,腾讯正式发布并开源了混元Hy3 preview语言模型。这款模型主打快慢思考融合的MoE架构,总参数达2950亿,激活参数为210亿,最大支持256K上下文长度。官方宣称,其整体性能达到了同尺寸模型的最佳水平。 从研发节奏看,Hy3 prev

热心网友
05.20
唐杰上联经典对仗 姚顺雨下联巧妙接续
业界动态
唐杰上联经典对仗 姚顺雨下联巧妙接续

腾讯开源轻量级组件AgentDB,通过分层渐进式记忆架构解决智能体长周期任务中的记忆难题。它在保证信息完整的同时显著降低Token消耗,支持全本地化部署,实现记忆高效组织与精准回溯,提升跨会话协作表现,是推动长周期任务发展的关键技术基础设施。

热心网友
05.19
唐杰出上联姚顺雨对下联经典对联赏析
AI资讯
唐杰出上联姚顺雨对下联经典对联赏析

腾讯开源AgentDB作为独立记忆组件,采用分层渐进式设计,在token效率与信息完整性间取得平衡。它通过符号化短期记忆与分层长期记忆双轨架构,实现记忆可压缩、可追溯,支持全本地化部署。测试显示其能显著提升记忆准确率并降低消耗,被视为长周期任务中记忆管理的关键工程化落地,有望成为相。

热心网友
05.19
腾讯混元大模型重构完成 Hy3预览版正式上线
AI资讯
腾讯混元大模型重构完成 Hy3预览版正式上线

「Hy3 preview是混元大模型重建的第一步。」 姚顺雨交出了加入腾讯后的第一份模型答卷。 4月23日,腾讯混元Hy3 preview语言模型发布并开源。这款模型主打快慢思考融合的MoE架构,总参数295B,激活参数21B,最大支持256K上下文长度。官方称其整体性能达到了同尺寸模型的最佳水平。

热心网友
05.18
腾讯辟谣姚顺雨离职传闻:消息纯属子虚乌有
业界动态
腾讯辟谣姚顺雨离职传闻:消息纯属子虚乌有

针对“AI一号位即将离职”的传言,腾讯官方已严正辟谣,称其纯属子虚乌有。传言涉及的关键人物姚顺雨现任腾讯首席AI科学家,负责AI基础设施与大语言模型部门。腾讯表示将保留追究造谣者法律责任的权利。

热心网友
05.14

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

FineShare Singify AI翻唱生成器制作歌曲教程
AI教程
FineShare Singify AI翻唱生成器制作歌曲教程

AI技术在音乐创作领域的应用正不断深化,从基础的智能编曲发展到如今备受关注的AI歌曲翻唱。FineShare Singify作为一款专业的AI翻唱生成工具,让用户能够轻松将任意歌曲转换为由虚拟歌手演绎的全新版本,为音乐二次创作带来了更多可能性。 本质上,Singify是一个高度智能的“AI歌声转换器

热心网友
05.20
DeepFloyd IF 是什么 Stability AI 最新图像生成模型详解
AI教程
DeepFloyd IF 是什么 Stability AI 最新图像生成模型详解

在AI绘画与文本生成图像领域,开源社区迎来了一位实力强劲的新选手:DeepFloyd IF。该模型由StabilityAI旗下的DeepFloyd实验室研发,其核心采用了一种创新的模块化、级联式神经网络架构,专门用于生成超高分辨率的高质量图片。 通俗地讲,你可以将它看作一个分工明确的“专家团队”。生

热心网友
05.20
Shiba Inu与狗狗币价格走势分析 比特币关键阻力位82000美元如何影响市场
web3.0
Shiba Inu与狗狗币价格走势分析 比特币关键阻力位82000美元如何影响市场

柴犬币(SHIB)图表形态逆转:更高低点预示趋势转变 在经历了数月的低迷与方向不明的盘整后,柴犬币(SHIB)的日线图表终于呈现出一个关键且清晰的技术信号:一系列更高的低点正在形成。这标志着此前主导市场的“更低的高点和更低的低点”的下降趋势结构已被打破,一种新的、更具建设性的价格形态正在确立。对于资

热心网友
05.20
福特警告欧洲强制电动化政策可能产生反效果
业界动态
福特警告欧洲强制电动化政策可能产生反效果

福特搁置欧洲2030年全面停售燃油车计划,因市场电动化进程不及预期。公司认为强制淘汰政策或适得其反,可能导致老旧高排放车辆持续使用,反而延缓减排。福特呼吁调整法规,为混合动力等过渡技术提供空间,并计划推出燃油与电动新车型以重振市场。

热心网友
05.20
特斯拉Cybertruck涉水行驶失败 车主实测后车辆进水被逮捕
业界动态
特斯拉Cybertruck涉水行驶失败 车主实测后车辆进水被逮捕

特斯拉Cybertruck车主为测试车辆“涉水模式”,故意将其驶入湖泊,导致车辆进水失去动力,人员被迫弃车逃生。警方以违反水域安全法规等多项指控逮捕司机。官方手册明确该模式仅适用于浅水区域,且涉水损坏不在保修范围内。此次事件警示公众需遵守法规并重视安全警告。

热心网友
05.20