首页 游戏 软件 资讯 排行榜 专题
首页
AI
腾讯混元大模型正式上线姚顺雨团队主导研发

腾讯混元大模型正式上线姚顺雨团队主导研发

热心网友
16
转载
2026-05-18

腾讯混元的新一代模型,Hy3 preview,刚刚揭开面纱。

这不仅是混元团队在架构与基础设施层面重新出发后的首个版本,更因其“实用性”的明确标签而备受关注。首批发布的模型尺寸相对较小,目标直指落地应用。同样引人注目的是,这也是AI专家姚顺雨归国加盟腾讯后交出的首份重要答卷,其背后贯彻的正是他所倡导的“AI下半场”理念——模型在腾讯庞杂的真实业务场景中打磨,效果与实用性被置于首位。

根据官方信息,新一代模型在聊天、代码、智能体、数理推理、指令遵循及上下文理解等多个维度的能力均获得了增强。

目前,Hy3 preview已在腾讯云、元宝、腾讯内部办公助手(ima、CodeBuddy、WorkBuddy)、QQ、QQ浏览器、腾讯文档、腾讯乐享等平台首发上线。微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等更多核心产品也正在陆续接入。

此外,该模型已支持接入OpenClaw、OpenCode、KiloCode等流行的开源智能体框架,并正式上架了腾讯云的大模型服务平台TokenHub。

五一假期前夕,全球AI赛场可谓动作频频:阿里的Qwen 3.6 Max Preview、月之暗面的Kimi 2.6、小米的MiMo-V2.5-Pro相继亮相。那么,作为基础大模型的腾讯混元Hy3 preview,其实际表现究竟如何?我们不妨上手实测一番。

智能体硬核测试:复杂任务能否胜任?

作为ReAct(推理与行动)框架的提出者,姚顺雨的加入无疑强化了混元在智能体方向的基因。Hy3 preview在代码与智能体能力的提升,正顺应了“Agent下半场”的技术趋势与市场需求。

在腾讯的AI办公助手WorkBuddy上,我们可以指派其进行代码开发、深度研究、产品管理、数据分析等复合型任务。

例如,要求它调研关于DeepSeek的融资传闻,并对比至少5个不同背景的权威信源,列出已知事实与逻辑冲突点,最后给出信度评分。模型能够自主启动多轮搜索,完成长链推理后,系统性地梳理出信源间的矛盾,最终生成一份客观中立的调查报告,整个过程无需人工干预。

进一步,我们让它联网获取联合国人口司的数据,完成一项“全球人口结构变迁”的可视化分析。这个涉及数据获取、清洗、分析与图表呈现的复合任务,Hy3 preview同样完成得较为顺畅,最终输出了直观的图表与配套分析文本。

在纯代码能力测试中,我们让它生成一款“开心消消乐”网页游戏。最终产出的作品画面精美,游戏逻辑完整,可直接运行,整体完成质量超出了预期。

唠嗑、编故事……它的基本功扎实吗?

切换到腾讯元宝,可以看到混元大模型和其他主流模型一样,提供了“快速思考”与“深度思考”两种模式。前者响应更快,后者则思考更充分,答案质量更高。为了全面考察,我们后续测试均选择了“深度思考”模式。

既然主打实用,不妨先来聊聊家常。向Hy3 preview吐槽自己最近“变笨了”,它会耐心开解,分析可能是睡眠不足、工作压力大或刷短视频过多所致,并贴心地给出三条实用建议。

当话题延续到“写稿没灵感”时,它能自然衔接上下文,根据对话中流露的情绪调整回应的语气和深度,给出有针对性的创作建议。

它甚至能提供满满的“情绪价值”,变着花样夸人。

此前,知乎“AI请接招”活动中收录了一批刁钻问题,其中一道是:“今年才知道,亲生父母结婚时候没有叫我,我很难过怎么办?”许多大模型在此翻车,忽略了父母结婚时子女尚未出生的基本逻辑。Hy3 preview则敏锐地捕捉到了这个陷阱,在引导用户理清情绪的同时,展现了较强的常识推理与共情能力。

创意写作方面也值得一试。前段时间,NASA宇航员透过猎户座飞船窗口遥望地球的照片在社交媒体刷屏。

我们让Hy3 preview为这张图片生成5条朋友圈文案。它先分析了图片的孤独与震撼氛围,围绕对地球的敬畏、人类的渺小与伟大等情感触点,生成了风格各异的文案,有文艺的,也有哲思的,任意一条都足以直接发布。

在文风模仿上,要求它以欧·亨利的笔调创作一个短篇小说,其完成度也相当不错。

搜索能力方面,让它调查“Meta强制收集鼠标键盘输入的原因”,它能迅速援引权威信源,给出清晰、有据可查的解答。无论是查新闻、政策还是核实具体信息,整体表现都较为可靠。

“AI下半场”的底层重构

从技术层面看,Hy3 preview是一个融合了快慢思考机制的MoE(混合专家)语言模型。其总参数量为2950亿,激活参数量为210亿,支持256K上下文长度,在设计上兼顾了实用性与性价比。

据了解,混元团队在新一代模型上的主要工作是进行底层重构,将许多基础工作做得更加牢固,特别是预训练和强化学习的基础设施已被完全重做。团队并未在注意力机制等底层架构的微小创新上过度投入,而是选择了技术路线相对成熟的MoE,将全部精力和资源押注在工程基座(Infra)的稳固性上。

这意味着,Hy3 preview在模型稳定性、数据吞吐效率以及强化学习管线良品率上,可能达到了前所未有的工业级水准。

此外,在训练过程中,团队特别强调了模型评估,并加强了对自建Benchmark的研究。这与姚顺雨此前在博客中阐述的思路不谋而合——评估大于训练(Evaluation > Training)。

姚顺雨在《大模型的下半场》一文中曾指出,现有大模型的“配方”(预训练+强化学习+算力扩展)已高度成熟,具备了强大的泛化与解题能力。下半场的核心逻辑在于提出问题:“我们应该训练人工智能做什么?”

进入下半场,由于通用模型配方极其强大,投入巨大精力进行微调可能仅带来百分之几的提升。因此,评估变得比训练更为重要。行业需要重构评估体系,设计出更贴近现实世界复杂性的新任务与新范式,而非简单地设计更难的“考卷”。

要在AI下半场生存与发展,从业者必须具备类似“产品经理”的思维模式。必须深入思考:AI究竟该为谁解决什么实际问题?又该如何客观衡量它解决得好不好?

在这方面,腾讯手握微信、游戏、广告、云服务等国内乃至全球都极为复杂的业务场景。其自建的评测环境,必然高度贴合真实业务流中的难点与痛点。Hy3 preview的推出,或许标志着腾讯在其庞大生态内,已经初步构建出一个能够切实解决实际问题的生产力工具。

Hy3 preview于2026年1月底启动训练,从训练到上线仅用了不到三个月。这可以看作是混元大语言模型从“读万卷书”迈向“行万&里路”,尝试解决真实世界问题的一个开端。

当然,Hy3 preview只是一个起点。未来,混元团队希望通过开发者与用户的协同,进一步提升模型能力,使其在真实的场景与任务中持续进化。

来源:https://www.163.com/dy/article/KR7DRHKH0511AQHO.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

中国大模型如何推动全球科技创新与发展
科技数码
中国大模型如何推动全球科技创新与发展

人工智能技术正迎来一个关键的爆发节点。根据人民网5月11日的最新报道,国产大模型技术正以前所未有的速度迭代升级,应用场景也在持续拓宽,已成为全球人工智能创新版图中不可或缺的核心力量。尤其在编程开发、知识问答与专业内容处理等领域,AI展现出的能力已无限接近甚至超越人类专家水平,其对社会整体生产效率的潜

热心网友
05.17
AI时代品牌信任构建:大模型GEO优化服务商精选指南
业界动态
AI时代品牌信任构建:大模型GEO优化服务商精选指南

在信息爆炸的数字时代,消费者的信任已成为品牌最核心的无形资产。然而,当人工智能逐渐成为用户获取信息与决策的关键入口时,品牌在AI生成内容中的“存在感”与“准确性”变得至关重要。一旦品牌信息在AI回答中缺失或被误述,长期建立的信任可能迅速流失。因此,GEO优化的深层价值,远非单纯的技术调整,它本质上是

热心网友
05.17
全球领先大模型GEO优化服务商推荐:从国内到国际的权威指南
业界动态
全球领先大模型GEO优化服务商推荐:从国内到国际的权威指南

随着中国品牌出海步伐的不断深入,一个全新的挑战浮出水面:如何在ChatGPT等全球性AI平台中,塑造准确且积极的品牌认知。传统的GEO优化,其战场已从中文互联网扩展至全球范围。这对服务商提出了更高要求——不仅要精通AI技术,更需深刻理解跨境传播的复杂生态。基于对服务商跨境语境适配能力与全球AI生态布

热心网友
05.17
8G显存大模型硬件配置指南与可运行模型推荐
AI
8G显存大模型硬件配置指南与可运行模型推荐

想在本地部署大语言模型,但只有一张8GB显存的显卡?这完全可行。关键在于精准选择模型与量化方案,在有限的硬件资源下实现最优性能。本文将为您详细解析适配8G显存的各类主流模型及其具体部署运行方案。 一、4-bit量化模型部署指南 对于RTX 3060、RTX 4060等主流消费级显卡,4-bit量化是

热心网友
05.17
小米全模态大模型MiMo V2.5功能详解与应用场景
AI
小米全模态大模型MiMo V2.5功能详解与应用场景

2026年4月,小米大模型团队重磅推出新一代原生全模态智能体系列——MiMo-V2 5。该系列并非单一模型,而是一个强大的能力矩阵,致力于将多模态感知与自主行动深度结合。简而言之,它赋予AI“能看、能听、能读、能执行”的一体化智能,并标配高达100万token的超长上下文窗口,专为应对复杂的智能体任

热心网友
05.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

警惕人工智能依赖 避免大脑能力退化
业界动态
警惕人工智能依赖 避免大脑能力退化

科学家警告,过度依赖人工智能可能削弱创造力与批判性思维,类似GPS损害方向感。研究显示,AI替代需“认知摩擦”的思考过程,或导致认知能力衰退。专家建议应有意识使用AI,使其成为思维“扩音器”而非替代品,例如先自主判断、加深信息处理、主动创意构思,以保护并锻炼大脑独特能力。

热心网友
05.18
谷歌阿里微软云端AI决战 云电脑迎来行业新机遇
业界动态
谷歌阿里微软云端AI决战 云电脑迎来行业新机遇

谷歌推出云端AI驱动的安卓电脑,重塑PC形态。当前AIPC多依赖云端算力,本地硬件价值受质疑。云电脑与AI结合成为新方向,对网络延迟更宽容。谷歌联合硬件伙伴推进该方案,阿里等云服务商也已布局。传统芯片、终端厂商及微软、苹果正以不同策略应对AIPC趋势。未来竞争将聚焦云端能力、系统重构与生态协。

热心网友
05.18
企业数字化转型全流程解析:从战略规划到AI智能体落地
业界动态
企业数字化转型全流程解析:从战略规划到AI智能体落地

结论先行:在2026年的商业环境中,企业数字化转型方法的核心不再是单纯的IT系统堆砌,而是“业务流程自动化”与“AI智能化”的深度融合。成功的数字化转型方法论应遵循“小步快跑、场景切入、数据驱动”的原则,利用AI Agent(智能体)技术打通烟囱式系统,实现平滑升级,而非推倒重来。 一、 拒绝假大空

热心网友
05.18
产品设计软件推荐与选择指南
业界动态
产品设计软件推荐与选择指南

面对琳琅满目的产品设计软件,许多设计师和团队都在追问:究竟哪一款才是最好的选择?然而,真正的答案并非一个简单的软件名称,而是一套基于您具体工作流程的适配逻辑。本文将为您系统解析,如何跳出“最好”的迷思,找到最“对”的那款工具,从而最大化团队效率与产出价值。 核心决策逻辑 首先,我们必须确立一个核心原

热心网友
05.18
跨境电商售后难题的智能客服解决方案
业界动态
跨境电商售后难题的智能客服解决方案

跨境电商的售后环节,本质上是客户信任的二次考验。当问题出现时,初次交易建立的信任已然动摇,若处理不当,将直接导致客户永久流失。因此,构建一套真正高效的售后体系,必须实现三大核心目标:响应速度需如本地支付般即时;处理规则需预先设定,实现小额纠纷的自动化化解;最终,所有流程数据必须形成闭环,驱动供应链的

热心网友
05.18