游乐游手机版
首页/业界动态/文章详情

Hy3 preview - 腾讯混元开源快慢思考融合的混合专家模型

时间:2026-04-25 09:35
Hy3 preview是什么 说到最近开源大模型领域的重磅新闻,腾讯混元推出的Hy3 preview绝对算一个。它被定位为“迄今最智能的模型”,这个说法背后,是一套相当扎实的技术组合拳。其核心在于“快慢思考融合”的混合专家(MoE)架构——简单来说,它拥有高达295B的总参数规模,但每次推理时,只会

Hy3 preview是什么

说到最近开源大模型领域的重磅新闻,腾讯混元推出的Hy3 preview绝对算一个。它被定位为“迄今最智能的模型”,这个说法背后,是一套相当扎实的技术组合拳。其核心在于“快慢思考融合”的混合专家(MoE)架构——简单来说,它拥有高达295B的总参数规模,但每次推理时,只会根据任务需要,智能地激活其中21B的参数。这种设计,巧妙地在顶尖性能和可控的推理成本之间找到了平衡点。

更值得玩味的是它的“全面实用性”定位。模型团队明确拒绝了“偏科”路线,转而追求推理、长文、指令遵循、对话、代码、工具调用等多项能力的体系化协同。怎么验证这种协同效果呢?他们跳出了容易被“刷榜”的公开测试集,转而通过自建评测、引入最新考试题以及真实产品众测来检验模型的“实战能力”。与此同时,从模型架构到底层推理框架的深度协同优化,让端到端推理效率提升了40%,这使得高性能AI不再只是实验室的展示品,而是具备了真正的商业可用性。

Hy3 preview的主要功能

那么,这个模型具体能做什么?它的能力矩阵覆盖得相当全面:

  • 复杂推理:不仅在常规数学题上表现稳定,更能应对数学奥赛、生物联赛乃至一些前沿科学难题,展现出可泛化的强推理能力。
  • 代码与智能体:支持一次性生成完整可运行的小程序或小游戏代码,在SWE-Bench Verified、Terminal-Bench 2.0等硬核评测中成绩突出,智能体任务执行能力显著跃升。
  • 上下文学习:基于自研的CL-bench与CL-bench-Life基准,模型擅长从杂乱冗长的文本中,精准捕捉那些隐含的约束条件和复杂规则。
  • 指令遵循:能够准确处理多轮对话中涉及复杂排期、跨部门项目规划等真实工作场景的需求,理解意图相当到位。
  • 自然对话:刻意减少了“机器味”,在回答时会先尝试共情,再进行解答,使得写作更流畅自然,使用的比喻也更生动贴切。
  • 长文本处理:支持高达256K的上下文长度,足以处理数万字级别的文档,进行全文理解、摘要总结或关键信息提取。

Hy3 preview的技术原理

这些亮眼功能的背后,是一系列深思熟虑的技术设计:

  • MoE 混合专家架构:采用稀疏激活机制,这是实现高性价比的关键。每次推理仅激活21B参数,却能从295B的总参数库中调用最合适的“专家”,平衡性能与成本。
  • 快慢思考融合机制:模仿人类的认知模式,整合了快速直觉反应与慢速深度分析。模型能根据任务复杂度,动态调配计算资源和推理路径,该快时快,该深时深。
  • 预训练基础设施重建:为了突破能力天花板,团队推倒重建了预训练与强化学习框架,并大幅扩大了RL训练的规模,针对性强化了代码生成与智能体任务执行能力。
  • 架构-推理协同优化:这不是简单的模型训练,而是从架构设计阶段就与底层推理框架深度协同。通过算子融合、内存优化等工程手段,实现了端到端推理效率40%的提升。
  • 长上下文处理机制:为实现对256K tokens超长文本的精准处理,采用了高效的位置编码与稀疏注意力机制,确保模型即使在数万字的文档中也能准确定位和理解信息。
  • 多能力体系化训练:始终坚持“不偏科”的原则。通过统一的训练框架,让推理、代码、对话、指令遵循等能力不是孤立发展,而是深度协同、相互增强,形成体系化优势。

如何使用Hy3 preview

对于想要体验或使用Hy3 preview的开发者与用户,目前有几种便捷的途径:

  • 官网直接体验:最直接的方式是访问腾讯混元官网,通过在线对话界面,亲自测试它的推理、代码生成和长文本理解能力。
  • 开源本地部署:模型已在GitHub和Hugging Face全面开源。搜索“Tencent Hy3 preview”,即可下载模型权重与推理代码,基于本地GPU环境进行部署和进一步的微调。
  • API 调用开发:对于希望集成到自有应用中的开发者,可以登录腾讯云TokenHub,选择Hy3 preview提供的Lite、Standard、Pro或Max套餐,获取API Key后,便能通过标准接口调用模型能力。
  • 腾讯产品直接使用:事实上,它已经深度融入腾讯的生态。在元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享、搜狗输入法、腾讯地图、腾讯电子签、腾讯云等众多产品中,其底层模型已升级为Hy3 preview,直接对话就能调用新模型的能力。

Hy3 preview的关键信息和使用要求

这里有一份关键信息速查表,供您参考:

  • 模型架构:快慢思考融合MoE,总参数295B,激活参数21B。
  • 上下文长度:最大支持256K tokens。
  • 开源情况:模型权重与代码已在GitHub、Hugging Face全面开源,可免费下载。
  • API 调用:通过腾讯云TokenHub调用,输入费用最低1.2元/百万tokens,输出最低4元/百万tokens。
  • 套餐价格:提供阶梯式套餐,Lite套餐28元/月(含35百万tokens),Standard 78元/月,Pro 238元/月,Max 468元/月。
  • 已接入产品:已广泛接入元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享、搜狗输入法、腾讯地图、腾讯电子签、腾讯云等腾讯系产品。

Hy3 preview的核心优势

综合来看,Hy3 preview的差异化优势集中在以下几点:

  • 真实评测导向:不盲目追逐容易优化的公开榜单,而是通过自建50多套评测、引入真实考试题和产品众测来验证模型的实际战斗力,结果更可信。
  • 高性价比:深度协同的架构与推理优化,带来40%的推理效率提升,结合仅21B的激活参数量,使得高性能推理的成本变得更具商业吸引力。
  • Agent 能力跃升:在代码生成和多步骤复杂任务执行上进步显著,已能一次性输出完整、可运行的项目代码,智能体实用性大大增强。
  • 实用主义原则:整个模型的开发逻辑清晰体现了实用主义——追求能力体系化、评测真实性与商业合理性的三者统一,而非单纯追求参数规模或单项分数。

Hy3 preview的项目地址

  • 项目官网:https://hunyuan.tencent.com/research/hy3
  • GitHub仓库:https://github.com/Tencent-Hunyuan/Hy3-preview
  • HuggingFace模型库:https://huggingface.co/tencent/Hy3-preview

Hy3 preview的同类竞品对比

将其置于当前主流开源大模型的坐标系中,能更清晰地看到它的定位与特点:

维度 腾讯混元 Hy3 preview DeepSeek-V3.2 Kimi-K2.5 GLM-5
总参数 295B 约600B+ 约1T 约800B
激活参数 21B 约37B 约32B 约78B
上下文长度 256K 128K 256K 128K
Agent 评测 57+分(16项均值) 约51分 约57分 约60分
开源情况 已开源 已开源 未开源 未开源
定价策略 输入1.2元/百万tokens起 较低 较高 中等
核心定位 实用主义+高性价比 性能优先 长文本+多模态 通用大模型

Hy3 preview的应用场景

基于其能力矩阵,Hy3 preview能在多个领域发挥实际价值:

  • 学术科研:辅助研究人员推导复杂数学公式、解答奥赛级理科难题,甚至进行论文深度阅读与科研假设的初步验证。
  • 教育辅导:化身智能导师,讲解高难度题目,并能根据学生的理解水平动态调整讲解深度,生成个性化的练习题与知识脉络图。
  • 软件开发:极大提升开发效率,可一次性输出完整的微信小程序或小游戏代码及配置文件,自动修复代码Bug,辅助完成前后端联调与复杂的终端任务。
  • 智能办公:成为高效办公助手,能从杂乱无章的会议纪要中精准提取待办事项与时间排期,处理跨部门的复杂项目协调,甚至在腾讯文档中直接生成PPT内容大纲。
  • 内容运营:帮助运营人员撰写公众号文章、营销文案,其自然对话能力能有效优化文本,减少“AI腔”,生成风格多样、比喻生动的创意内容。
来源:https://ai-bot.cn/hy3-preview/
上一篇Agent 智能体的自主学习 下一篇电商平台财务结算流程
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿