游乐游手机版
首页/业界动态/文章详情

腾讯混元2.0发布:推理能力业界领先,效率大幅提升

时间:2025-12-06 09:12
12月6日消息,腾讯自研大模型混元2 0(Tencent HY 2 0)正式发布,同时DeepSeek V3 2也在腾讯生态内逐步接入。目前,这两大模型已率先在元宝、ima等腾讯AI原生应用中上线,

12月6日,腾讯公司正式发布了自主研发的大模型混元2.0(Tencent HY 2.0),同时DeepSeek V3.2也逐步接入腾讯生态体系。

目前,这两个先进模型已经率先在元宝、IMA等腾讯原生AI应用中投入使用。腾讯云也同步对外开放了相关模型的API接口和平台服务。

全新推出的Tencent HY 2.0采用了混合专家(MoE)架构,总参数量高达406B(激活参数32B),模型支持256K超长上下文窗口,在推理能力和效率方面均处于行业领先水平。

腾讯混元2.0正式发布:推理能力/效率业界领先

相较于上一代Hunyuan-T1版本,HY 2.0 Think在预训练数据和强化学习策略方面实现了显著优化。在数学、科学、代码编写、指令遵循等复杂推理场景中,其综合表现稳居国内第一梯队,泛化能力获得大幅提升。

在数学科学知识推理方面,通过使用高质量数据进行大规模强化学习训练,HY 2.0 Think的推理能力显著增强。在国际数学奥林匹克竞赛(IMO-AnswerBench)和哈佛MIT数学竞赛(HMMT2025)等权威测试中,模型取得了令人瞩目的成绩。得益于预训练数据的持续优化,模型在极具挑战性的“人类终极考试”(HLE)和衡量泛化能力的ARC AGI等任务上也实现了重大突破。

腾讯混元2.0正式发布:推理能力/效率业界领先

在指令遵循与长文本多轮对话能力方面,通过重要性采样修正有效缓解了训练与推理不一致的问题,实现了长窗口强化学习的高效稳定训练。同时,通过多样化可验证任务的沙盒测试,以及基于打分准则的强化学习训练,显著提升了HY 2.0 Think在Multi Challenge等指令遵循和多轮任务中的表现。

在代码与智能体能力方面,构建了规模化的可验证环境及高质量合成数据,极大地增强了模型在Agentic Coding和复杂工具调用场景下的实际落地能力。在面向真实应用场景的SWE-bench Verified和Tau2-Bench等智能体任务中,实现了显著跃升。

腾讯混元2.0正式发布:推理能力/效率业界领先

基于RLVR+RLHF双阶段的强化学习策略,HY 2.0在输出内容的“质感”上取得显著进步。在文本创作、前端开发、指令遵循等实用场景中展现出差异化优势。

在文学创作方面,HY 2.0有效减少了“AI味”,能够敏锐捕捉指令中潜在的情感需求,输出观点深刻、逻辑严密的文章。

Tencent HY 2.0模型拥有扎实的代码能力和一定的“视觉审美”素养。在生成Web小游戏时,不仅能够顺利运行复杂的JavaScript逻辑,还能输出具有在线美学水准的CSS布局与动画效果。

腾讯混元2.0正式发布:推理能力/效率业界领先

来源:https://m.mydrivers.com/newsview/1090905.html
上一篇欧盟重罚12亿欧元,X平台陷困境,马斯克难展笑颜 下一篇雷军转发!小米汽车工厂光伏年发电1640万度
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿