混元Turbo,这次来了个狠角色。
9月5日,腾讯正式亮出了新一代大模型“混元Turbo”。先说几个核心数据:训练效率提升108%,推理效率提升100%,推理成本直接砍掉一半,解码速度也提升了20%。效果已经能在多个基准测试上对标GPT-4o了,第三方测评直接给到了国内第一。

在腾讯全球数字生态大会上,腾讯公司副总裁、腾讯云总裁邱跃鹏透露,混元Turbo现在已经在腾讯云上线了,关键一点——输入和输出的价格只有前代模型的一半。也就是说,企业和开发者可以直接在云上接入,性价比相当突出。
目前,腾讯混元在云上提供的是多尺寸模型服务,从Turbo、Pro、Standard到Lite,各个版本都有;专属模型方面也开放了代码生成、角色扮演、Function call等功能。企业如果想深度定制,也可以通过腾讯云TI平台对混元进行精调。

(图:公开benchmark测评腾讯混元Turbo与国内外大模型对比)
再说说技术路线。腾讯混元是从去年开始在国内率先采用MoE结构的,这一次的升级关键是自研的万亿级层间异构MoE——不同层用不同数量的专家、不同的激活参数量,再配合训练数据的优化,最终让新一代模型在效果和性能上都实现了大幅飞跃。
从业界公认的benchmark成绩来看,混元Turbo在国内属于绝对领先,效果已经接近GPT-4o和Claude 3.5。作为新一代旗舰模型,它的提升覆盖了语言理解、文本创作、数学、代码等多个领域。跟前代相比,复杂数学解决能力提升了38%,代码能力提升了32%。

(图:公开benchmark测评腾讯混元Turbo与国内外大模型对比)
9月2日,中文大模型测评基准SuperCLUE发布了最新一期报告,混元Turbo拿下国内第一。不光是总分第一,理科、文科成绩也都是第一。更值得注意的是,在围绕复杂任务和高阶推理的Hard任务上,混元Turbo拿到74.33分——是目前国内唯一超过70分的大模型,与ChatGPT-4o的差距其实已经很小了。
作为腾讯全链路自研的成果,混元从2023年9月亮相以来,已经积累了从底层算力到机器学习平台再到上层应用的完整技术栈。这种技术实力也得到了业界的认可——在去年中国电子学会的科学技术奖评选中,腾讯混元的《面向大规模数据的Angel机器学习平台关键技术及应用》拿到科技进步一等奖。
模型能力再好,关键是落地。目前腾讯内部已经有近700个业务和场景接入了混元大模型,包括腾讯元宝、QQ、微信读书、腾讯新闻、腾讯客服等。此前,腾讯旗下的协作SaaS产品也已经全面接入混元,让大模型在实际业务中真正创造价值。
