在2025百度世界大会上,百度正式推出其最新力作——原生全模态大模型文心大模型5.0。该模型凭借高达2.4万亿的参数规模及原生全模态统一建模技术,成为业界瞩目的焦点。它不仅能够深度理解文本、图像、音频和视频等多种信息形态,还能实现跨模态内容的自主生成,为用户带来全方位的智能体验。

文心大模型5.0在基础能力上实现全面突破,尤其在多模态理解、指令遵循、创意写作、事实准确性及智能体规划与工具应用方面表现卓越。经过40余项权威基准的综合评测,该模型在语言与多模态理解能力上与国际顶尖模型Gemini-2.5-Pro、GPT-5-High等不相上下,图像与视频生成能力更是媲美垂直领域的专业模型,展现出全球领先的技术实力。
百度创始人李彦宏在大会上强调,大模型技术正处于快速迭代阶段,其智能水平正在不断突破极限。他指出,随着模型思考时间的延长和原生全模态技术的统一,大模型将具备自主学习和持续进化的能力,甚至能够实现真正的自主创新。李彦宏表示,智能本身是最大的应用场景,而技术迭代的速度则是构建竞争壁垒的关键。百度将持续投入研发资源,推动智能技术向更高层次迈进。
百度首席技术官王海峰进一步阐释了文心大模型5.0的技术特点。他介绍,与业界多数采用后期融合方式的多模态模型不同,文心5.0创新性地采用统一的自回归架构进行原生全模态建模,实现了理解与生成的一体化融合。这种技术路线从训练阶段就深度融合了语言、图像、视频、音频等多模态数据,使不同模态特征在统一架构下充分交互并协同优化,从而实现了真正的原生全模态统一理解与生成。

基于飞桨深度学习框架,文心大模型5.0采用超稀疏混合专家架构进行全模态训练,总参数规模超过2.4万亿,但激活参数比例低于3%。这一精妙设计在保持模型强大能力的同时,显著提升了推理效率。该模型还基于大规模工具环境合成长程任务轨迹数据,并采用基于思维链和行动链的端到端多轮强化学习训练,使得模型的智能体规划和工具调用能力得到质的飞跃。
目前,文心大模型5.0 Preview版本已同步上线文心App,用户可第一时间体验其强大功能。同时,开发者和企业用户也可通过百度千帆大模型平台调用文心大模型5.0的API服务,进一步拓展其应用场景的深度与广度。
尤为值得一提的是,在11月8日公布的LMArena大模型竞技场最新排名中,文心模型ERNIE-5.0-Preview-1022在文本任务评测中位列全球第二、国内第一,尤其在创意写作和复杂问题理解方面表现突出,再次印证了百度在大模型领域的技术领先地位。
