在近日举行的百度2025世界大会上,一款备受瞩目的原生全模态大模型——文心大模型5.0正式亮相。凭借其卓越的性能和前沿的技术架构,这一全新模型迅速成为全场焦点,标志着百度在人工智能领域再次取得突破性进展。
文心大模型5.0的参数量高达2.4万亿,采用原生全模态统一建模技术,实现了对文本、图像、音频、视频等多类信息的全面支持。无论是信息输入还是输出环节,该模型都能高效流畅地处理,展现出强大的全模态理解与生成能力。在基础能力方面,文心5.0实现了全面升级,特别是在多模态理解、指令遵循、创意写作、事实性以及智能体规划与工具应用等维度表现尤为出色。模型在理解、逻辑、记忆和说服力等方面均达到了新的高度,为用户提供了更智能、高效的服务体验。
在权威基准的综合评测中,文心大模型5.0的成绩表现亮眼。其语言与多模态理解能力与国际顶尖模型Gemini-2.5-Pro、GPT-5-High等不相上下,图像与视频生成能力更是媲美垂直领域的专业模型,稳居全球领先地位。这一成果不仅验证了原生全模态大模型的巨大潜力,也为百度在人工智能领域的持续发展奠定了坚实基础。
百度创始人李彦宏在大会上表示,大模型技术正处于快速迭代阶段,其智能水平不断突破极限。他强调,智能本身是最大的应用场景,而技术迭代速度则是保持竞争优势的关键所在。百度将持续加大研发投入,开发更前沿的模型技术,不断推高行业天花板,为用户带来更智能、便捷的服务。
百度首席技术官王海峰进一步介绍了文心大模型5.0的技术特点。他指出,与业界多数多模态模型采用后期融合的方式不同,文心5.0创新性地采用统一的自回归架构进行原生全模态建模,实现了理解与生成的一体化。从训练伊始,该模型便融合了语言、图像、视频、音频等多模态数据,使得不同模态特征在统一架构下充分融合并协同优化,从而实现了真正的原生全模态统一理解与生成。
在技术实现层面,文心大模型5.0依托飞桨深度学习框架,采用超稀疏混合专家架构进行大规模全模态训练。其总参数量超过2.4万亿,但激活参数比例低于3%,在保持模型强大性能的同时显著提升了推理效率。该模型还基于大规模工具环境合成长程任务轨迹数据,并采用基于思维链和行动链的端到端多轮强化学习训练,显著提升了模型的智能体规划和工具调用能力。
为了让更多用户体验到文心大模型5.0的卓越性能,百度已同步上线了文心大模型5.0预览版本,用户可以直接在文心App中进行体验。同时,开发者和企业用户也可以通过百度千帆大模型平台,调用文心大模型5.0的API服务,进一步拓展其应用场景和商业价值。
值得一提的是,在最新发布的LMArena大模型竞技场排名中,文心模型ERNIE-5.0-Preview在文本任务评测中位列全球第二、国内第一。这一成绩充分展现了文心大模型在创意写作、复杂问题理解等方面的突出表现,也为百度在人工智能领域的国际竞争中赢得了更多话语权。
