2025年百度世界大会上,百度正式发布了新一代原生全模态大模型——文心大模型5.0。这款模型参数量高达2.4万亿,采用独创的原生全模态统一建模技术,能够同时理解并创作文本、图像、音频、视频等多种形式内容,实现了跨模态认知与生成能力的重大突破。
据官方介绍,文心大模型5.0在基础能力上实现了全方位进化。无论是在多模态理解、指令遵循、创意写作,还是在事实核查、智能体规划与工具调用等维度,该模型均展现出卓越性能。在四十余项国际权威基准测试中,其语言理解与多模态认知能力已达到Gemini-2.5-Pro、GPT-5-High等顶尖模型水准,图像与视频生成质量更是媲美垂直领域专业模型,整体实力跻身全球第一梯队。
百度首席技术官王海峰在大会现场深入解读了技术路线创新。他指出,与采用后期融合方案的传统多模态模型不同,文心5.0从训练阶段就通过统一的自回归架构实现原生全模态建模,将语言、视觉、听觉等多模态信息在向量空间进行深度融合。这种设计使得不同模态的特征在统一框架中相互增强,真正实现了"感知-认知-生成"一体化的智能演进。
在工程实现层面,文心5.0依托飞桨深度学习框架,采用超稀疏混合专家架构。尽管模型总参数量超过2.4万亿,但通过动态路由机制将激活参数量控制在3%以内,既保证了模型性能的强劲表现,又显著提升了推理效率。同时,该模型创新性地采用思维链与行动链相结合的强化学习策略,通过复杂任务轨迹合成与端到端训练,在智能体交互和工具调用等场景展现出更接近人类思考模式的推理能力。
百度创始人李彦宏在主题演讲中强调,大模型技术正经历着前所未有的加速迭代。他表示:"当前模型不仅显著扩展了思维跨度,更实现了真正的原生全模态统一。我们正在见证模型获得持续进化与自主创新的能力。人工智能本身已成为最具潜力的应用场景,而技术迭代速度将成为决定竞争力的关键因素。"百度承诺将持续投入资源,推动模型技术向更高智能水平发展。
在应用落地方面,文心大模型5.0+Preview版本已同步上线文心App,普通用户可直接体验其强大的多模态交互功能。同时,开发者可通过百度千帆大模型平台调用API服务,快速集成到各类应用场景中。值得关注的是,在11月8日最新发布的LMArena大模型竞技场排名中,文心模型ERNIE-5.0-Preview-1022在文本任务评测中斩获全球第二、中国第一的优异成绩,尤其在创意写作和复杂推理方面表现突出。
