模型能力的持续进化让应用开发者正面临一个有趣的悖论:一方面,更强的模型为场景落地打开了更多可能性;另一方面,应用的生命周期也可能被模型本身的迭代所终结。那么,什么样的AI应用才能真正站稳脚跟,不被技术浪潮冲走?
在2025年4月25日的百度Create大会上,李彦宏给出了一个相当直接的答案:只要找准场景、选对基础模型,再掌握一点调模型的方法,应用就不会被迭代淘汰。真正创造价值的,永远是应用本身。
顺着这个思路,李彦宏认为今年最令人兴奋的应用突破来自两个方向:数字人和Agent。
先说数字人,这其实是百度电商布局中的一个关键棋子。本次大会,百度推出了“高说服力数字人”。与普通虚拟形象相比,它最大的不同在于能够感知直播间氛围,并自主做出发红包、切换商品这类实时决策。
另一个重头戏是Agent。一年前,李彦宏曾把AI Coding视为最看好的方向,百度也确实做了比较完整的布局——面向专业工程师有Comate,面向普通用户有“秒哒”。而到了通用场景,面对Manus邀请码一码难求的局面,百度显然不想掉队。趁Manus开始收费的当口,百度在移动端推出了一款Agent应用,名叫“心响”。
当然,模型层绕不开一个对手:DeepSeek。李彦宏在大会上的表态毫不拐弯:DeepSeek不是万能的。它不支持多模态理解,有幻觉,关键是——慢,且贵。于是,百度本次发布的文心大模型4.5 Turbo和X1 Turbo,几乎就是对着这些短板在打。两款新模型主打多模态、强推理、低成本。价格方面,4.5 Turbo的成本是DeepSeek V3的40%,X1 Turbo更是只有DeepSeek-R1的25%。
最后,百度的野心不止于单点产品,而是整个AI应用生态。一方面,百度搜索开放了平台,邀请开发者围绕搜索生态做应用;另一方面,百度也开始支持Anthropic推出的MCP协议——这意味着模型、工具、数据库之间的互动将更加畅通。
百度的“App版Manus”终于来了
2025年3月,Manus一度成为Agent赛道的绝对焦点。一个月后的4月22日,百度在大会前三天悄悄把一款独立Agent应用上架到了安卓商店。这款应用叫“心响”,从形式上看,可以理解为Manus的移动端版本。
用户只需输入自己的需求,Agent就会自动拆解任务、执行并交付结果。

“心响”制作绘本。来源:百度
据百度智能体业务首席架构师、心响App负责人黄际洲介绍,“心响”的实现逻辑是百度自己提出的Agent Use协议。这与Anthropic的MCP有所不同:MCP主要解决工具的调用,而“心响”更侧重对智能体的调度。主智能体会根据用户任务,灵活调度第三方和百度自有的各类智能体去完成工作。
做这样的产品,最大的难点在哪?心响产品经理黎宇昕认为,是重建用户的心智。
他说,百度多年来靠搜索建立的用户心智是“即时交付”。AI应用只要稍微有点延迟,用户就会觉得不好用。很多Agent产品之所以交付质量差,就是因为太依赖缓存等提速手段,反而牺牲了效果。而“心响”要做的是“托管心智”——就像Manus的任务可视面板一样,“心响”在任务执行过程中也采用了分析流的形式,把每一步的思考、执行、进度都展示给用户,让用户知道“它在认真做事”。
目前,心响已经支持200多种类型的任务,覆盖工作、学习、生活的主要场景——试题讲解、旅游规划、相亲、问诊、法律咨询,全都有。黄际洲透露,未来计划扩展到10万种以上。PC端也在同步开发中。
会画画的推理模型,成本只有DeepSeek四分之一
百度本次发布的两款模型——文心4.5 Turbo和X1 Turbo,从性能到成本都瞄准了DeepSeek。李彦宏特别强调了一点:多模态理解能力。“纯文本模型的市场会越来越小,多模态的市场会越来越大。”这句话基本可以看作百度在模型路线上的战略表态。

文心4.5 Turbo性能测评。来源:百度

文心X1 Turbo性能测评。来源:百度
文心4.5 Turbo和X1 Turbo都支持图像和视频理解。举个例子,输入一张高糊的球赛照片,它能通过场边广告牌和球员动作,认出这是1986年墨西哥世界杯阿根廷对英格兰的决赛。这个能力,纯文本模型是做不到的。

文心4.5 Turbo的图像理解能力。
除了理解,两个模型也支持多模态生成。比如在X1 Turbo里输入“听说武汉有种东西叫‘蒜鸟’,请你把它画出来”,它会联网搜索相关信息,然后直接生成一张卡通形象的“蒜鸟”。
价格方面,文心4.5 Turbo的输入价格是每百万token 0.8元,输出3.2元,只有DeepSeek V3的40%;X1 Turbo输入1元,输出4元,是DeepSeek-R1的25%。
百度电商,甘做上游“卖水人”
AI重新点燃了百度对电商的热情。但百度的定位很清晰——不和淘宝、京东正面硬碰。百度副总裁、百度电商总经理平晓黎说,百度电商有两个角色:一是百度App服务闭环的一环,满足搜索用户的消费需求;二是用智能工具当上游“卖水人”。
数字人就是那桶“水”。本次发布的“高说服力数字人”,不仅更拟人、更便宜、风格更丰富,最重要的是能实时感知直播间气氛,并自主做互动。比如观看人数达到50万时自动发红包,或者根据用户提问随时切换PPT和素材。

“高说服力数字人”。来源:百度
这种实时互动能力背后是多智能体调度。据平晓黎介绍,数字人背后有多个角色智能体——主播专家、运营专家、场控专家等——根据直播间的实时热度、转化数据灵活调配。
月活近亿的文库,开始打模型组合拳
整合了百度网盘的文库交出了一份亮眼的答卷:付费用户数超过4000万,月活逼近9700万。在百度内部,文库一直是AI应用落地的尖子生。百度副总裁、百度文库兼百度网盘负责人王颖曾透露,文库是最早自研MoE(混合专家模型)架构的AI应用。
李彦宏认为,应用组合使用模型是普遍现象,但如何组合、如何调用,依然是门技术活。为此,百度文库和网盘推出了一套底层技术底座:沧舟OS。

沧舟OS。
这个底座主要分两层。第一层是Chatfile Plus,负责把不同模态、不同格式的内容“向量化”,也就是翻译成大模型能懂的语言。第二层是“三库+三器”——公域知识库、私域知识库、记忆库,加上编辑器、阅读器、播放器。这一整套系统可以按需被大模型灵活调用。
基于沧舟OS,百度网盘上线了一个新功能:AI笔记。很多用户在学习时有一个痛点——做笔记时和原始资料是割裂的。复习时想找回视频里的某个知识点,得翻半天。AI笔记的核心就是“时间溯源+多模态整理”。比如针对网盘里保存的视频课程,AI笔记能自动梳理逻辑结构,生成思维导图,而且导图中的每个知识点都带着时间戳,点击就能直接跳到视频的对应位置。

百度网盘的“AI笔记”功能。
MCP,百度也接上了“AI万能插座”
MCP是Anthropic推出的Agent协议。打个比方,就像秦始皇统一货币和度量衡一样,协议的本质是统一软件之间的开发标准。支持MCP的软件之间可以灵活适配、相互调用。不少金融公司已经用MCP让AI更好地理解金融数据的上下文。
支持MCP,正成为各厂商抢建生态的一场“暗战”。阿里云“百炼”、腾讯云大模型知识引擎都已经支持MCP协议。百度自然不能落后。
李彦宏用了一个很形象的比喻:MCP就像给AI装上一个万能插座,能大幅提高不同软件之间的适配、开发和维护效率。对于需要自由调用工具的Agent来说,MCP尤为重要——这意味着Agent可以随便调用支持MCP的第三方工具。
目前,百度智能云“千帆”已经兼容了MCP,百度搜索也建立了MCP Server索引平台。文心快码、百度电商、地图、网盘、文库等应用,也都通过MCP Server的方式对外提供了能力。
