最近,李彦宏在一次内部交流中聊到了外界对大模型的几个常见误解。这些看法涉及竞争格局、开源模型效率、智能体趋势等热点话题,信息量不小。从这次讲话可以明显感受到,他对行业的理解比外界想象的要更冷静、更务实。
核心判断是:大模型之间的差距不仅没有缩小,反而可能会越来越大。原因很简单——这个领域的天花板远比我们想象的高,现在离理想的成熟状态还差得远。所以模型必须持续快速迭代,几年、十几年如一日地投入,不断去满足用户需求、降低成本、提升效率。
一、榜单不代表大模型实力,模型之间的差距是多维的
很多人觉得“大模型能力已经没啥壁垒了”,李彦宏给出了相反的观点。每次新模型发布,都喜欢跟GPT-4o比,说自己的得分差不多甚至某些单项超了,但这并不代表跟最先进的模型之间没有差距。他解释说,很多模型为了证明自己,一发布就忙着去打榜,猜测试题、研究答题技巧。从榜单上看,分数确实很接近,但到了真实应用里,实力的差距一下子就体现出来了。

更关键的是,模型之间的差距是多维的。行业通常只关注理解、生成、逻辑、记忆这几个维度,但成本、推理速度这些同样重要。有些模型虽然效果还行,但成本高、推理慢,跟先进模型一比还是差得远。真正衡量大模型能力的标准,应该放到具体应用场景里——看它能不能满足用户需求、能不能产生实际价值增益。这才是最值得在乎的事。
二、开源模型效率不高,解决不了算力问题
关于开源,李彦宏延续了此前的观点,而且讲得更透彻。在大模型时代之前,大家都习惯了一件事:开源意味着免费、意味着成本低。比如开源Linux,因为你自己已经有电脑了,用Linux是免费的。但大模型时代完全不一样——大模型推理本身就很贵,开源模型也不会免费送你算力,你还得自己买设备、租GPU。结果算力利用率根本提不上去。

“效率上开源模型是不行的。”他明确表示。闭源模型——准确说应该叫商业模型——是无数用户分摊研发成本和推理资源,GPU的使用效率是最高的。百度的文心大模型3.5和4.0,GPU使用率都能达到90%以上。李彦宏分析,在教学科研这些场景里,开源模型确实有价值;但到了商业领域,当你追求效率、效果和最低成本时,开源模型就没有优势了。
三、智能体是大模型最重要的发展方向,但还不是业界共识
李彦宏还谈到了大模型应用的发展阶段。他认为最先出现的是Copilot,作用是对人进行辅助;接着是Agent智能体,具备一定自主性,能自己使用工具、反思、自我进化;再往后发展,就会变成AI Worker,能独立完成各方面的任务。这个脉络很清楚。
当前,智能体已经引起越来越多大模型公司和客户的关注。李彦宏判断,尽管很多人看好这个方向,但到今天为止,智能体还不是业界共识。像百度这样把智能体作为大模型最重要战略、最重要发展方向的公司,其实并不多。为什么这么强调智能体?因为它的门槛确实很低。很多人不知道怎么把大模型变成真正的应用,而智能体是一个非常直接、高效、简单的方式——在模型之上构建智能体相当方便。目前,每周都有上万个新的智能体在百度文心智能体平台上被创造出来,智能体的日均分发次数已经快速增长到800万次。
