超级应用,到底什么时候才能出现?这恐怕是过去一年AI圈里,最让人焦虑的一个问题了。
大家总爱拿AI和当年的PC互联网、移动互联网比——那会儿,互联网出现没几年,超级应用就冒出来了。但这么比,其实不太公平。人工智能是工业革命级别的技术浪潮,真要找参照物,得看蒸汽机和电力。
1776年,第一台有实用价值的蒸汽机诞生,成了万能动力源,把人类拽进了“蒸汽时代”。可直到1800年代后,蒸汽机才大规模地用在铁路、航运上,进而渗透到各行各业。至于热力学第二定律,那更是差不多100年后的事了。电力也一样,电的发明掀起了第二次工业革命的精彩处,但电厂、电灯、流水线——这些新业态,哪一个不是经历了几十年才逐步演化出来的?
所以,人工智能时代的超级应用一定会来,只是时机还没到。过去一年,整个行业都在追“超级应用”,说实话,有点急了。
大模型是项基础技术,本身不直接产生实用价值。真正有价值的,是那些基于它构建出来的应用。对AI应用开发者和创业者来说,与其死磕AGI或“超级应用”,不如小步快跑、持续迭代,先做出“超级有用”的应用。
最近,在2024百度世界大会上,百度公布了文心大模型的最新数据:半年前API日调用量是2亿,现在超过了15亿,半年涨了7.5倍。这既是中国AI应用爆发的一个缩影,也说明大模型开始对应用产生实际价值了。
01 大模型基本消除幻觉
很长一段时间里,国内大模型想卖给其他行业,挺难的。有业内人士跟媒体吐槽过:“无论是智能硬件还是AI智能体,需求确实很强烈,但真正买单的没几个——生成效果太差,到处都是幻觉。” 再加上多模态能力还在爬坡,生成式AI最初的体验,更像一个简单的对话机器人。用户尝鲜完,留存率很低。
但过去一年,大模型最大的变化,就是基本消除了“幻觉”,变得可用了。要知道,大模型本质上是个概率模型,生成文字时,它会自动预测“下一个最可能出现的词”。这就导致它时常“一本正经地胡说八道”。
要想基于大模型开发应用,必须跨过这道坎。产业界很快就找到了解法,就是检索增强技术(RAG)——用外部知识库“喂”给模型,让它“照本宣科”而不是自由发挥。这项技术基本消除了文字生成上的幻觉,让大模型有了实用价值。多模态技术想落地,也得搞定准确性和可控性。
百度这次发布的iRAG——检索增强文生图技术,就是冲着这个来的。为了搞出一张Logo不变形、颜色不失真的企业宣传图,百度年初就开始折腾多模态的“幻觉”问题目标。现在看来,在影视、漫画、海报制作这些领域,iRAG完全可以落地了。
举个例子:汽车行业极其依赖市场推广,经常需要高质量摄影图。传统模式下,一张完美图片背后的人力、财力、物力成本都不低。而利用iRAG技术,车企能以极低的成本、极短的时间,拿到一张视觉表现上相当不错的图片——甚至可能更惊艳。
今天,生成式AI的技术路线大致分两派。一派是AGI派,梦想一步到位,靠基础大模型在若干年内实现通用人工智能;另一派是应用驱动派,从需求出发,用应用反馈来反推模型创新。
百度选了后者,在持续研发底层大模型的同时,更强调应用驱动。iRAG就是个典型——因为应用需要生成精准的图像(比如公司Logo不能变形),倒逼出了这项技术。经过近一年努力,它已经能用起来了,而应用的进展,反过来也在滋养模型本身的研发。
02 智能体,AI应用最大的趋势
经历了两年,生成式AI正处在一个换挡的关键期。最近,国内有两家AI创业公司暂停了大模型的预训练;对Scaling Law是否已经“投资收益递减”的争论,也愈演愈烈。
实际上,全球巨头们也在行动。OpenAI、微软、谷歌先后下场布局智能体。9月中旬,OpenAI研究员Noam Brown宣布正为新的多智能体研究团队招人。微软CEO纳德拉亲自公布了10个商业智能体,组团出道。几乎同时,谷歌也被曝出“意外”泄露了人工智能Jarvis——一个能自主检索信息的智能体。
而国内,百度无疑是这场浪潮的引领者。在2024百度世界大会上,智能体成了绝对主角。百度重点介绍了四类智能体:公司类、角色类、工具类、行业类。
举个工具类的例子——“自由画布”。这背后是百度文库多年积累的数据,叠加上生成式AI技术,实现了一次创作的飞跃。以前人们用文库,主要是找现成文档。但AI出现后,百度发现,用户最根本的需求不是找文档,而是创作适合自己的内容。
顺着这个思路,百度重构了文库,又发布了独立产品“橙篇”,能一键生成公文。而“自由画布”的逻辑更进了一步:让人们能更方便地“传递创意”——说得通俗点,就是如何把脑子里的想法,更准确、更顺畅地表达出来。
百度创始人李彦宏的判断是:“智能体是AI应用的最主流形态,即将迎来爆发点。” 他把做智能体类比成PC时代做网站、移动时代做自媒体账号。区别在于,智能体更像人、更智能,像你的销售、客服和助理。它可能会成为AI原生时代,内容、信息和服务的新载体。
OpenAI的CEO Sam Altman上个月在Reddit上也表达了类似观点:“我们将拥有越来越好的模型,但下一个重大突破将是AI袋里。” 英伟达的黄仁勋更是放话,未来英伟达将有1亿个智能体。
智能体的特点是:门槛足够低,天花板足够高。它可以成长为非常强大的公司——就像谷歌、Meta,当年也是大学生创业做出来的网站。某种程度上说,现在不做智能体,就像二十年前没做网站,十年前没做App。
03 中国AI扛旗者的技术信仰
很少有中国公司像百度这样,在全球人工智能发展的人才节点、资源节点和技术节点上,扮演过这么多关键角色。这背后,离不开创始人对AI的信仰。李彦宏有句话在行业内很出名:“有1块钱,我会投进技术里;有1个亿,我会投进技术里;有100个亿,我还是会投进技术里。”

百度做AI,最早可以追溯到十几年前的一场拍卖会。2012年12月,在美国内华达州太浩湖边的一个滑雪场脚下,一场秘密拍卖悄然进行。被竞拍的资产是“三个人”——“AI教*父”杰弗里·辛顿和他的两名学生。
百度、谷歌、微软、DeepMind的代表们轮番举牌,报价飙到4400万美元时,场上只剩百度和谷歌。百度愿意不设上限,但最终仍然没拍下来。
这件事也让李彦宏下定决心:一定要自己做深度学习、自动驾驶。随后,他建立了百度美国研究所,开始大力招徕全球人才,包括吴恩达、Dario Amodei等顶级专家陆续加入。
此后十年,百度开启了人工智能技术的全栈自研:从芯片到框架,从模型到应用,逐一击破。先后发布了自动驾驶开放平台Apollo,开源了深度学习框架飞桨(PaddlePaddle),甚至在2019年就拿出了文心大模型1.0版本。
但在ChatGPT诞生之前,AI应用一直没找到引爆点,业内总觉得这是“烧钱无底洞”,落地遥遥无期。
坚持总会有回报。转折点在2023年3月——基于文心大模型3.0,百度在全球第一个发布了对标ChatGPT的产品“文心一言”。至此,十年默默投入终于有了回报。
2023年下半年起,在保证基础模型持续领先的同时,百度意识到大模型同质化竞争已导致严重的资源浪费。李彦宏多次公开呼吁:“要卷应用,不要卷模型。” 在公司内部,他要求把大模型用起来,把全部产品重构一遍。2023年世界大会,百度展示了搜索、地图、网盘等核心应用的重构成果;而2024年,大会主题直接定为《应用来了》。外界终于看到了大模型在智能体、产业应用等领域创造的巨大价值。
回顾过去不难发现,百度在全球AI发展的每一个重要节点,都做了正确的选择。而李彦宏更长远的目标是:让AI真正被每一个普通人所使用,让每个人都具备程序员的能力。
04 人人都具备程序员的能力
这次百度世界大会上,李彦宏还发布了一样One More Thing——秒哒。一个能让玩家无代码编程、多智能体协作、多工具调用的软件。
秒哒和之前所有辅助代码生成工具最大的不同在于:它不需要用户能看懂代码。以往的AI工具更多是强化金字塔顶端的精英能力——比如在硅谷,辅助代码生成很吃香,因为工程师稀缺,时薪贵,工具能帮他们提效,让塔尖上的人更强大。
但人工智能本应让每个人受益,而不只是少数人的专利。
随着基础模型和智能体能力的提升,百度把这些技术整合到一起,让真正的普通人——哪怕一行代码都看不懂——也能具备程序员的能力。
试想一下:当几亿、十几亿人都拥有这种能力时,对应的是怎样一个巨大的市场?尤其是创造力的爆发,远非辅助代码生成工具能比。百度的愿景是让每一个普通人,都能拥有金字塔塔尖那些人的能力——这个意义,无疑更加深远。
李彦宏在大会上的总结很值得回味:“百度不是要推出一个‘超级应用’,而是要不断地帮助更多人、更多企业,打造出数百万个‘超级有用’的应用。”
在AI时代,越来越多人可以通过自然语言编程,把天马行空的想法付诸实现,创造出前所未有的产品和服务。这,才是真正的技术普惠。
