在AI领域,中美两国的技术落地路径正呈现出截然不同的走向。正如AI泰斗Michael I.Jordan所言:“人工智能的商业模式,是要创造一个市场,而非一个算法。”这个观点,放到当下的全球AI格局里,格外耐人寻味。
中美占据着全球AI市场的主导地位,但双方选择的路却大相径庭:一方执着于前沿技术探索,另一方发力应用优化和商业化落地。这两个方向,已经很难直接排个先后、论个优劣。不过,说到应用和落地,中国显然有自己的鲜明主张,甚至可以说,正在完成超越。谷歌中国区前负责人李开复就曾预测,到明年年初,中国的应用普及速度将远远超过美国。
只是,这一路走来的代价,有多少人真正了解?
国内AI大模型:从“雨后春笋”到“销声匿迹”
2022年11月,ChatGPT横空出世,国内市场瞬间被点燃。2023年初,首批大模型创业者涌现,掀起一波创业小精彩处。同年6月,百模大战正式打响。不到三个月,中国就诞生了超200款大模型。可到了23年12月,还在持续更新的模型迅速缩水到156款。再到今年5月,仅剩下19款。很多大模型就像昙花一现,来得快去得也快。

图源来自pixabay图库
被业界称为“六小虎”的智谱AI、零一万物、百川智能、MiniMax、月之暗面和阶跃星辰,也开始调整方向。有的暂停了预训练模型研发,有的退出C端市场转向B端,还有的进行了人员缩减。
这背后的信号很清晰:靠融资驱动的商业模式已经行不通了。面对全球AI大模型的激烈竞争,中国AI产业需要冷静下来,认真思考破局之道。当务之急就是回归商业本质,不再沉迷于技术参数的军备竞赛,而是把目光投向市场需求导向的研发与应用创新。
与此同时,国内AI大模型开始进一步分化。从模态上看,有自然语言处理(NLP)大模型、视觉(CV)大模型、多模态大模型等;从部署方式上,则分为云侧大模型和端侧大模型。云侧大模型又分为通用大模型和行业大模型。通用大模型适用性广泛,像文心一言、通义千问、讯飞火星这些;行业大模型则针对金融、医疗、政务等特定领域进行专精训练。
这样一来,国内AI大模型的应用路线日渐清晰:基础大模型→行业大模型→终端应用。
而百模大战降温、应用路线清晰之后,价格战也随之而来。一个典型例子:今年5月21日,百度宣布两款相对轻量的大模型——Speed和Lite免费开放,但最强大的大模型继续收费。低价甚至免费能拉拢用户,但也让企业背负不小的生存压力,毕竟这违背了最基本的商业逻辑。当然,如果技术和产品的竞争力足够强,根本不需要主动参与价格战。
价格战开启虽然不是什么好兆头,但从侧面也倒逼AI技术创新进入更快的加速期。
中美多维差异背后,技术落地路径已然不同
全球人工智能持续竞速,中美谁强谁弱一直是热门话题。目前全球发布的大模型总数中,中美合计占约80%,处于绝对的主导地位。
具体来看,中美双方在技术背景、文化属性、市场环境、人才培养、算力、数据等多个维度上都存在差异。
技术背景方面,美国科技发展注重“技术优先”和“知识密度优先”,行业和企业重视基础创新,对新事物鼓励且促进。整个生态分工明确,形成了一套完整且善于创新的链条,共同推进统一目标。
国内则更为多样化,试图借助更多的应用爆发和市场多样性来加速发展。同时,对安全、可控、持续性和自主性等维度的要求更高。
技术背景和市场环境的不同,导致商业模式上也差异明显。美国AI公司多用软件模式,能快速起量;国内公司更擅长性能调优,多采用个性化定制的服务方式。

图源来自知乎@hayley
人才培养方面,上图展示的是国内AI人才的比例分布。国内本科比例较高,但硕士和博士比例逐渐下降。原因很简单,大量人才选择出国深造和工作。数据显示,美国39.52%的AI人才实际上来自中国。高端人才的流失,让国内在基础研发上阻力不小。
算力方面,国内在先进制程芯片和计算密度上不占优势,目前仍落后于美国。但基于政策支持和资本的热情,长远来看,算力难题并非无解。
算力之外,数据是另一个制约因素。一方面大量数据私有化,获取成本高;另一方面,处理数据的成本居高不下,企业之间对自己的数据策略——包括数据配比、来源、加工等——高度保密。
最关键的一点:产业发展路径上,美国倾向于从底层限制开源生态的分发,试图通过限制开源来抑制产业创新。而国内则大力推动开源模型,以贴合垂直行业的应用落地。
话说回来,美国限制开源,对国内影响其实不大。虽然底层研发技术仍有差距,但GPT-3.5的出现标志着技术取得阶段性突破,而且因为开放使用,国内已经拿到了开源模型。技术革命的传播速度快于立法监管的速度,监管基本是失效的。
综合来看,多个维度的差异导致双方在技术落地路径上大相径庭。美国还待在从0到1技术探索的前沿阵地,而国内则更关注商业落地和贴合市场需求的应用优化。
想“超车”美国,还得看“应用线”
在国内企业转向美国的开源模式以求迎头赶上时,美方自己也陷入了尴尬境地。他们一直试图通过限制微芯片销售和遏制投资来减缓国内进步,但却无法阻止企业为了促进软件普及而公开发布。
美国在开源模型上“两头为难”,恰好给国内企业提供了“超车”的机会。
看看Sora和GPT-4这两个爆款。Sora在算法上突破并不大,惊艳的效果更多靠巨量算力堆砌,解决了帧间时序一致性问题,但视频生成成本短时间内降不下来。GPT-4虽然强大,成本高企同样是绕不开的现实难题。这也导致企业在实际应用中,往往选择性价比更高的开源模型或更小的商用模型。
而且,一旦最好的开源技术来自中国,美国开发者最终会从主动变为被动,甚至不得不在中国技术的基础上构建底层系统。
追求技术领先的美国,在商业化落地的“临门一脚”上,已经被成本绊住了。未来还有可能因此陷入僵局。
形成鲜明对比的是,中国的科技投资者推动AI时,追求尽快转亏为盈。杜克大学陈怡然教授说过,这意味着资金正流向易于执行的应用,而不是更具抱负的基础研究目标。同时,中国对AI的投资中,多达50%投向了监控所需的计算机视觉技术,而不是为生成式AI建立基础模型。
针对本地市场需求,百度文心一言、阿里通义千问等国内大模型,在应对普遍应用场景时已经展现出了实用性和高效性。当然,在处理极其复杂或特定需求时,与全球顶尖模型相比还有差距。但就当前多数生产工具的实际需求来说,无论是开源模型还是国内商业化方案,都能提供基本且相对令人满意的服务。
尤为值得一提的是,随着各类应用场景不断拓展和深化,国内大模型的应用落地进程正显著加速,焕发出蓬勃的生命力。
这么看下来,中国虽然暂时无法通过现有大模型实现技术上的全面超越,但美国也无法进行有效封锁。开源技术既是中国AI发展如此之快的关键,也将是中国取得领先地位的机遇。
技术路径上的差异已经让美国陷入阶段性停滞。国内应该继续专注应用开发,缩小商业化价值上的差距。长期来看,如果美国真限制开源,那将是技术衰落的开始,同时也是中国正式崛起的开始。
战局最终如何演化,时间会给出答案。
