游乐游手机版
首页/AI教程/文章详情

AI实际天花板远低于普遍预期

时间:2026-06-18 16:44
![](https: developer qcloudimg com http-sa ve yehe-7353521 89b189f0a801cf08cf09770e9d2d9f6d jpg) TL;DR “AI被短期高估、长期低估”这个广为流传的说法,实际上很大程度上是由资本叙事支撑起来的
![](https://developer.qcloudimg.com/http-sa ve/yehe-7353521/89b189f0a801cf08cf09770e9d2d9f6d.jpg)

AI 的天花板,比所有人说的都低

## TL;DR

“AI被短期高估、长期低估”这个广为流传的说法,实际上很大程度上是由资本叙事支撑起来的。当前以LLM(大语言模型)为代表的人工智能,其应用边界被严格限制在符号空间(即虚拟的数字世界)内。更关键的是,软件开发领域的生产效率根本无法被真正量化。所谓“长期低估”要成为现实,必须依赖一种与现有统计学习范式截然不同的全新智能范式来突破现状。

## AI的真实边界:从资本叙事到认知与现实的根本限制

### 一、起点:一个被金融逻辑驱动的科技话题

“AI短期被高估,长期被低估”——这是Amara定律在人工智能领域的经典解读,听起来无可辩驳。但仔细思考会发现,它巧妙地将两种性质完全不同的叙事混为一谈:

**技术叙事**:任何新兴技术的采用曲线都非线性,初期市场期望固然过高,但成熟后的实际价值终将超越最初的想象。

**资本叙事**:资本的逐利天性是永远投向未来,其买入的是预期。资金涌入一个行业,必然催生估值泡沫。在卖方市场环境下,持仓者具有结构性动机去美化投资标的——这并非刻意策划,而是市场机制的本能产物。

正是这两条叙事的叠加,塑造了当下人工智能市场的面貌。但它们必须被分开审视,否则,论点的后半句“长期低估”会被前半句的逻辑悄然托举起来,而这两者其实是完全独立的赌注。

技术叙事的那一半并非虚假。历史上,蒸汽机、电气化、互联网等突破性技术确实都曾被低估——它们无一例外地经历了“泡沫破裂→真实扩散→超越早期预期”的路径。Amara定律在历史上之所以成立,是因为这些技术最终都突破了初期狭隘的应用边界,渗透到了更广阔的现实世界。

关键问题在于:这种渗透是有严格条件的。电气化能够广泛扩散,是因为物理世界本身欢迎电力——它降低了能量传输的摩擦,却几乎没有引入新的不确定性。而LLM的扩散恰恰相反:它越是深入现实世界,其行为的不确定性非但没有减少,反而成倍增加。

因此,技术叙事后半句“长期低估”若要成立,其前提必须是该技术具备广泛扩散的能力。这个前提在当前LLM范式下,需要被单独证明,而不能简单地借用其他历史规律的惯性。

### 二、卖的不是产品,而是“未来的胜率”

人工智能投资的ROI至今缺乏令人信服的定论。数千亿美元已经投入市场,如果其收益是真实且可量化的,那么相关的账目应该早已算得明明白白。这个巨大的落差本身就是一个强烈的信号。

一个更诚实的说法是:**如今相当大一部分AI投资,本质上是一种“期权”,而非对当下效率的投资**——投资者押注的是“如果通用人工智能有一天成立,那么率先入局者将获得入场券”。期权可以在很长一段时间内看不到传统意义上的回报,这本身无可厚非。

真正的问题在于,**卖方团队是把这种高风险期权包装成确定性的效率提升在销售**。这与2008年次贷危机的结构性成因有相似之处:

2008年次贷危机的操作是——将“借款人可能还款”这一概率事件,通过复杂的金融工具层层包装转手,最终卖给不了解底层风险的人,并且有权威专业机构为这种包装背书。这不是直接捏造收益,而是将巨大的不确定性重新贴上了“安全资产”的标签。

人工智能的叙事所做的其实是同一件事——将“AI可能彻底改造生产力”这个概率,通过媒体、分析师、意见领袖等层层包装输出,最终被市场接受为一场确定性的效率革命。最后买单的,是以确定性预期进行决策的企业(大规模订阅)、政府(算力补贴)以及普通投资者。

### 三、泡沫破裂的真实形态:钝刀割肉,而非断头台式崩塌

但人工智能的泡沫并不会像2008年金融危机那样,拥有一个干净利落的引爆点。

次贷危机的底层“胜率”**其实是可以用数据算清的**——借款人的收入、房价的历史数据都是存在的,只是被故意隐藏或扭曲。一旦房价下跌,真实的还款能力暴露,整个金融链条瞬间断裂。它有一个清晰的触发点。

而人工智能的“胜率”是**根本上不可知的**——它不是被隐藏,而是真的无人知晓。通用人工智能是否会到来?Scaling Law(规模定律)还能走多远?这些连模型开发者自己都无法确定。没有可以被戳破的底层数据,就没有明确的崩溃时刻。

因此,人工智能泡沫的结局更可能是一场**长期的钝刀割肉**:投资回报率持续未能兑现,市场预期一点点被修正,资本在无声中悄悄撤退,叙事重心也从“效率革命”逐渐演变为“在特定场景下有实用价值”。不会有瞬间崩塌的时刻,只有叙事的缓慢失血与枯萎。

### 四、投资回报率为何难以实现:应用边界的真实天花板

人工智能对软件开发领域的影响是公认最大的——代码是纯粹的符号空间,结果可以快速验证,AI在这里的效用是真实的。但软件工程的成本结构决定了这种效用的天花板:

软件工程真正的成本中心在于:需求澄清与多方对齐、跨角色沟通摩擦(产品/研发/测试/运维)、决策等待时间、返工成本和上下文切换。代码编写本身,只是这个庞大成本结构中占比较小的一个环节。AI虽然极大地压缩了代码编写这一环,但其余的核心问题几乎没有触及。甚至可能产生反效果——代码生成速度变快了,但需求不清晰的问题反而被放大:你只是在更快地构建出一个错误的东西。

将视野扩展到更广泛的行业:**越是靠近物理世界,AI的效用感就越低。** 这背后存在三个根本性的约束:

**长尾问题是无底洞。** 自动驾驶是最清晰的案例——面对99%的常规场景,AI处理得非常好,但剩余那1%的边缘情况几乎是无穷无尽的。软件里的bug可以快速发布补丁修复,而物理世界中的边缘情况一旦出错,代价是巨大的。

**错误代价完全不对称。** 在数字领域,错误的成本极低,可以无限迭代和重试。但在物理领域,错误的代价是设备损坏、人员伤亡、生产中断。人工智能概率性的本质,与物理世界对确定性安全的硬性要求天然冲突。

**数据的性质截然不同。** 人工智能原生擅长的领域是token(字符)——这些是离散的、可以无限复制、采集成本几乎为零的数字符号。而物理世界的数据是连续的、采集成本高昂、充满各种噪声,仿真环境与现实之间永远存在不可消除的差距。

### 五、天花板的认识论根源:统计学习的致命短板

这三个约束指向了一个更深层的问题——这不只是工程挑战,而是**当前LLM范式的根本性局限**。

LLM基于“预测下一个token”的机制,本质是从有限的历史数据中提取统计规律。而物理世界的长尾现象,本质上是**小概率但真实存在的事件空间是无限且开放的**。用有限的统计规律去覆盖无限的可能性,必然存在永久性的缺口。这个缺口不会随着模型变得更大而消失,它只会缩小,但永远不会归零。

采用不同的架构(如世界模型、神经符号系统、强化学习)或许能够缓解,但在统计学习这条路径上,这个根本缺陷是无法逃脱的——因为任何从历史数据中学习的系统,都面临同一个约束:训练数据分布之外的现实世界永远存在。物理世界永远不会停止产生新的边缘情况。

由此可以得出结论:**在当前的主流范式下,LLM的应用边界被牢牢锁定在符号空间之内。** 语言处理、代码生成、图像创作、逻辑推理——这是LLM的天然栖息地,其效用真实可信。然而,一旦需要跨越符号世界到物理现实的接口,其效用便开始显著衰减。

这直接动摇了“长期低估”这一命题的根基。Amara定律隐含的前提是:技术最终会扩散到更广阔的现实领域,因此长期价值会超出预期。但如果这个扩散过程在LLM范式下同时存在物理和认识论层面的双重硬性边界,那么其长期的天花板可能远比人们普遍理解的要低得多。

### 六、软件工程的生产率悖论是一个伪命题

通常用来解释AI投资回报率迟迟不能兑现的理由是“生产率悖论”——技术采用需要时间,组织变革需要更长时间,等等。

但这一解释在软件工程领域根本不成立,因为**这个悖论赖以存在的前提条件根本不存在**。

“生产率悖论”最初来自经济学家的观察:IT投资大幅增加,但宏观层面的生产率数据却没有相应增长。这个悖论之所以能够成立,是因为制造业、服务业等领域的产出有可测量的基准:如产量、销售额、交付时间等。

软件工程自始至终都缺乏这样的基准。代码行数根本是反指标。迭代点数是团队内部自行定义的。功能交付速度与最终用户价值之间没有稳定、可量化的关系。你无法定义“一个软件工程师的标准产出”到底是什么。

**“软件工程的生产率悖论”是一个被错误借用的类比。** 它的作用不是解释客观现象,而是为投资回报率无法显现体面地提供“需要时间”的等待理由。“悖论”这个词本身就成了一种叙事工具——在一个本来就无法测量产出的行业里,它变成了一张无限期的空白支票:效果是存在的,只是暂时看不见,再等等就好。

### 七、撞墙的真实形态:并非技术失败,而是认知失败

软件工程是LLM影响最大、也最容易验证其效果的领域。如果连这里的投资回报率都无法被证明——不是“不存在”,而是**永远无法被真正证明**——那么整个论点的逻辑链条就彻底闭合了。

这并非技术的失败,而是**认识论的失败**。

技术失败通常伴随着一个明确的崩溃时刻,之后业界可以总结经验、重建叙事。而认识论失败的结局,是叙事在无声中慢慢耗尽:CFO询问投资回报率,没有人能给出答案;项目续约时,没有团队能拿出一份像样的效益报告;预算逐年被压缩,不是因为证明了AI无效,而是因为从未证明过有效。

这种缓慢的“失血”远比突然的硬崩溃更难处理,也更难被外界识别。

卖方从来不是不知道这堵墙的存在。他们只是在这堵墙被大众普遍看见之前,已经完成了出货。

### 结语:这不是Amara定律的轮回,而是一次价值重估

整理下来,原始的命题需要被修正:

**“短期被高估”——成立,逻辑链完整。**

**“长期被低估”——成立的条件极为苛刻**,它需要一种在根本上不同于当前统计学习范式的新智能。不是更大的模型,而是性质完全不同的智能形态。在那个新范式到来之前:

> AI在短期内确实被高估;在新范式出现之前,其渗透现实世界的能力被系统性高估,而在其擅长的符号领域则趋向合理的价值定价。

这不是泡沫破裂后价值回归的经典叙事,而是一次有明确边界的价值重估过程——边界在哪里,完全取决于下一个真正突破性的智能范式何时到来。

来源:https://cloud.tencent.com.cn/developer/article/2691159
上一篇Agent从生成工具到协作智能体的进阶之路 下一篇团队AI经验资产化管理:从Prompt到Memory
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
RAG四标融合企业知识资产体系四库协同GEO优化实践
AI教程 · 2026-07-01

RAG四标融合企业知识资产体系四库协同GEO优化实践

生成式AI正在彻底改写信息检索的底层逻辑。传统SEO依赖关键词堆砌和外链建设的策略,在大模型的内容采信规则下已经基本失效。取而代之的,是生成式引擎优化(GEO)。它不再关注外链数量,而是重点衡量你的知识是否结构化、证据链是否坚实、信源是否可靠——这些维度才是RAG(检索增强生成)架构真正看重的核心指

一个普通上班人分享WorkBuddy使用心得与真实体验
AI教程 · 2026-07-01

一个普通上班人分享WorkBuddy使用心得与真实体验

前言 最近我开始使用WorkBuddy——这是腾讯推出的一款AI办公工作台。差不多用了一周时间,趁印象还新鲜,把真实的使用感受记录下来,给还在犹豫的朋友做个参考。不吹不黑,只说实际体验。 初印象:不只是聊天机器人 之前用过不少AI工具,大多数就是个对话框,你问它答,答完就结束了。WorkBuddy不

AI幻觉变真功能实战教程:App Inventor 2视频录制拓展一周开发实录
AI教程 · 2026-07-01

AI幻觉变真功能实战教程:App Inventor 2视频录制拓展一周开发实录

先讲一个颇具戏剧性的开端。 这件事的开端颇显荒诞——有用户前来咨询,称AI Pro版的介绍中提到我们有一款“视频录制拓展”。团队全体成员都感到困惑,翻遍产品列表,发现根本不存在该组件。AI那种“一本正经胡说八道”的能力,这次确实让我们陷入尴尬。 按常理,此事到此便可结束——一句“抱歉,暂时没有这个拓

别再混淆OLAP和SQL-on-Hadoop两者查询本质不同
AI教程 · 2026-07-01

别再混淆OLAP和SQL-on-Hadoop两者查询本质不同

OLAP和SQL-on-Hadoop虽都使用SQL查询数据,但本质不同。SQL-on-Hadoop负责海量数据批量计算与ETL,查询速度秒级至分钟级;OLAP通过预聚合实现毫秒级多维分析,适合BI报表。两者在数据平台分工协作,前者是后厨加工,后者是前台快速服务。

GEO优化深度解析:AI偏好FAQ还是长文内容?
AI教程 · 2026-07-01

GEO优化深度解析:AI偏好FAQ还是长文内容?

在GEO优化中,AI对内容形式无统一偏好:FAQ在简单查询中引用率41%,长文在复杂查询中达58%。内容应基于用户意图选择形式,FAQ适配简单事实类问题,长文建立主题权威,两者互补而非替代。