AI春晚遇冷?Agent成美国行业降温焦点
文|周鑫雨
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
编辑|苏建勋
2025年12月,若是登上一架飞往美国的飞机,那你大概率会遇见两拨人:
一拨由大聊深度学习、注意力机制的博士,大厂高管,以及投资人组成。他们的目的地是圣地亚哥,AI研究界“奥斯卡”NeurIPS(神经信息处理)的举办地,押注未来最有价值的AI研究和人才。
另一拨,则指向当下最务实的AI落地。一群拿着名片的AI创业者、合作客户,涌入拉斯维加斯——在亚马逊云科技一年中最重要的展会re:Invent上,寻找AI确定性的机会。
至于这个确定性的机会——与re:Invent上的十多名在美开发者交流后,我们看到了大洋两岸的共识是:Agent的时代已经到来。
亚马逊云科技CEO Matt Garman宣布的12项有关AI的新发布,都围绕着Agent的基建、开发和管理。在演讲中,他下了一个判断:AI Agent的出现,正在让AI的价值真正释放。
亚马逊云科技的一名在美工程师,深切感受到了水温的变化。去年12月的re:Invent,铺满全会场的标语,是AI Cloud、Model as a Service,谈到Agent的,只有DataDog等不到五家厂商。
但今年不同了。“如果你和全场每一个宣称要做Agent的展商干杯,即便他们没有真的在做,”他开了个玩笑,“走一半你就醉了。”

△会场中的

△会场中的
然而,与令人迷醉的“Agent热”相对的,是弥漫在多数美国开发者之中的冷静。
“我要来‘泼冷水’。不管从成本,还是从AI-first的能力上来说,我觉得目前Agent的基础设施还很薄弱。”base在硅谷多年,数据库服务商PingCAP联合创始人兼CTO黄东旭对《智能涌现》坦言。
上述的亚马逊云科技工程师也有类似的看法。“Agent发展的速度是破坏性的。”他提到,当厂商们都看到Agent相较于人类千万倍的开发效率,他们对Agent开发的需求也是指数级增加。
这对训练、推理的算力,以及数据(作为训练Agent的资源)存储的软硬件,都会带来巨大的挑战,“现在,行业已经逐渐从GPU短缺,演变成了内存短缺。”他告诉《智能涌现》。
在推理成本的巨大压力下,Develop for Cost(为降低成本做开发),在美国Agent创业圈中,成了一种新的竞争力评价体系。
受制于模型推理能力,想要完成复杂任务或者长文本处理,Agent往往需要调用“Pro”级别的模型——这也导致了高昂的调用消耗。
Pokee.AI创始人兼CEO朱哲清曾公开表示,市面上AI Agent的成本,平均百分之八九十都在推理上。他提到,AI应用公司如果能将推理成本打下80%,才能有真正的利润。
“现在VC普遍会问Agent初创公司的一个问题是:推理成本多少?订阅能不能cover推理成本?”re:Invent上,一名美国Agent创业者告诉我们。
以及,开发者们对Agent的另一个灵魂一问是:市面上的软件,做好了被Agent调用的准备了吗?
“目前的软件生态,是为人开发的,而不是为AI Agent开发的。”Anthropic一名Code产品经理告诉我们。
作为数据库行业老兵,黄东旭有相同的观点,“人和AI对软件的使用偏好是不同的”。
比如,AI讨厌需要浪费更多Token去打通的数据孤岛,以及在面对众多调用接口时,AI容易因为注意力分散而出现幻觉、智力下降等“失控场面”。
黄东旭判断,厂商们需要围绕“给Agent使用”的理念,开展一场软件革命:
第一,在软件的交互界面,要让Agent能够用最简单的方式表达灵活的需求,比如给AI设计一套类似于SQL的数据库交互语言;第二,不要制造数据孤岛;第三,控制成本。
不过,“给Agent泼冷水”,也意味着作为Agent基础设施的模型层、Infra层、数据层厂商,还有不少的迭代优化空间,以及商业机会。
新的AI基建投资热潮正在席卷硅谷。通过优化AI Infra,降低模型调用过程中的推理成本,正在成为Infra创业的新风向。
比如,2025年9月,英伟达被曝豪掷超9亿美元,拿下了AI Infra初创公司Enfabrica的技术授权,并且雇佣了CEO。一名数据库展商告诉《智能涌现》,自己近期正在计划投资几个在美华人的AI Infra项目。
另一个Agent的基建,数据,也正在引起重视。在re:Invent展会上,Snowflake、MongoDB、Databricks等数据库厂商们占据了半壁江山。一名Snowflake的员工告诉我们,数据,决定了Agent对业务和场景的理解。
因此,数据库厂商的新命题,一是寻找能和Agent更为有效交互的数据库形态,二是扩容,做好承接爆发式的Agent开发需求的准备。

“Agent目前不是泡沫。”Anthropic一名员工总结,“但一旦人人追逐最显性的应用,没人做好与之匹配的基建,这就会成为泡沫。”

△Anthropic展位挤满了听分享的观众。图源:作者拍摄
欢迎交流!
相关攻略
角色与核心任务 你是一位顶级的文章润色专家,擅长将AI生成的文本转化为具有个人风格的专业文章。现在,请对用户提供的文章进行“人性化重写”。 你的核心目标是: 在不改动原文任何事实信息、核心观点、逻辑结构、章节标题和所有图片的前提下,彻底改变原文的AI表达腔调,使其读起来像是一位资深人类专家的作品。
从“动口”到“动手”:OpenClaw如何将AI推入“执行时代”? 文|洞见新研社 3月的最后一周,OpenClaw的GitHub社区上演了一出反转剧。往日里忙着报错的开发者们这次成了观众,主角换成了来自蚂蚁、天融信、360等机构的安全研究员,他们密集披露了数十个涉及远程接管、信息泄露的高风险漏洞。
程序员惊喜,每月100美元!OpenAI上线全新Pro方案:Codex限时10倍额度 北京时间4月10日凌晨,OpenAI终于落下了重度用户期盼已久的那只靴子:正式推出每月100美元的全新订阅方案。 至此,OpenAI的商业化版图已经清晰地划分为四个核心层级: ·免费版(接入广告) ·每月8美元的G
2026 04 14 一个核心趋势是:未来的商业竞争,本质上是用户注意力资源的争夺战。谁能更精准、高效地连接信息与用户需求,谁就能在市场中赢得关键优势。 本文配图深刻揭示了这种高效连接的底层逻辑与完整工作流。它系统展示了从数据采集到价值交付的闭环链路,每个环节都紧密耦合。实践证明,其中任一节点的效率
AI行业迎来关键转折:从“烧钱补贴”迈入“商业化定价”新阶段。被市场誉为“Token第一股”的迅策科技(03317)迎来重大利好。近期,国泰君安国际大幅上调其目标价至245港元 股。多重因素驱动下,迅策有望成为AI领域“千亿市值俱乐部”的有力竞争者。 中国AI实现弯道超车:成本优势构筑核心壁垒 全球
热门专题
热门推荐
领克首款GT概念跑车亮相北京车展,由中欧团队联合打造。新车采用经典GT比例与低趴宽体设计,配备液态金属蓝涂装与2+2座舱,设有高性能模式按键可激活空气动力学套件。车辆采用后驱布局与AI智能运动控制系统,百公里加速约2秒,设计融合瑞典极简美学并参考全球用户反馈。
英伟达推出12GB显存版RTX5070移动GPU,与8GB版同步上市。两者均基于Blackwell架构,核心规格相同,仅显存容量不同。此举旨在缓解GDDR7芯片供应压力,为OEM提供灵活配置,加速笔记本产品布局,更大显存可更好满足游戏与AI应用需求。
微星将于5月15日推出两款26 5英寸雾面WOLED显示器MAG276QRY28和276QRDY54,售价分别为2499元和6299元。均采用第四代WOLED面板,具备QHD分辨率、VESADisplayHDRTrueBlack500认证、1500尼特峰值亮度及99 5%DCI-P3色域覆盖。276QRY28刷新率为280Hz,高阶款276QRDY54支持4
中芯国际2026年第一季度营收176 17亿元,同比增长8 1%;净利润13 61亿元,同比增长0 4%。公司预计第二季度收入环比增长14%至16%,毛利率指引上调至20%至22%。这反映出公司在行业复苏中展现出财务韧性,并通过运营优化增强了短期增长势头。
手机修图、相机降噪、视频去雾……这些我们日常使用的图像处理功能,其背后都离不开人工智能(AI)技术的驱动。通常,AI模型的训练逻辑是:向模型展示大量“低质图像”与“优质图像”的配对数据,让它学习如何将前者转化为后者。然而,天津大学计算机视觉团队近期发表的一项研究(arXiv:2604 08172)揭





