揭秘暴涨27倍年入22亿,一群华人靠卖代币暴富
类型:热点整理2026-05-29
AI圈子里,又冒出一家千亿级别的公司。 5月27日,彭博社放出一条消息:美国AI推理平台Fireworks AI正在洽谈新一轮融资,目标估值直接冲到了150亿美元,折算下来约合1024亿元软妹币。 要知道,仅仅7个月前,它的估值还停在40亿美元。再往前追溯,2024年7月B轮融资时,估值才5 52亿
AI圈子里,又冒出一家千亿级别的公司。
5月27日,彭博社放出一条消息:美国AI推理平台Fireworks AI正在洽谈新一轮融资,目标估值直接冲到了150亿美元,折算下来约合1024亿元软妹币。
要知道,仅仅7个月前,它的估值还停在40亿美元。再往前追溯,2024年7月B轮融资时,估值才5.52亿美元。掰指头算一算,不到两年时间,估值直接翻了将近27倍。

Fireworks AI估值变化
更令人咋舌的是它的收入增速。研究机构Sacra的数据显示,到2026年2月,Fireworks AI的年化收入已经达到3.15亿美元,折合约22亿元软妹币,同比增长了416%,相比2024年B轮时也增长了大约3到4倍。

与此同时,它的平台每天要处理约15万亿Token。
15万亿Token是个什么概念?国家数据局之前披露过,2025年12月时,全中国的日均Token消耗量大约是100万亿。换句话说,Fireworks AI这一家公司的日处理量,已经接近全中国AI调用总量的15%。而它成立到现在,还不到4年。
一帮华人,在AI行业卖Token
Fireworks AI成立于2022年,总部在美国加州Redwood City。
公司共有7位联合创始人,其中有3位是华人。CEO乔琳(Lin Qiao),复旦本科和硕士,UCSB博士,之前是Meta的工程高级总监。

Fireworks AI的核心团队
她曾经主导过PyTorch在数据中心、移动设备和AR/VR设备上的开发与部署。另外两位华人联合创始人,Benny Chen在Meta做到过首席软件工程师,Chenyu Zhao则长期负责Google Cloud的Vertex AI相关业务。
这家公司的打法很明确:自己不训练大模型,也不直接做AI应用。他们做的事很简单——帮企业运行各种开源模型,然后按Token收费。
目前,Fireworks AI支持的模型包括DeepSeek、Kimi、MiniMax等多家开源或开放API模型。开发者不需要自己买GPU、搭推理集群或者做底层优化,直接通过兼容OpenAI格式的API就能调用。

Fireworks AI产品界面
Fireworks AI这边则按调用量收费。AI应用跑得越猛,它赚得越多。现在全球最火的AI编程工具之一Cursor,就是它的客户。官方披露的数据显示,Cursor在Fireworks AI平台上,已经实现了1000 token/秒的生成速度。
钱从“训练”流向“调用”
过去两年,AI行业最烧钱的地方,是训练。OpenAI、Google、Anthropic、xAI都在疯狂囤GPU,单轮大模型训练的成本动辄就是数亿美元。
但现在,一个变化越来越清晰:模型训练越来越像“一次性投入”,而推理调用则开始变成“长期收费”。算力结构已经彻底逆转——2023年,全球AI算力中训练占三分之二、推理只占三分之一;到2026年,推理占比飙升到了65%到70%,是训练算力的4.5倍。
在中国,这个趋势更加极端——推理算力已经是训练算力的8倍。英伟达的黄仁勋甚至判断,未来推理规模将达到训练负载的十亿倍。
市场规模也在爆发。Lightspeed此前披露,过去3年,AI推理市场已经从0增长到超过50亿美元。资本也开始疯狂涌入这个赛道。
除了Fireworks AI,Baseten最近被曝出正以110亿美元估值进行融资,Together AI估值达到75亿美元,Modal估值46.5亿美元,Fal估值45亿美元。其中Baseten更夸张:2026年1月刚完成一轮融资,估值50亿美元;5个月后新一轮融资,估值直接翻倍到了110亿美元。
更夸张的是收入增速。据The Information报道,Baseten的年化收入已经从2026年初的2亿美元,增长到Q1末的6亿美元。3个月,增长了200%。
这些公司有一个共同特点:它们都不直接做大模型,而是帮整个AI行业“跑模型”——相当于AI时代的“卖水人”,靠永续的Token调用收费,赚取长期、稳定的现金流。
NVIDIA等巨头进场投资
Fireworks AI背后的投资方越来越豪华。股东名单里包括了Lightspeed、Index Ventures、红杉资本,以及NVIDIA和AMD。
原因很现实:AI应用爆发后,整个行业真正稀缺的东西开始变成GPU,而推理平台本质上就是在帮助整个行业更高效地使用GPU。NVIDIA此前曾公开表示,基于Blackwell架构的新一代推理系统,已经将单Token成本降低约10倍。在部分大模型场景下,成本甚至能降到原来的1/35。
这意味着,DeepSeek、Llama 3、Kimi这些开源模型,在推理成本上已经接近甚至开始挑战GPT-4等闭源API,性价比的拐点正式到来。而谁能把Token成本压得更低,谁就更容易拿下AI应用公司。
目前,Fireworks AI估值对应约3.15亿美元的ARR,市销率大约47倍。放在2023年AI泡沫期,这个数字不算离谱。横向对比一下同行:Together AI估值75亿美元、对应ARR约1.5亿美元,市销率约50倍;Baseten估值110亿美元、对应ARR约6亿美元,市销率约18倍。

放在2023年AI泡沫期,头部AI公司市销率普遍在80到150倍。在2026年,这种估值依然能成立,核心原因只有一个:AI调用量仍在爆炸式增长。Fireworks AI的平台日Token处理量,已经从2025年底的10万亿增长到2026年5月的15万亿,5个月增长了50%。按这个增速,2026年底有望突破25万亿/日,全年处理量将超过7000万亿Token——相当于为全球AI应用提供了近五分之一推理算力的支撑。
中国,何时出现千亿公司?
Fireworks AI最值得关注的,其实不只是150亿美元估值,而是“按Token收费”这件事已经真正形成了商业规模。过去很多人觉得推理平台只是技术服务,但现在3.15亿美元年化收入、416%的增速、15万亿的日Token处理量,这些数字已经说明:AI调用本身,正在变成一门真正的大生意。
这也是为什么国内越来越多公司开始进入推理层,包括硅基流动、无问芯穹,以及越来越多AI Infra创业公司。仅仅在2025到2026年,国内新增的推理赛道创业项目就超过了200家。
过去几年,AI行业拼的是谁能训练出更大的模型。而现在,越来越多人开始盯上另一件事:谁能替整个AI行业,更低成本地“跑模型”。
*本文信源:Bloomberg、Sacra、AIWire、The Information、Fireworks AI官网等。融资尚未最终完成,估值可能变化。*