先给出几个核心判断。
6月30日,Coinbase首席执行官Brian Armstrong在社交平台透露了一项重要举措:公司已将智谱GLM 5.2和月之暗面Kimi K2.7 Code设为全体工程师的默认模型。结果显示,在Token使用量持续指数级增长的同时,AI支出大幅压缩了近一半。
Armstrong明确指出,91%的工程师此前从未触及用量上限,因此这次成本优化并未削减员工的Token配额。真正发挥作用的是三项措施:智能路由、强化缓存以及更换默认模型。他们将代码审查、文档总结等常规任务,从Anthropic和OpenAI的模型迁移了过来。
一个值得关注的细节是,Coinbase选择将开源权重下载到自有服务器上自托管运行。代码和提问不会流向位于中国的API接口——数据安全与国家安全合规问题由此得到解决。

先看看这两款模型的具体表现。
GLM 5.2是智谱于6月12日发布的744亿参数旗舰模型,采用MIT协议开放权重。在第三方评测平台Artificial Analysis上获得51分,与Anthropic、OpenAI共同跻身前三,是目前开源模型中的SOTA。更直观的数据是:在SWE-bench Pro基准测试上超越OpenAI GPT-5.5,在FrontierSWE任务中以74.4%的成绩逼近Anthropic Opus 4.8的75.1%——两者差距仅1个百分点。而调用价格呢?大约只有Opus 4.8的六分之一。
Kimi K2.7 Code是月之暗面同一天发布的代码模型,也是Coinbase默认调用的另一款模型。两款模型,一个主打综合能力,一个专攻代码场景,组合起来确实覆盖了大部分工程师需求。
Coinbase并非唯一这样做的公司。
Airbnb已将客服模型从GPT切换至阿里千问;AI公司Lindy把模型从Anthropic Claude迁移到DeepSeek V4后,推理成本直接降低了90%;Snowflake的CEO专门算过一笔账,结论是GLM 5.2能以显著更低的价格达到与Claude相当的性能。美中经济与安全审查委员会今年3月的报告也给出了一组数据:大约80%的美国AI初创公司正在使用中国开源模型。
市场份额的变化更加直观。在OpenRouter平台上,中国模型的Token份额从一年前的不到2%,一路攀升至今年4月的四成以上,5月进一步突破61%。阿里千问系列累计下载量在2025年1月突破7亿,在Hugging Face上已超过Meta Llama,成为全球下载量最高的开源模型家族之一。
原因其实很简单。当性能进入第一梯队的中国模型以更低价格摆上桌面,企业面临的核心问题日益集中在具体的成本与部署控制权上,而非意识形态层面。

