首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
Token成本优势:中国AI模型以极致性价比挑战美国巨头

Token成本优势:中国AI模型以极致性价比挑战美国巨头

热心网友
16
转载
2026-03-28


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈


越来越多海外开发者及“龙虾”(OpenClaw)用户,对中国大模型愈发青睐,从而引发中国“Token出海”现象。

一名新加坡开发者,曾用美国模型公司Anthropic的旗舰模型Claude Opus 4.6编程,发现“好用但贵”,单日Token(词元,模型输入与输出基本单位)消耗数千万个,每日成本动辄上百美元。这名开发者转而拥抱中国大模型公司MiniMax的M2.5开源模型,干活性能相当,Token消耗所产生的费用却仅为美国头部模型的十七分之一。碾压级的性价比,催生高频调用。

此非个案,而是风潮。全球AI模型聚合平台‌OpenRouter是见证者。该平台允许开发者通过单一API(应用程序接口)访问全球超300款主流大模型,无需再为每个模型单独注册或适配接口。数据显示,近一个月来,在中美大模型API调用量的较量中,中国模型更胜一筹,调用量第一、第二和第四均为中国模型,分别为MiniMax M2.5、阶跃星辰Step 3.5 Flash,以及DeepSeek V3.2。另外,平台前十模型的Token总消耗量的60%以上来自中国模型。



OpenRouter数据显示,近一个月来,在中美大模型API调用量的较量中,中国模型更胜一筹。

这意味着,全球开发者更喜欢调用中国大模型,愿意为调用所消耗的Token付费。大模型推理所需算力、电力均在中国完成,却创新实现了“Token出海”这一数字服务贸易形式。

这其中,我国低成本电力无疑是核心优势之一。利用乌兰察布、宁夏等地可再生能源丰富及气候优势,我国实行“东数西算”,绿电价格较美国电价低50%到70%,从而降低了数据中心运营成本。字节、阿里等大厂均在中西部地区布局数据中心。


腾讯贵州贵安七星数据中心。

但“Token出海”的更硬核辅助,在于中国大模型的技术实力,以及硬件厂商的高质量算力。

MiniMax多次登顶OpenRouter调用量第一,创始人闫俊杰本月中在2026上海全球投资促进大会开幕式上透露,MiniMax致力于AI普惠,早在“龙虾”大火前就定下目标:复杂Agent(智能体)运行1小时,成本1美元。


闫俊杰在2026上海全球投资促进大会开幕式上。

MiniMax的M2.5的确做到了。在编程最硬核的SWE-Bench Verified榜单上,M2.5拿到80.2%的高分,几乎逼平Claude Opus 4.6。但M2.5的推理速度是主流模型的约两倍,输入、输出价分别为0.3美元/百万Token、2.4美元/百万Token。也就是说,这个大模型不仅脑子好使,还不卡顿,更有极致性价比。

具体来看,其一,MiniMax率先投入资源,研究MoE架构,于2024年初上线国内首个基于MoE架构的大模型。此架构将模型分成多个专家子网络,视情动态激活,以节省计算开销。其二,在模型传统注意力机制中,Token长度与算力消耗呈平方关系。MiniMax成为全球首家敢于投时间、人力、算力资源,去验证“线性注意力机制”可行性、并最终用于大规模商业化部署的模型厂商,已实现Token长度增加后算力消耗的线性增长。其三,M2.5早在RL(强化学习)阶段,就引入MiniMax自研的Forge架构,从而绕过Agent场景下逻辑断裂、训练效率受重复前缀拖累两大痛点。

可见,中国模型实现能力、速度、价格之间的平衡,均基于颠覆式创新。

国内芯片企业同样励志,正全力适配自主创新大模型的研发。据记者了解,国内某头部模型厂商与国内自主芯片企业的合作算力已达数千卡规模,海外芯片正逐渐让位于国内芯片。国产GPU在易用性与成本上的综合优势,对于日均Token调用量上亿乃至十几亿的头部大模型而言,是其商业竞争力的关键因子。

据悉,这一波“Token出海”,寒武纪、昆仑芯、天数智芯等技术领先的芯片企业已率先实现适配及应用。如阶跃星辰Step 3.5 Flash等多款模型的推理和训练微调,均在天数智芯的通用GPU集群上完成,天数智芯加速卡还为多家AI企业大模型研发提供算力资源支撑。


天数智芯今年初在港交所上市。

在天数智芯副总裁宋煜看来,“Token出海”浪潮下,算电协同下的高质量算力,成为助力中国大模型持续提升全球竞争力的关键力量。他认为,评判高质量算力,有高效率、可预期、可持续三大维度。

高效率,指在真实训练和推理场景中,将电力、带宽、显存和互联尽可能转化为有效吞吐;可预期,指在大规模集群、复杂业务负载和功率约束下,算力性能、时延和稳定性能被准确评估并持续兑现。如天数智芯有业内独家的IX-SIMU全栈软件仿真系统,可在集群部署前仿真模拟实际运行效果,从而避免盲动,减少“上线后发现不行”的风险;可持续,则指芯片不只跑今天的算法,还能持续向“后”兼容。当前大模型几乎“三月一迭”,算力芯片须尽力适配,保障客户在采购后能支撑后续新模型的运行。

大模型推理,产出的是代码、分析、翻译和创意,是一种更深层的嵌入。一旦开发者对模型形成习惯,其切换成本会随时间积累而越筑越高。此番Token高质量出海,大幕刚刚拉开。

原标题:《中国“Token出海”,极致性价比碾压美国模型,不止是电价便宜》

来源:作者:解放日报 李晔

来源:https://www.163.com/dy/article/KP3BHL7D055040N3.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Token成本优势:中国AI模型以极致性价比挑战美国巨头
科技数码
Token成本优势:中国AI模型以极致性价比挑战美国巨头

越来越多海外开发者及“龙虾”(OpenClaw)用户,对中国大模型愈发青睐,从而引发中国“Token出海”现象。一名新加坡开发者,曾用美国模型公司Anthropic的旗舰模型Claude Opus

热心网友
03.28
中企在印尼:从餐厅到密室逃脱,如何塑造当地人生活
科技数码
中企在印尼:从餐厅到密室逃脱,如何塑造当地人生活

来源:环球时报英国《经济学人》杂志 3月26日文章,原题:中国企业如何影响印尼 2015年,当张先生以风险投资家的身份首次从中国到印尼时,他发现当地监管机构对支付宝表现出浓厚兴趣。2024年,他与其

热心网友
03.28
摩根大通:AI模型能力成中国市场竞争核心,需求加速扩张
科技数码
摩根大通:AI模型能力成中国市场竞争核心,需求加速扩张

中国人工智能基础模型行业正步入商业化加速阶段。摩根大通认为,随着模型质量持续改善并开始转化为更快的需求增长,大模型能力将决定定价权,较强与较弱公司之间的差距将日益扩大。据追风交易台,3月27日摩根大

热心网友
03.27
2026中关村论坛:中国科幻大会十年,助力北京冲刺千亿产值
科技数码
2026中关村论坛:中国科幻大会十年,助力北京冲刺千亿产值

十年中国科幻大会,是科幻迷们的 "嘉年华 ",更是观察中国科幻产业和北京科幻科创联动成长的重要窗口。3月27日,2026中国科幻大会开幕式在北京石景山区首钢园四高炉举行。开幕式上发布的《2026中国科幻

热心网友
03.27
美媒揭秘美国高级用户为何转向中国AI模型
科技数码
美媒揭秘美国高级用户为何转向中国AI模型

在香港花了一年时间报道中国最热门的人工智能(AI)初创企业后,有一个问题让我感到困惑:他们为什么总爱在深更半夜发布新模型?我后来了解到,答案是,从总部位于杭州的阿里巴巴到总部位于北京的智谱华章(Z

热心网友
03.27

最新APP

你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25
疯狂猜词
疯狂猜词
休闲益智 03-25
诸神皇冠
诸神皇冠
棋牌策略 03-25

热门推荐

悟空浏览器下载记录查看与管理全攻略
电脑教程
悟空浏览器下载记录查看与管理全攻略

可通过五种方式查看悟空浏览器下载记录:一、内置下载管理器;二、系统通知栏跳转;三、“我的”页面入口;四、文件管理器访问默认目录Download wukong;五、全局搜索文件名。如

热心网友
03.28
俞敏洪直播带货面膜引热议,网友直呼看懵了
科技数码
俞敏洪直播带货面膜引热议,网友直呼看懵了

3月27日消息,有网友晒出他直播的片段,63岁、身家121亿早就财富自由的俞敏洪,居然在直播间里亲自带面膜。两个助理加上自己,手忙脚乱搞了半天,总算把面膜糊上脸了。旁边的小姐姐都憋笑不停,完了俞敏洪

热心网友
03.28
抢先试驾新款MONA M03:体验舒适与智能双升级
科技数码
抢先试驾新款MONA M03:体验舒适与智能双升级

今早,小鹏汽车官宣2026款小鹏MONA M03全面到店并开启试驾。作为品牌10万级纯电轿车的核心走量担当,MONA M03常年稳居细分市场销量前列,这一次改款看点十足。【P1】废话不多说,一起来看

热心网友
03.28
罗技一句话引争议!品牌道歉背后的问题与应对策略
科技数码
罗技一句话引争议!品牌道歉背后的问题与应对策略

最近的热搜是一个接着一个来,前有罗永浩邀请杨笠上播客被骂,现有瑞士知名鼠标品牌罗技“自砍一刀”。小雷估计大家伙都刷到视频了吧,那配文真的是不堪入目。“当我说我不会再花一分钱时,我一降价,你还不是像狗

热心网友
03.28
董明珠斥年轻人躺平引热议,2000亿业绩下滑谁之过?
科技数码
董明珠斥年轻人躺平引热议,2000亿业绩下滑谁之过?

3月26日,董明珠在香港科技大学分享会上演讲,本来是聊年轻人怎么帮中国品牌出海,后来现场有同学提问,未来毕业生的年轻人,怎么帮格力和其他中国品牌走向世界。估计是董明珠觉得这次不好回答,于是她把话题拐

热心网友
03.28