首页 游戏 软件 资讯 排行榜 专题
首页
AI
小米罗福莉谈 Token 价格战:建议 LLM 公司不要盲目压低价格,会导致恶性循环

小米罗福莉谈 Token 价格战:建议 LLM 公司不要盲目压低价格,会导致恶性循环

热心网友
17
转载
2026-04-15

小米罗福莉谈Token价格战:建议LLM公司不要盲目压低价格,会导致恶性循环

4月7日消息,小米集团MiMo负责人罗福莉近日在社交平台分享了她对当前AI业界“Token价格战”的观察与思考。她的分析,源于两个紧密的时间点:Anthropic几天前切断了Claude第三方工具的订阅通道,而小米MiMo也几乎在同一时间推出了自己的Token Plan。这让她对行业现状有了更深的感触。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

小米罗福莉谈 Token 价格战:建议 LLM 公司不要盲目压低价格,会导致恶性循环

▲ 图源:罗福莉本人社媒账号

罗福莉的观点可以归纳为几个核心层面,每一层都直指当前大模型商业化的关键矛盾。

1. 订阅机制的“理想”与“现实”鸿沟

首先得承认,Claude Code的订阅机制在计算资源分配上设计得相当精妙。但问题在于,这种设计真的能赚钱吗?恐怕未必。除非其API利润率能高出10到20倍,否则这个模式很可能处于亏损状态。

那么,钱到底亏在哪里?关键就在于第三方框架的接入。以OpenClaw为例,仔细研究其上下文管理机制就会发现,它的设计相当低效。一次用户请求,往往会触发多轮低价值的工具调用,而每一次调用都是一次独立的API请求,并且每次都携带超长的上下文——通常超过10万tokens。

即便有缓存命中,这种操作方式也极其浪费资源。更极端的是,它还会抬高其他请求的缓存未命中率。最终结果就是,每个用户实际触发的API调用次数,可能是Claude Code原生框架的数倍之多。换算成API成本,轻松就是订阅价格的几十倍。这已经不是简单的“差距”,而是一条“巨大的鸿沟”。

2. “断奶”之痛与工程自律

当然,Anthropic此举并非彻底封杀。OpenClaw、OpenCode等第三方框架依然可以通过API调用Claude,只是不能再“搭便车”使用用户的订阅额度了。

短期来看,这无疑会给使用这些智能体的用户带来切肤之痛,成本可能轻松上涨几十倍。但话说回来,这种压力未必是坏事。它恰恰能迫使这些第三方框架去优化它们糟糕的上下文管理,去提升提示词缓存命中率,从根本上减少Token的浪费。这种“断奶”带来的痛苦,最终会转化为工程上的自律与进步。

3. 价格战的陷阱与恶性循环

基于以上分析,罗福莉向各大LLM公司提出了一个忠告:在没想清楚如何设计一个不亏钱的编程订阅方案之前,千万别盲目卷入价格战。

把Token价格压得很低,同时完全开放第三方框架,表面上看是对用户友好,但实际上,这正是Anthropic刚刚艰难走出的陷阱。更深层的问题在于,如果用户的注意力被消耗在那些低质量的Agent框架上,当他们面对不稳定且缓慢的推理服务时,就只能被迫使用经过降级、只为节省成本的“阉割版”大模型,结果往往是任务仍然无法完成。这对于用户体验和用户留存来说,无疑是一个致命的恶性循环。

4. MiMo的路径与行业出路

关于小米MiMo的Token Plan,其逻辑与Claude新推出的额外使用套餐相似:支持第三方工具,严格按Token计费。目标很明确,就是长期稳定地提供高品质服务,而不是诱导用户冲动消费后迅速“弃坑”。

从宏观视角看,全球计算资源增长的速度,已经明显跟不上Agent爆发所带来的Token需求增长了。那么,真正的出路在哪里?答案不是提供更便宜的Token,而是要让“更高效的Agent框架”和“更强大且更高效的模型”协同演进,形成合力。

从这个意义上说,Anthropic的这次举措,无论其初衷如何,客观上都在推动整个开源和闭源生态向前发展。这或许是一件好事。它揭示了一个即将到来的新时代法则:Agent时代,不属于那些消耗最多算力的人,而将属于最懂得如何高效利用算力的人。

小米罗福莉谈 Token 价格战:建议 LLM 公司不要盲目压低价格,会导致恶性循环

来源:https://www.ithome.com/0/936/686.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

小米罗福莉谈 Token 价格战:建议 LLM 公司不要盲目压低价格,会导致恶性循环
AI
小米罗福莉谈 Token 价格战:建议 LLM 公司不要盲目压低价格,会导致恶性循环

小米罗福莉谈Token价格战:建议LLM公司不要盲目压低价格,会导致恶性循环 4月7日消息,小米集团MiMo负责人罗福莉近日在社交平台分享了她对当前AI业界“Token价格战”的观察与思考。她的分析,源于两个紧密的时间点:Anthropic几天前切断了Claude第三方工具的订阅通道,而小米MiMo

热心网友
04.15
中移动金融科技专利:优化元宇宙资源分配,提升策略灵活性
科技数码
中移动金融科技专利:优化元宇宙资源分配,提升策略灵活性

国家知识产权局信息显示,中移动金融科技有限公司、中国移动通信集团有限公司申请一项名为“针对元宇宙场景的资源分配方法及其相关设备”的专利,公开号CN121349674A,申请日期为2025年10月。专

热心网友
01.19
《公主连接》资源分配推荐 全资源性价比分析
游戏攻略
《公主连接》资源分配推荐 全资源性价比分析

公主连接资源分配推荐,在游戏中有不少的资源可供玩家获取,mana、地下城币、竞技场币等等资源,那么这些资源怎么分配呢?下面一起来看看这些资源的分配吧!

热心网友
03.13

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

重返未来1999梁月塑造如何抽取
游戏攻略
重返未来1999梁月塑造如何抽取

重返未来1999梁月塑造抽取攻略:优先级分析与资源规划 在《重返未来1999》中,梁月作为队伍的核心输出角色,其塑造等级的提升策略直接影响阵容的整体强度与通关上限。许多玩家在面对不同塑造等级的选择时,常常感到困惑。本文将深入解析梁月各阶段塑造的实际价值,助你高效规划抽取资源,实现战力最大化。 重返未

热心网友
04.15
3A大作不香了!近6成PC游戏收入来自小厂 玩家:大厂炒冷饭、GaaS劝退
游戏资讯
3A大作不香了!近6成PC游戏收入来自小厂 玩家:大厂炒冷饭、GaaS劝退

全球游戏市场格局生变:玩家时间与消费正流向“腰部”与“长尾”游戏 快科技4月15日消息,知名市场分析机构Newzoo最新发布的《2026年PC与主机游戏报告》揭示了一个深刻的行业结构性变化。市场表面看似稳定,实则内部增长动力正在发生关键性迁移。 报告的核心洞察指出:虽然顶级的3A大作依然占据媒体头条

热心网友
04.15
大润发优鲜如何查看订单
手机教程
大润发优鲜如何查看订单

在大润发优鲜购物后,如何轻松查看订单详情? 在大润发优鲜平台完成购物后,查看订单是掌握配送进度、核对购物详情以及处理售后事宜的关键一步。那么,具体该如何操作呢?流程其实相当清晰。 首先,需要打开大润发优鲜App。进入应用主界面后,注意力可以放在底部的菜单栏上,那里通常会有一个名为“我的”的选项。点击

热心网友
04.15
S.H.I.T Journal(抖音SHIT) S.H.I.T Journal探索学术去中心化与社区自治的创新模式
AI
S.H.I.T Journal(抖音SHIT) S.H.I.T Journal探索学术去中心化与社区自治的创新模式

S H I T Journal(抖音SHIT)产品介绍 S H I T Journal 网站介绍 说到打破学术壁垒、革新传统出版模式,有一个平台不得不提——S H I T Journal。它正尝试用一种前所未有的方式,将学术评价与发表的权利交还给社区本身。这个平台不仅构建了一个开放的投稿与审稿生态,

热心网友
04.15
GOMPlayer怎么设置视频满屏播放
手机教程
GOMPlayer怎么设置视频满屏播放

GOM Player 全屏播放设置指南:一键开启沉浸式观影模式 想要获得更具冲击力、无干扰的视频观看体验吗?将播放画面铺满整个屏幕是实现沉浸式观影最有效的方式之一。作为一款广受欢迎的多媒体播放软件,GOM Player 提供了直观且灵活的全屏播放设置选项。本文将为您系统讲解几种启用全屏模式的方法,并

热心网友
04.15