先说个真实场景:手头有批赠送的16亿Tokens快过期了,还剩十几亿没用完。总得想办法快速消耗掉,又不想浪费——但一时半会儿也找不到那么多现成的需求。
平时用Opus4.7开发都是能省就省,没用大手大脚的习惯。让MiMo接手吧,又有点不放心。索性把问题丢给AI,把市面上能试的全试了一遍。
结果挺有意思:大部分AI的回答大同小异,但有些确实想得更深一层。
就像人一样,有的智商高,思考问题就会多绕一层。智商低的就是你说什么、它干什么,从来不琢磨怎么做得更好。
先说说问题背景,然后看各家AI怎么接招。
1、MiMo
既然是MiMo送的Tokens,先问问它的意见。
回答方向很明确:文档类产品、软件类产品、网站/可视化产品——三个大类。
它完全是按关键词逐条分类回答:
- AI技术知识库/行业报告:生成一本完整的AI领域电子书,每章需要调研、大纲、初稿、审校、润色,一本书15-20章,每章3000-5000字。预计单轮对话消耗50K-100K Tokens,多轮迭代可达300K以上。变&现价值:可发布成PDF、GitBook、Notion模板。
- 系统化Prompt模板库:为法律、医疗、教育、电商、代码审查等行业构建100+个经过测试的Prompt模板。预计消耗200K-500K Tokens。可做成SaaS产品或付费课程配套资源。
- 竞品分析报告:对AI细分赛道(AI Agent框架、向量数据库、RAG平台)做深度横评。预计消耗100K-200K Tokens。
结构没毛病:做什么、为什么烧Token、预计消耗、价值——该回的回了。但毕竟是第一个回答,没有参照物,先不做评判。
2、DeepSeek
同样的问题,大鲸鱼的处理方式有点不一样。
它先做了一张表格:
| 产品方向 | Token消耗方式 | 典型应用场景 | 商业价值/盈利模式 | 关键洞察 |
|---|---|---|---|---|
| 文档/知识库 | 长文本处理、多轮推理、知识图谱构建 | 法律文书审查、财报分析、学术论文解读 | 付费订阅、API调用计费 | 百万级Token上下文已成基础服务 |
| 软件与Agent | 多步复杂任务、持续在线袋里 | AI编程助手、自动化工作流 | Token Plan订阅 | Agent是消耗Token的主要引擎 |
| 网站与低代码 | 代码生成、多组件设计 | 营销H5、电商网站、轻应用 | 算力商店模式 | 零门槛是关键 |
| 多模态内容创作 | 视频生成、脚本创作 | 营销视频、AI短剧 | 按Token付费 | 视频生成是名副其实的高耗能场景 |
提问时只提了“文档、软件、网站”三个关键词,本意是抛砖引玉。DeepSeek还算有点扩展意识——主动补了一个多媒体内容创作方向。
其他国产AI模型,大半都试过,结果大同小异。例子都是常见例子,回答格式也差不多,没啥新意。不一一贴了。
3、GPT5.5
来看看最能稳稳接住问题的GPT。
它的第一句话就亮了:“核心思路是:不要为了消耗Token而消耗Token,而是把Token变成数据资产、评测资产、内容资产、工具资产。”
不是直接列方案,而是先点题——这一点,维度就不一样了。原文诉求里有“有意义”三个字,它get到了。
再看它排的方案:
- 最优方案:AI模型评测与排行榜网站
- 次优方案:AI教程自动生产系统
- 很炸裂的方案:AI对战竞技场
- 实用型方案:AI长文档处理平台
- 有商业潜力的方案:AI内容工厂
- 数据资产方案:Prompt数据库和Prompt评测站
- 最推荐做的组合
虽然部分内容跟国产模型重叠,但组织方式完全不同。国产模型基本是按关键词1、2、3机械回答,GPT用“最优、次优、炸裂、典型、商业潜力”这些维度来分类。
它第一个方案就是“AI模型评测与排行榜网站”,而模型评测恰好是我一直在做的事。这该死的记忆系统,投我所好了。
4、Claude Opus4.7
最后看最常用的Opus4.7,这次已经清空所有记忆以免干扰。
第一句居然是“这是一个很正当的问题”。第二段就指出了问题关键:别把消耗Tokens当成目标。
这又比GPT5.5高了一层。一个AI拿到问题,先考虑正当性,然后强调:“真正有意义的产品里,Token消耗是结果而不是目的。如果产品对用户有用,自然会消耗Token;如果你为了烧额度而硬塞LLM调用,产品反而会变差。换个角度:把额度看成‘我有16亿Token的预算可以做实验和服务早期用户’,这样决策会健康很多。”
这该死的责任感。
说完这个,它才转向“什么样的AI产品天然就是Token密集型,又确实有用”。
然后弹出了选项窗口,主动提问收窄模糊空间:
- Q:你更想做哪种形态的产品?A:还没定,想看建议
- Q:你的额度有时间限制吗?A:有,需要尽快用掉
它是可以直接弹窗的。这一步忘了截图,但后续选项质量极高。
时至今日,每个AI都能给出某种“标准答案”,但深度和差异化才见真章。大部分AI根据关键词细化一下就算完成任务,谈不上创新或深度思考。
当然,这也是个哲学题:听话和优秀,你要选哪个?
我目前已经从中选了几个方向,开始燃烧Tokens了。使用过程和结果,有机会再分享。
