游乐游手机版
首页/业界动态/文章详情

DeepSeek AI助手功能详解与使用指南

时间:2026-05-14 18:31
Token正在重塑AI时代的价值坐标,它是效率革命的引擎,还是成本失控的暗礁?本期将从Token降本的视角,透视AI时代“新石油”的经济逻辑。 最近关于Token的讨论,氛围有些微妙。朋友圈里随处可见对其中文译名的探讨——“词元”、“智元”各执一词,甚至出现了“慧根”这类颇具禅意的幽默版本。 Tok

Token正在重塑AI时代的价值坐标,它是效率革命的引擎,还是成本失控的暗礁?本期将从Token降本的视角,透视AI时代“新石油”的经济逻辑。

最近关于Token的讨论,氛围有些微妙。朋友圈里随处可见对其中文译名的探讨——“词元”、“智元”各执一词,甚至出现了“慧根”这类颇具禅意的幽默版本。

Token本身并非新概念,自大模型落地之日起,它便与神经网络共生。然而,直到OpenClaw(坊间昵称“龙虾”)在用户群体中大规模扩散,各类Agent应用才真正将Token的消耗问题推至公众视野的前台。

核心矛盾浮出水面:消耗量过于庞大,而价格也着实不菲。

回想OpenAI发布GPT-5.4时,曾有用户反馈测试一句简单的“你好”就消耗了价值80美元的Token,当时多数人认为这过于夸张。但随着“小龙虾”的普及,单次任务烧掉千万级Token已成为常态。与之形成鲜明对比的是,英伟达CEO黄仁勋在GTC 2026大会及后续多个场合,反复强调工程师应大量使用Token,甚至建议将其纳入薪酬激励体系。在一次对话中,他直言不讳:“如果一位年薪50万美元的工程师,连25万美元的Token都没用掉,我会极度恐慌。”

但问题在于,疯狂燃烧Token就一定能解决问题吗?其中有多少是有效消耗?怎样的投入产出比才算合理?

结合近期外媒消息,有OpenAI程序员一周内消耗了2100亿Token,其数据量相当于33个维基百科。如此巨量的消耗究竟带来了何种成果?这不禁让人思考,这场轰轰烈烈的“Token运动”,其实际效能存疑,而其中的获利者却相对明确。

黄仁勋将英伟达定位为“Token之王”,手握全球最先进的“Token制造机”。若一味鼓吹使用量,甚至暗示不用就会落后,那么其策略便具有双重性:一方面旨在彻底改变AI时代企业“效率考核”的逻辑;另一方面,也无形中制造了广泛的“Token焦虑”。

Token太贵了

“Token太贵”是许多用户的直观感受。不久前,周鸿祎对此表达了不同看法:“大家觉得Token贵可能存在些误解,因为大模型后端是可以灵活配置的。”在他看来,用户可以通过自主选择模型来控制成本。日常对话聊天的成本其实很低,真正的Token消耗大户是那些复杂任务,例如生成视频、创作短剧或撰写小说等深度调用场景。

猎豹移动CEO傅盛曾分享过自己的经验,他通过一系列使用技巧,将最初日均数百美元的Token费用优化至日均10多美元。折算下来,月费约2100元,年费则高达25200元。

这就引出一个现实问题:有多少用户能够承担日均10美元的使用成本?对比当前中国互联网主流的消费级软件,例如剪映的高级会员年费仅在600元左右,各类娱乐会员年费也多在300元上下,几乎找不到任何一款年费超过25000元的面向普通消费者的工具软件。

“绝大部分人一天10美金,仍然不会接受,这里会过滤掉大片的非付费用户。”这一判断,也得到了业内的 tacit acknowledgement。

实际上,尝试各类“小龙虾”产品时,用户接触到的成本远不止Token本身。例如,若需生成图片,则要调用专门的生图模型API;如需监控动态,则需接入付费的搜索API。这些潜在叠加的费用,会逐步劝退绝大多数普通用户。虽然存在开源方案等变通方式以降低成本,但开源项目往往间接隐藏着安全风险。

3月13日,在腾讯科技“虾聊”系列直播首期中,玄武实验室的嘉宾Lambda分享了一个数据:他个人平均每月“养虾”的费用在千元以上。

无论是参照消费级工具的定价,还是聆听一线“养虾户”的反馈,基于Agent的Token消耗,称其“太贵了”,是站得住脚的结论。

存储瓶颈与效率黑洞

简单理解,Token就是大语言模型处理信息的基本单位。用户输入的提示词,模型输出的答案,每一个字、每一个标点,都会计入Token消耗量,其本质仍是算力成本的体现。

过去衡量算力总拥有成本,指标繁多,包括能效比Flops/W、单位成本Flops等等。而在今年的“Token经济学”语境下,Token/W正逐步成为新的共识指标。“我们的每一个Token成本都是世界最低的。”黄仁勋在GTC上如此宣称。

然而,无论价格多低,采用何种计算单位,它终究是投入成本的量化,涵盖了研发、硬件、部署、能耗、运营等环节。因此,降本也必须围绕这些环节展开。

对于Token降本而言,一个不容乐观的消息是内存价格正在疯涨。以HBM内存为例,作为支撑大模型训练和推理的关键器件,推理数据量的暴涨同步拉高了存储需求。2026年第一季度,DRAM价格环比上涨超过50%,NAND价格环比最高涨幅竟达150%。黄仁勋、苏姿丰均已喊出“HBM有多少要多少”的口号,三星、美光等存储原厂披露,头部客户的战略长约已签至五年后。

存储市场的波动影响深远。消费级市场已出现千元机库存面临停产的窘境,而云厂商同样处于涨价的煎熬之中。目前行业最乐观预计存储价格在2028年回落,悲观一点则要等到2030年。存储价格一日不回落,Token降价就缺少了一个关键的外部杠杆。

模型能力的提升是另一个潜在的降价杠杆。“现在一些8B的小模型,能力越来越逼近全量大模型。”一位学术界研究员指出。在这方面,面壁智能联合清华团队在《Nature》子刊上提出的Densing Law概念颇具启发性,它强调大模型的能力密度随时间指数增长,约每3.5个月翻一倍,这意味着同等性能所需的参数量每3.5个月减半。

一位国产AI芯片从业者也强调了模型“又好又小”对成本的推动力:“你看国内开源大模型的token价格,基本都跟模型规模正相关。”此外,多位国产算力从业者表示,提升MFU(模型浮点运算利用率)也能带来成本压缩空间,这还涉及架构、显存等多方面的推理优化。

“MFU跟模型本身关系不太大,主要是算子和调度策略有关。”另一位国产存算一体芯片从业者解释道,“目前主流大模型的推理MFU均值在30%左右,优化后可超过50%,估计能省出50%的成本。”换言之,行业远未榨干GPU的性能——支付了100%的硬件成本,目前却只利用了不到三分之一的算力。

不过,MFU提升带来的单Token成本下降,能否传导至消费端,取决于大模型提供方的商业策略。如果用于发动价格战,这无疑是一个有效的杠杆。

再来一次价格战?

中国大模型市场并非没有价格战的先例。2024年,国内厂商就曾爆发过一轮激烈角逐。当时正值DeepSeek-V2上线,其定价为每百万Token输入1元、输出2元,价格仅为同期GPT-4-Turbo的百分之一。

DeepSeek当时降价的关键在于推理优化——采用MoE稀疏架构大幅降低了计算量,并通过MLA多头潜在注意力机制将KV缓存压缩了90%以上。此轮降价如同推倒第一张多米诺骨&牌,随即阿里、字节等大厂先后下场博弈,甚至一度出现了“Token免费”的现象。

王小川在当时的一次交流中谈及这轮价格战,他认为其与此前的团购、网约车大战有本质不同:“这次价格战是直接生产力的供给,是B端市场的价格战。”他同时强调,即使短期内亏损,大厂也可能在一年后实现盈利。

“在推理效率提升的情况下,通过补贴,用户有了非常明显的增长,”一位亲历上一轮价格战的大模型公司内部人士回忆道,“大概花了几个亿吧。”

然而,当前这一轮Token消耗的特点是B端和C端需求同时爆发,其情境反而更接近能够改变生产关系的团购、网约车大战。但市场此次却表现出出奇的沉默。前述参与过价格战的人士分析,在模型的特定能力已趋成熟、并拥有稳定用户基础的情况下,厂商未必有动力再次下场血拼。

“Token消耗不像2024年那种规模了。这种情况下,为了‘虾’去打价格战,存量用户的ARR(年度经常性收入)也会被迫失血,”前述国产AI芯片从业者补充道,“没必要。价格战带来的增量还不确定,先把自己的存量业务砍一刀,这笔账不好算。”

一个具体的案例或许能说明问题:曾尝试用“小龙虾”生成指定时间戳的GIF动图。在与一位同行交流时,对方表示:“你这里面的gif图,我们同事手工做,半分钟一张。”尽管这并非典型的生产场景,但如果制作几张GIF动图就需要花费数元,其经济性显然存疑。

———— / E N D / ————

来源:https://www.aixq.cc/16986.html
上一篇智谱AutoClaw接入微信机器人Clawbot官方教程 下一篇iPhone 18 Pro深樱桃色发布 影像续航全面升级
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿