3月6日消息,2026年初引爆行业的AI助手OpenClaw,因其标志性的“小龙虾”昵称而备受关注,这款AI能够实现7x24小时不间断工作,功能丰富多样,然而其高昂的Token消耗让许多用户直呼“烧不起”。
这也是近两个月国产大模型调用量超越谷歌、OpenAI和Anthropic的重要原因——尽管它们的Koken费用比国外便宜不少,但整体成本依然偏高,要想真正解决这一问题,仍需大幅降低运营成本。
国产GPU初创企业云天励飞的董事长兼CEO陈宁日前提出一个新观点,他认为未来5到10年,全球AI竞争的重点将从过去十年的“谁更聪明”转向“谁能推动AI应用大规模落地”。
目前AI应用落地的瓶颈在于成本,Token费用成为像OpenClaw这类智能体普及的关键难点。云天励飞的目标是通过多种方式,在未来五年内将成本降低至目前的百万分之一,到2030年实现每百亿Token仅需1分钱。
关于云天励飞如何实现这一目标的具体细节尚未公布,不过该公司今年初发布了新一代GPU路线图,计划推出GPNPU芯片,其名称融合了GPU与NPU的双重特性,可兼容CUDA,仅需一行代码即可完成从GPU到国产芯片的部署迁移。
在产品设计上,他们采用了prefill与decode分离的系统架构,P芯片侧重密集型计算,D芯片侧重高带宽存储,以此实现极致的推理效率与性价比。
其GPNPU芯片还将支持多芯片协同的超节点架构,其中2026年将推出第一代超节点P芯片,算力对标英伟达Hopper架构芯片;2027年计划推出第一代超节点D芯片,主打超低时延推理,性能对标英伟达Blackwell架构芯片。
而2028年的第二代超节点D芯片将直接对标英伟达Rubin芯片,有望实现毫秒级推理时延。

