游乐游手机版
首页/科技数码/文章详情

AI算力成本走低,日本推出前沿编排新模型

时间:2026-06-23 11:12
人工智能基础设施市场出现服务器租赁成本下行与Token支出增速趋稳两个信号。日本Sakana推出编排框架Fugu,通过协调多个前沿模型超越Claude和GPT-5 5,挑战暴力扩参路线。开源模型能力提升且成本显著降低,但激励机制仍指向更多资本支出。

人工智能基础设施市场正在同步出现两个新信号:服务器租赁成本持续下行,算力Token支出增速趋于稳定。这两个信号共同指向AI领域一个核心命题——AI成本下降,究竟是催生更多需求,还是侵蚀现有定价能力?

日本AI实验室Sakana推出碘伏性“编排”框架模型Fugu,以协调多个前沿模型取代暴力扩参路线,在主流基准测试中超越Claude和GPT-5.5。Sakana Fugu在SWE-Bench Pro测试中得分73.7,超越Claude Opus 4.8的69.2和GPT-5.5的58.6。Fugu并非单一大模型,而是一个动态调度器——通过单次API调用,决定将任务的不同部分路由至最适配的前沿模型并行处理,最终整合输出优于任何单一模型的结果。


高盛1-Delta台席负责人Rich Privorotsky将计算资源租赁价格视为追踪AI硬件投资逻辑是否成立的核心指标:市场的核心前提是算力稀缺;若供给上升导致租赁价格持续下行,将直接挑战稀缺性叙事。目前,服务器租赁成本已呈现明显下行走势。但Privorotsky同时指出,在Token支出格局发生根本性转变之前,硬件板块的交易逻辑料将延续。半导体ETF上周录得异常高的资金流入,印证了市场当前的定位偏好。他表示,超大规模云计算商的价格动向将日益成为关键观察点,本周的市场焦点更多将落在美光财报数据上,而非PCE。

Fugu:编排驱动的前沿级性能

Sakana是一家总部位于东京的AI实验室,其联合创始人之一参与撰写了原始Transformer论文。Sakana推出的Fugu框架碘伏了当下行业主流的“暴力扩参”逻辑。作为一个协调器,Fugu在接收单次API请求后,动态决策将任务的不同部分分配给不同前沿模型并行处理,最终输出一个优于任何单一模型独立作答的结果。

Rich Privorotsky将这一方法概括为通过“模型编排与融合”而非暴力扩参来实现前沿级性能。这一方法论若得到更广泛验证,将对算力军备竞赛的底层逻辑构成挑战——因为其性能增益并不依赖于更多的训练算力投入。

在出口管制风险日益上升的背景下,Fugu的模型池支持动态替换,赋予其额外的战略韧性:若某一提供商因管制受限,框架可自动绕开切换,降低供应链单点风险。这一特性使其在地缘博弈加剧的环境下具有独特的架构优势。

开源追赶加速,Token成本压缩深化

智谱发布的GLM-5.2在FrontierSWE长程编程基准上得分74.4,与Anthropic顶级模型Opus 4.8的75.1仅差约1个百分点,同时超越GPT-5.5的72.6,成为目前评分最高的开源权重模型,定价比Opus 4.8低约72%至82%。

Privorotsky指出,开源与闭源模型之间的差距正持续收窄。GLM-5.2采用MIT许可证,支持权重开放、模型蒸馏、量化与复现,代表能力的重大跃升,是该领域差距加速收窄的清晰信号。

随着能力更强的开源模型不断涌现,Token成本压缩进程正在加速。然而,Privorotsky强调,当前的激励机制仍指向更多资本支出而非更少。


服务器租赁价格:算力稀缺叙事的晴雨表

在Privorotsky的分析框架中,计算资源租赁价格是观察AI硬件投资逻辑是否成立的核心变量。其逻辑链条清晰:若算力稀缺持续,价格应保持坚挺,从而为持续的资本支出提供正当性;反之,若供给上升导致租赁价格持续下行,将直接挑战稀缺性叙事,且“最先承压的是硬件”。

目前,服务器租赁成本已呈下行走势。Sakana Fugu此类编排框架的出现,或许正与这一趋势相互印证——通过更高效的资源调度而非单纯堆砌算力来提升性能,从技术层面折射出供给扩张的现实。

Privorotsky表示,市场注意力将越来越多地转向超大规模云计算商的价格动向,一旦后者释放战略调整信号,AI投资周期的底层逻辑将面临重新评估。


来源:https://www.163.com/dy/article/L035ANKC05198NMR.html
上一篇电摩闯入S2沪芦高速压导流线占应急车道疾驰引担忧 下一篇第五代宝马X5将于6月30日首发 燃油插混纯电动力配置曝光
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。