游乐游手机版
首页/业界动态/文章详情

OpenAI研发高效推理方案 降低模型运行成本50%

时间:2026-07-01 12:22
你可能会觉得,大模型的推理成本这两年已经降了不少,但接下来这个消息,恐怕会让你重新定义“便宜”这个词。据知情人士透露,就在本月初,OpenAI的工程师向团队内部汇报了一项重要进展——依托多项全新研发的优化技术,他们成功找到了一套能将模型推理成本直接砍掉一半以上的方案。别小看这个数字,在大模型大规模部

你可能会觉得,大模型的推理成本这两年已经降了不少,但接下来这个消息,恐怕会让你重新定义“便宜”这个词。

据知情人士透露,就在本月初,OpenAI的工程师向团队内部汇报了一项重要进展——依托多项全新研发的优化技术,他们成功找到了一套能将模型推理成本直接砍掉一半以上的方案。别小看这个数字,在大模型大规模部署的当下,成本每降一个百分点,都意味着商业模型和竞争格局的剧烈变化。

更具体的场景是:当这套技术被应用到无免费或付费账户的访客ChatGPT使用场景后,过去需要大量英伟达GPU来支撑的繁重推理任务,竟然一度被压缩到只需要数百块GPU就能搞定。效率提升有多显著,可见一斑。

说到这里,就不得不提另一个重磅消息——OpenAI与博通联合研发的ASIC芯片项目,代号“墨西哥胡椒”。这颗芯片完全是从零开始、针对大模型推理而设计的。当专用芯片彻底摆脱通用GPU架构的束缚时,带来的就不再是温和的升级,而是实质性的重构。据透露,仅靠这颗芯片,推理成本最高可以直接再降一半。

当然,硬件突破从来不是孤立事件。随着头部AI厂商开始掌握自主算力源头,对英伟达GPU的依赖正在逐步减少。曾经由通用硬件的产能与定价权构成的制约,正在被一一打破。这意味着,整个AI生态的话语权,正在静悄悄地发生转移——谁掌握算力底座,谁就掌握未来。

OpenAI研发高效推理方案:模型运行成本降低50%

来源:https://m.mydrivers.com/newsview/1133207.html
上一篇比亚迪海豹08双动力纯电插混标配闪充7月2日上市 下一篇电动汽车新国标今起实施 史上最严首次引入物理一键断电
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
西伯利亚获评中国FPS游戏耳机领导品牌 权威背书引领行业
业界动态 · 2026-07-01

西伯利亚获评中国FPS游戏耳机领导品牌 权威背书引领行业

首先来看一个最新动态:在FPS电竞耳机赛道中,又一位实力“老将”获得了国家级权威认可。深耕游戏外设领域长达14年的西伯利亚,近日正式被新华社旗下头豹研究院授予“中国FPS游戏耳机领导品牌”称号,并得到新华社中国名牌的媒体支持。这一来自国家级媒体的背书,不仅是一份极高的荣誉,更是对其技术积累与市场表现

三星Z Fold 8双层超薄玻璃技术打造无折痕
业界动态 · 2026-07-01

三星Z Fold 8双层超薄玻璃技术打造无折痕

苹果那款据说倾注了全部心血的折叠屏iPhone还没正式亮相,三星这边已经明显感受到了压力。来自韩媒的消息显示,三星很可能会在下一代Galaxy Z Fold 8的显示屏上下两层都采用超薄玻璃(UTG)——这么做,能把那条让人头疼的折痕减少至少20%,无限逼近“完全无痕”的效果。其实在刚结束的CES

AI芯片技术双轨演进从通用架构到领域专用并行
业界动态 · 2026-07-01

AI芯片技术双轨演进从通用架构到领域专用并行

指令集优化与电路级重构协同塑造智能计算新生态 【导语】先说几个核心判断:2026年AI芯片的演进,其实是在两个完全不同的技术层次上同时发生的。一方面,AI算法正从实验室走向大规模工程化,另一方面,计算负载本身呈现出“算力需求激增”与“应用形态高度分化”并存的奇特局面。传统通用处理器的老路,在性能功耗

OpenAI无线耳机搭载三星2纳米Exynos芯片 自研Titan年底问世
业界动态 · 2026-07-01

OpenAI无线耳机搭载三星2纳米Exynos芯片 自研Titan年底问世

OpenAI最近动作频频,目标已经非常明确:围绕其AI订阅服务,打造一个庞大的硬件生态系统,把用户牢牢锁定在自家闭环里。从GPT级别的AI模型、专用AI芯片,到一系列消费级设备,这个版图正在迅速铺开。先说耳机。据最新爆料,OpenAI正在研发一款内部代号Sweetpea的专用人工智能耳机。虽然具体细

闪极科技AI眼镜主打佩戴体验 开启智能实用新时代
业界动态 · 2026-07-01

闪极科技AI眼镜主打佩戴体验 开启智能实用新时代

2025年,AI眼镜赛道持续升温,各大厂商纷纷入局。在这场智能穿戴的浪潮中,闪极科技的动作尤为引人瞩目——一口气推出loomos AI拍摄眼镜L1与AI显示眼镜S1两大系列,精准瞄准行业痛点。这一次,闪极并未在传统的“墨镜+摄像头”路线上小修小补,而是从佩戴结构与底层逻辑入手,进行了一次系统性重塑。