OpenAI硬件负责人揭秘为何智能手机仍是硬件发展终点

「你必须为模型将要去的方向设计硬件,而不是为今天的模型。」
当OpenAI即将推出智能手机的详细规格与供应链信息被曝光时,行业的第一反应或许不是惊讶,而是一种“终于来了”的确认。这让人不禁想起两周前,OpenAI硬件负责人Richard Ho在斯坦福大学一场内部交流中的发言。如今看来,那场谈话几乎为今天的一切埋下了伏笔。
Richard Ho来自谷歌TPU团队,他的视角从一开始就跳出了单纯的模型竞赛。在那场交流中,他从未提及“手机”二字,但勾勒出的逻辑,却清晰地指向了消费电子这个终端。

Richard Ho|图片来源:Synopsys
模型的下一次「跃迁」,诞生自硬件
那场交流的核心议题,直指OpenAI为何必须躬身入局,亲自操刀硬件。Richard Ho反复强调一个观点:真正的瓶颈已不再是模型算法本身,而是算力、能耗、成本、延迟所构成的整个系统效能。
这绝非一句空泛的技术陈述。它意味着OpenAI的自我定位,正在从一家纯粹的模型公司,转向掌控全栈能力的系统构建者。
当前的GPU是为通用并行计算设计的,在处理推荐系统等传统任务时游刃有余。然而,面对Transformer架构、智能体(Agent)以及长上下文推理等现代AI负载,GPU的设计假设已然显得局促。尤其是智能体所需的多轮、持续、跨任务协同能力,会将系统层的低效放大数倍。用Richard Ho的原话说:“GPU把我们带到了今天,但它并不是为这种(AI负载)而设计的。”
这句话的潜台词是:如果继续完全依赖英伟达设定的硬件演进路径,OpenAI将永远无法将模型能力推向下一个量级。问题不在于GPU能否使用,而在于在能耗、成本和效率这些关键维度上,OpenAI需要主动权,而非被动跟随。
因此,这件事的本质并非“OpenAI跨界做芯片”,而是它意图重新夺回AI运算的底层控制权。Richard Ho对此澄清得非常直接:“我们不是在做一颗芯片,而是在做一个系统。”这个“系统”涵盖芯片、机架、网络、电力、散热乃至整个数据中心——其思路与谷歌当年打造TPU相似,但更强调端到端的全局掌控。
进展速度出乎许多人意料。Richard Ho透露,团队从零搭建,仅用两年时间便完成了从设计到流片(tape-out),并且已有芯片在真实工作负载中运行。他强调,这不是纸面数据,而是“已经在真实环境里work的东西”。
两年从零到流片是什么概念?传统芯片公司完成这一过程通常需要五到七年。谷歌第一代TPU耗时约三年,并且是在Jeff Dean这样的基础设施泰斗坐镇、以及谷歌内部强大工程体系支持下完成的。OpenAI能实现如此速度,背后只有两种可能:要么从苹果、谷歌、TPU团队等处挖来了大量成熟人才(事实如此),要么博通(Broadcom)这类合作伙伴在底层IP上提供了巨大支持(部分属实)。
更值得玩味的是OpenAI与硬件供应商之间的合作边界。Richard Ho谈及博通时措辞谨慎:“他们会参与IP、物理设计和封装。”紧接着他补充道,“但他们并不看到完整的架构。”很多时候,合作伙伴只了解局部模块,却看不到系统整体是如何拼合的。
这揭示了OpenAI的一个核心判断:架构设计与工程实现是两回事,前者必须牢牢掌握在自己手中。博通提供的是模块化能力和制造工艺,但系统级的设计逻辑——即“芯片如何与模型深度协同”——必须留在内部。这很像苹果做硬件的逻辑。
Richard Ho还提到一个关键点:外界看到的是模型每隔数月发布一次,但内部其实是一条连续的研发管线。“我们能看到接下来6到9个月模型会怎么变。”这句话至关重要,它意味着OpenAI的硬件团队不是在为今天的模型设计芯片,而是在为尚未诞生的未来模型进行“预备性”设计。
这种“向前看”的视角直接影响诸多具体决策:模型对内存压力的变化将决定该采用8层、12层还是16层的高带宽内存(HBM);网络带宽需要扩展到何种程度;新的压缩算法会如何改变数据流形态;推理(inference)与训练(training)的负载比例正在快速变化(推理负担日益加重),这对硬件又提出了另一套要求。
Richard Ho将这一点总结为一句话:“你必须为模型将要去的方向设计硬件,而不是为今天的模型。”这正是OpenAI自研芯片与英伟达、AMD通用GPU的根本区别——它不是一颗用于对外销售的标准化产品,而是高度贴合自身模型演进路径、近乎定制的专用系统。从这个角度看,OpenAI更像是在走谷歌TPU的路,而非英伟达H100的路。
即便如此,硬件优化的天花板远未触及。Richard Ho并不认同“晶体管进步放缓意味着芯片红利终结”的论调。他的判断是:单颗芯片的性能提升确实在减速,但整个系统层面仍有巨大的优化空间。内存层级、网络互联、数据移动——这些才是尚未解决的大瓶颈。他举了一个具体例子:目前的高速铜缆互联在高带宽下有效传输距离仅约2米,这对数据中心布局构成了巨大限制。
简而言之,OpenAI所做的,并非仅仅让一颗芯片跑得更快,而是试图将整个AI计算系统重新优化一遍。而智能手机,正是这个庞大系统的最末端呈现。
「手机不是为 agent 设计的」
现在,让我们回到手机这个话题。Richard Ho在那场交流中的另一句话,如今看来几乎是OpenAI进军手机领域的全部理由——“手机不是为智能体(agent)设计的。”
他解释道:“今天的手机交互是基于应用(app)和会话(session)的。你打开一个应用,完成一项任务,然后关闭。但智能体需要的是持续存在、持续执行、跨任务协同。一个真正的智能体不会等待用户打开它才开始工作,它会在后台持续理解你的状态、调度任务、并与其他智能体通信。”
这种交互范式的根本性转变,直接宣告了当前的iOS和Android系统并非为其而生。这就是为什么OpenAI必须亲自下场。Richard Ho的判断是:“未来既不是纯云端,也不是纯设备端,而是两者的结合。”个人上下文、隐私数据、低延迟交互必须在设备端完成,而复杂推理则留在云端。如果一个智能体想要随时获取用户的“当下状态”,它必须在操作系统层面拥有完整的权限。

现有手机系统在满足AI时代原生用户需求面前有天然的短板|图片来源:io
在iOS和Android上实现这一点非常困难——并非技术不可行,而是利益使然。苹果不会将系统级权限完全开放给一个第三方智能体,谷歌同样不会。
从这个角度回看,去年OpenAI收购与Jony Ive团队相关的公司io的逻辑就清晰了。Richard Ho表示,做端侧个人设备是“目前最有意思的一块”,因为这是首次将基础设施与消费电子设备真正无缝衔接。
这无疑是OpenAI硬件战略中最具想象力,也最危险的部分。其想象力在于,它正在尝试苹果当年未曾彻底完成的事:用AI智能体重写操作系统。其危险性则在于,消费电子是完全不同的游戏——涉及产品节奏、供应链管理、零售渠道、品牌建设——这些能力很难从一个云端工程师团队中自然生长出来。
不过,io的存在部分化解了这个难题。Jony Ive的使命并非设计芯片或操作系统,而是打造硬件形态与工业设计——这恰恰是苹果在过去这些年中,相对于OpenAI尚且保有优势的最后一个领域。
不是所有 AI 公司都在做同一件事
消费电子领域的难度有多大?看看过去两年其他AI公司在硬件上的尝试便可知一二。每家都想用AI重新定义某种硬件形态,但路径选择不同,结果也大相径庭。
最早的弄潮儿是Rabbit R1。2024年初的CES上,吕骋拿出那台橙色小设备,喊出“干翻所有App”的口号,试图用其LAM(大动作模型)替代手机中应用的交互方式。产品一度引发轰动,开售两周卖出5万台。

Rabbit R1是首批AI硬件中为数不多「口碑反转」的产品|图片来源:Rabbit
然而,首批用户体验出炉后,口碑迅速反转。先是被开发者证实其系统为安卓套壳(基于AOSP修改),APK甚至能直接安装到Pixel 6a上运行。其LAM被曝依赖OpenAI的API。此外,设备续航仅约4小时,完成一次订餐操作可能需要尝试十几次。
Rabbit失败的根源并非产品质量,而是其选择的路径——它只做了一个硬件外壳,并未触及底层。芯片采用联发科Helio P35(入门手机水平),系统是改装版安卓,模型依靠第三方API。这种模式的天花板显而易见:其所实现的功能,一个手机应用都能完成,而且可能做得更好。
Meta选择了一条截然不同的道路。它的判断是不挑战手机这个成熟形态,而是让AI借助眼镜这一现有硬件融入日常生活。Ray-Ban Meta做对了几件事:与EssilorLuxottica(雷朋母公司)合作,确保产品首先是一副好眼镜——时尚、轻盈、舒适;将AI作为“附加功能”,起售价299美元;不强求所有用户都使用AI功能,先卖出一副好眼镜,AI只是增值项。
结果是成功的:Ray-Ban Meta销量突破200万副,Meta一举拿下全球智能眼镜市场超过75%的份额。然而,这条路径的边界也很清晰——Meta解决的是“AI如何进入日常”的问题,而非“AI如何重新定义计算”。眼镜只是一个配备了摄像头和麦克风的入口,它不替代手机,也无意替代。
阿里的“千问”眼镜基本是Meta路径的中国版本。产品节奏很快,逻辑清晰:千问App已拥有数亿月活用户,眼镜是将AI助手能力从手机延伸至可穿戴形态。支付宝、高德、淘宝、飞猪等阿里生态悉数接入,用户通过语音即可完成点外卖、打车、翻译等操作。芯片采用高通骁龙AR1,系统基于安卓,模型为千问。
本质上,千问眼镜是一次生态延伸,而非底层重构。其优势在于阿里生态的厚度,让眼镜成为接入阿里AI服务的一个新入口。
将这三条路径与OpenAI对比,会发现OpenAI是唯一一家尝试进行“全栈重新定义”的公司:Rabbit试图绕过应用但未触动操作系统,结果成了空中楼阁;Meta选择不挑战手机,让眼镜做配角,做出了爆款但天花板明确;千问跟随Meta的形态,将眼镜做成生态入口。而OpenAI,则试图从芯片、基础设施、能源、操作系统到终端设备,一路打通。
这完全是另一个量级的事情。
真正的护城河,不在模型层
在那场交流的最后,Richard Ho对未来竞争格局给出了一个判断:“(模型公司)不再是在芯片层赢,而是在系统层赢。”
这句话意味着,未来的AI竞争将不仅是模型能力的比拼,更是整套系统效能的较量——在同等功耗下能提供多少计算、服务多少用户、将延迟压低到何种程度。这种系统级优势,单靠模型本身是无法替代的。
站在OpenAI的立场,这是一套高度自洽的逻辑:模型团队在GPT、o系列、智能体等方向向前推进,但一旦达到某个规模,模型本身的进步就会受到基础设施瓶颈的制约。因此,OpenAI必须从一家模型公司,转变为基础设施公司,进而再成为设备公司。
这也解释了为何当被问及未来算力规模时,Richard Ho给出的数字是20GW。将OpenAI、甲骨文、软银等合作伙伴的规划相加,未来所需的算力大约相当于十几到二十座核电站的发电量。
这个数字首次听到时令人震撼。20GW已非数据中心层面能够解决的问题,它涉及国家电网与能源政策。Richard Ho自己也承认,“当你开始谈论这种规模,就必须谈论电力,甚至是国家安全。”
将“20GW算力”与“OpenAI做手机”放在一起审视,整个图景才变得清晰:一端是国家级的能源基础设施,另一端是用户口袋中的一台设备,中间则由一整套自研的芯片、系统、操作系统连接起来。OpenAI想做的,正是串联起这二者。
串联起所有的点——模型、基础设施、自研芯片、能源、边缘设备、操作系统——便会发现,OpenAI做手机并非一个孤立的决策,而是其既定发展路径自然衍生的结果。
手机只是第一个被外界清晰看到的形态。但真正的变革发生在更底层:计算范式正在从“以应用为中心”转向“以智能体为中心”。
一旦默认入口变为智能体,今天的设备、芯片、操作系统,都将被重新定义一次。
在这场重新定义中,OpenAI将不再只是一家制作模型的公司。
*头图来源:AI 生成
相关攻略
就在昨天,ChatGPT官方发布了一张颇具太空感的预热图片。 画面里,一个发光的ChatGPT输入框正从月球的地平线上缓缓升起。细看之下,不少朋友应该已经发现了变化:聊天框里的提示语,已经从我们熟悉的“Ask ChatGPT”悄悄变成了“Message ChatGPT”。 紧接着,OpenAI的首席
一则来自供应链的消息,让AI硬件领域的未来图景变得更加清晰。天风国际证券分析师郭明錤在4月27日发布的报告中透露,OpenAI正在积极推进智能手机芯片项目,计划与高通、联发科联合开发专用处理器,并选定立讯精密作为独家系统联合设计与制造伙伴。整个项目的目标,是瞄准2028年实现量产。 OpenAI为何
科技行业的竞争格局正在经历深刻重塑,一场新的风暴似乎已悄然酝酿。近日,前苹果公司CEO约翰·斯卡利在接受福克斯商业频道专访时,提出了一个极具洞察力的观点:OpenAI已成为苹果多年来面临的最严峻竞争威胁。这一判断可能标志着,苹果在科技领域长期保持的主导地位,正站在一个历史性的转折点上。 斯卡利对此给
最近科技圈有个消息挺值得玩味的。据《华尔街日报》报道,被视为行业风向标的OpenAI,其用户扩张和收入增长双双未达内部预期,这让管理层对未来的发展路径产生了不小的忧虑。 具体来看,OpenAI去年底设定的一个关键目标——将ChatGPT的周活跃用户数推高至10亿——没能实现。这个进展放缓的信号,也让
「你必须为模型将要去的方向设计硬件,而不是为今天的模型。」 当OpenAI即将推出智能手机的详细规格与供应链信息被曝光时,行业的第一反应或许不是惊讶,而是一种“终于来了”的确认。这让人不禁想起两周前,OpenAI硬件负责人Richard Ho在斯坦福大学一场内部交流中的发言。如今看来,那场谈话几乎为
热门专题
热门推荐
微星PRO MAX系列ATX 3 1全模组电源现已于京东平台全面上市。该系列精心规划了850W、1000W与1200W三档功率规格,全线产品均严格通过80PLUS白金能效认证,为用户带来高效节能的供电体验。首发期间,850W版本售价579元,1000W版本679元,1200W版本799元,参与晒单活
行业首款集成视觉能力的AI智能耳机即将面世。光帆科技近日正式宣布,其创新产品“光帆全感AI耳机”定于5月15日全面发售。这款耳机以“全感知、主动式、个性化”为核心定位,旨在彻底革新用户与可穿戴音频设备之间的交互模式。 本质上,它颠覆了传统耳机的被动响应模式。根据官方介绍,这款AI耳机能够主动感知并理
止损是交易中控制风险的关键手段,在币安等交易平台设置止损时,主要参考市场波动率、技术分析关键位以及个人风险承受能力。合理的止损应基于对价格走势的客观判断,而非情绪化决策,同时需结合仓位管理,避免因单次止损过大而影响整体资金安全。动态调整止损位以适应市场变化,是提升交易纪律性的重要环节。
过去两年,要问大模型最习惯用什么格式交付内容,答案多半是Markdown。 原因不难理解:Markdown足够干净,没有冗余格式,复制到文档、知识库、GitHub,甚至直接粘贴到微信公众号后台,基本都不会出问题。某种程度上,它已经被公认为AI时代最理想的标记语言。 不过,随着Agent时代的到来,M
距离2026-2027年度旗舰手机的大幕拉开,大约还有四个月时间。按照惯例,届时在全球舞台上率先亮相的主流旗舰,很可能依然是苹果的iPhone 18 Pro系列。 就在昨天(5月8日),知名爆料人Jon Prosser发布了iPhone 18 Pro Max的视频渲染图,与此同时,关于该系列手机的七





