OpenAI硬件负责人揭秘为何智能手机仍是硬件发展终点_AI热点日报

OpenAI硬件负责人揭秘为何智能手机仍是硬件发展终点

类型：热点整理2026-05-18

「你必须为模型将要去的方向设计硬件，而不是为今天的模型。」当OpenAI即将推出智能手机的详细规格与供应链信息被曝光时，行业的第一反应或许不是惊讶，而是一种“终于来了”的确认。这让人不禁想起两周前，OpenAI硬件负责人Richard Ho在斯坦福大学一场内部交流中的发言。如今看来，那场谈话几乎为

「你必须为模型将要去的方向设计硬件，而不是为今天的模型。」

当OpenAI即将推出智能手机的详细规格与供应链信息被曝光时，行业的第一反应或许不是惊讶，而是一种“终于来了”的确认。这让人不禁想起两周前，OpenAI硬件负责人Richard Ho在斯坦福大学一场内部交流中的发言。如今看来，那场谈话几乎为今天的一切埋下了伏笔。

Richard Ho来自谷歌TPU团队，他的视角从一开始就跳出了单纯的模型竞赛。在那场交流中，他从未提及“手机”二字，但勾勒出的逻辑，却清晰地指向了消费电子这个终端。

Richard Ho｜图片来源：Synopsys

模型的下一次「跃迁」，诞生自硬件

那场交流的核心议题，直指OpenAI为何必须躬身入局，亲自操刀硬件。Richard Ho反复强调一个观点：真正的瓶颈已不再是模型算法本身，而是算力、能耗、成本、延迟所构成的整个系统效能。

这绝非一句空泛的技术陈述。它意味着OpenAI的自我定位，正在从一家纯粹的模型公司，转向掌控全栈能力的系统构建者。

当前的GPU是为通用并行计算设计的，在处理推荐系统等传统任务时游刃有余。然而，面对Transformer架构、智能体（Agent）以及长上下文推理等现代AI负载，GPU的设计假设已然显得局促。尤其是智能体所需的多轮、持续、跨任务协同能力，会将系统层的低效放大数倍。用Richard Ho的原话说：“GPU把我们带到了今天，但它并不是为这种（AI负载）而设计的。”

这句话的潜台词是：如果继续完全依赖英伟达设定的硬件演进路径，OpenAI将永远无法将模型能力推向下一个量级。问题不在于GPU能否使用，而在于在能耗、成本和效率这些关键维度上，OpenAI需要主动权，而非被动跟随。

因此，这件事的本质并非“OpenAI跨界做芯片”，而是它意图重新夺回AI运算的底层控制权。Richard Ho对此澄清得非常直接：“我们不是在做一颗芯片，而是在做一个系统。”这个“系统”涵盖芯片、机架、网络、电力、散热乃至整个数据中心——其思路与谷歌当年打造TPU相似，但更强调端到端的全局掌控。

进展速度出乎许多人意料。Richard Ho透露，团队从零搭建，仅用两年时间便完成了从设计到流片（tape-out），并且已有芯片在真实工作负载中运行。他强调，这不是纸面数据，而是“已经在真实环境里work的东西”。

两年从零到流片是什么概念？传统芯片公司完成这一过程通常需要五到七年。谷歌第一代TPU耗时约三年，并且是在Jeff Dean这样的基础设施泰斗坐镇、以及谷歌内部强大工程体系支持下完成的。OpenAI能实现如此速度，背后只有两种可能：要么从苹果、谷歌、TPU团队等处挖来了大量成熟人才（事实如此），要么博通（Broadcom）这类合作伙伴在底层IP上提供了巨大支持（部分属实）。

更值得玩味的是OpenAI与硬件供应商之间的合作边界。Richard Ho谈及博通时措辞谨慎：“他们会参与IP、物理设计和封装。”紧接着他补充道，“但他们并不看到完整的架构。”很多时候，合作伙伴只了解局部模块，却看不到系统整体是如何拼合的。

这揭示了OpenAI的一个核心判断：架构设计与工程实现是两回事，前者必须牢牢掌握在自己手中。博通提供的是模块化能力和制造工艺，但系统级的设计逻辑——即“芯片如何与模型深度协同”——必须留在内部。这很像苹果做硬件的逻辑。

Richard Ho还提到一个关键点：外界看到的是模型每隔数月发布一次，但内部其实是一条连续的研发管线。“我们能看到接下来6到9个月模型会怎么变。”这句话至关重要，它意味着OpenAI的硬件团队不是在为今天的模型设计芯片，而是在为尚未诞生的未来模型进行“预备性”设计。

这种“向前看”的视角直接影响诸多具体决策：模型对内存压力的变化将决定该采用8层、12层还是16层的高带宽内存（HBM）；网络带宽需要扩展到何种程度；新的压缩算法会如何改变数据流形态；推理（inference）与训练（training）的负载比例正在快速变化（推理负担日益加重），这对硬件又提出了另一套要求。

Richard Ho将这一点总结为一句话：“你必须为模型将要去的方向设计硬件，而不是为今天的模型。”这正是OpenAI自研芯片与英伟达、AMD通用GPU的根本区别——它不是一颗用于对外销售的标准化产品，而是高度贴合自身模型演进路径、近乎定制的专用系统。从这个角度看，OpenAI更像是在走谷歌TPU的路，而非英伟达H100的路。

即便如此，硬件优化的天花板远未触及。Richard Ho并不认同“晶体管进步放缓意味着芯片红利终结”的论调。他的判断是：单颗芯片的性能提升确实在减速，但整个系统层面仍有巨大的优化空间。内存层级、网络互联、数据移动——这些才是尚未解决的大瓶颈。他举了一个具体例子：目前的高速铜缆互联在高带宽下有效传输距离仅约2米，这对数据中心布局构成了巨大限制。

简而言之，OpenAI所做的，并非仅仅让一颗芯片跑得更快，而是试图将整个AI计算系统重新优化一遍。而智能手机，正是这个庞大系统的最末端呈现。

「手机不是为 agent 设计的」

现在，让我们回到手机这个话题。Richard Ho在那场交流中的另一句话，如今看来几乎是OpenAI进军手机领域的全部理由——“手机不是为智能体（agent）设计的。”

他解释道：“今天的手机交互是基于应用（app）和会话（session）的。你打开一个应用，完成一项任务，然后关闭。但智能体需要的是持续存在、持续执行、跨任务协同。一个真正的智能体不会等待用户打开它才开始工作，它会在后台持续理解你的状态、调度任务、并与其他智能体通信。”

这种交互范式的根本性转变，直接宣告了当前的iOS和Android系统并非为其而生。这就是为什么OpenAI必须亲自下场。Richard Ho的判断是：“未来既不是纯云端，也不是纯设备端，而是两者的结合。”个人上下文、隐私数据、低延迟交互必须在设备端完成，而复杂推理则留在云端。如果一个智能体想要随时获取用户的“当下状态”，它必须在操作系统层面拥有完整的权限。

现有手机系统在满足AI时代原生用户需求面前有天然的短板｜图片来源：io

在iOS和Android上实现这一点非常困难——并非技术不可行，而是利益使然。苹果不会将系统级权限完全开放给一个第三方智能体，谷歌同样不会。

从这个角度回看，去年OpenAI收购与Jony Ive团队相关的公司io的逻辑就清晰了。Richard Ho表示，做端侧个人设备是“目前最有意思的一块”，因为这是首次将基础设施与消费电子设备真正无缝衔接。

这无疑是OpenAI硬件战略中最具想象力，也最危险的部分。其想象力在于，它正在尝试苹果当年未曾彻底完成的事：用AI智能体重写操作系统。其危险性则在于，消费电子是完全不同的游戏——涉及产品节奏、供应链管理、零售渠道、品牌建设——这些能力很难从一个云端工程师团队中自然生长出来。

不过，io的存在部分化解了这个难题。Jony Ive的使命并非设计芯片或操作系统，而是打造硬件形态与工业设计——这恰恰是苹果在过去这些年中，相对于OpenAI尚且保有优势的最后一个领域。

不是所有 AI 公司都在做同一件事

消费电子领域的难度有多大？看看过去两年其他AI公司在硬件上的尝试便可知一二。每家都想用AI重新定义某种硬件形态，但路径选择不同，结果也大相径庭。

最早的弄潮儿是Rabbit R1。2024年初的CES上，吕骋拿出那台橙色小设备，喊出“干翻所有App”的口号，试图用其LAM（大动作模型）替代手机中应用的交互方式。产品一度引发轰动，开售两周卖出5万台。

Rabbit R1是首批AI硬件中为数不多「口碑反转」的产品｜图片来源：Rabbit

然而，首批用户体验出炉后，口碑迅速反转。先是被开发者证实其系统为安卓套壳（基于AOSP修改），APK甚至能直接安装到Pixel 6a上运行。其LAM被曝依赖OpenAI的API。此外，设备续航仅约4小时，完成一次订餐操作可能需要尝试十几次。

Rabbit失败的根源并非产品质量，而是其选择的路径——它只做了一个硬件外壳，并未触及底层。芯片采用联发科Helio P35（入门手机水平），系统是改装版安卓，模型依靠第三方API。这种模式的天花板显而易见：其所实现的功能，一个手机应用都能完成，而且可能做得更好。

Meta选择了一条截然不同的道路。它的判断是不挑战手机这个成熟形态，而是让AI借助眼镜这一现有硬件融入日常生活。Ray-Ban Meta做对了几件事：与EssilorLuxottica（雷朋母公司）合作，确保产品首先是一副好眼镜——时尚、轻盈、舒适；将AI作为“附加功能”，起售价299美元；不强求所有用户都使用AI功能，先卖出一副好眼镜，AI只是增值项。

结果是成功的：Ray-Ban Meta销量突破200万副，Meta一举拿下全球智能眼镜市场超过75%的份额。然而，这条路径的边界也很清晰——Meta解决的是“AI如何进入日常”的问题，而非“AI如何重新定义计算”。眼镜只是一个配备了摄像头和麦克风的入口，它不替代手机，也无意替代。

阿里的“千问”眼镜基本是Meta路径的中国版本。产品节奏很快，逻辑清晰：千问App已拥有数亿月活用户，眼镜是将AI助手能力从手机延伸至可穿戴形态。支付宝、高德、淘宝、飞猪等阿里生态悉数接入，用户通过语音即可完成点外卖、打车、翻译等操作。芯片采用高通骁龙AR1，系统基于安卓，模型为千问。

本质上，千问眼镜是一次生态延伸，而非底层重构。其优势在于阿里生态的厚度，让眼镜成为接入阿里AI服务的一个新入口。

将这三条路径与OpenAI对比，会发现OpenAI是唯一一家尝试进行“全栈重新定义”的公司：Rabbit试图绕过应用但未触动操作系统，结果成了空中楼阁；Meta选择不挑战手机，让眼镜做配角，做出了爆款但天花板明确；千问跟随Meta的形态，将眼镜做成生态入口。而OpenAI，则试图从芯片、基础设施、能源、操作系统到终端设备，一路打通。

这完全是另一个量级的事情。

真正的护城河，不在模型层

在那场交流的最后，Richard Ho对未来竞争格局给出了一个判断：“（模型公司）不再是在芯片层赢，而是在系统层赢。”

这句话意味着，未来的AI竞争将不仅是模型能力的比拼，更是整套系统效能的较量——在同等功耗下能提供多少计算、服务多少用户、将延迟压低到何种程度。这种系统级优势，单靠模型本身是无法替代的。

站在OpenAI的立场，这是一套高度自洽的逻辑：模型团队在GPT、o系列、智能体等方向向前推进，但一旦达到某个规模，模型本身的进步就会受到基础设施瓶颈的制约。因此，OpenAI必须从一家模型公司，转变为基础设施公司，进而再成为设备公司。

这也解释了为何当被问及未来算力规模时，Richard Ho给出的数字是20GW。将OpenAI、甲骨文、软银等合作伙伴的规划相加，未来所需的算力大约相当于十几到二十座核电站的发电量。

这个数字首次听到时令人震撼。20GW已非数据中心层面能够解决的问题，它涉及国家电网与能源政策。Richard Ho自己也承认，“当你开始谈论这种规模，就必须谈论电力，甚至是国家安全。”

将“20GW算力”与“OpenAI做手机”放在一起审视，整个图景才变得清晰：一端是国家级的能源基础设施，另一端是用户口袋中的一台设备，中间则由一整套自研的芯片、系统、操作系统连接起来。OpenAI想做的，正是串联起这二者。

串联起所有的点——模型、基础设施、自研芯片、能源、边缘设备、操作系统——便会发现，OpenAI做手机并非一个孤立的决策，而是其既定发展路径自然衍生的结果。

手机只是第一个被外界清晰看到的形态。但真正的变革发生在更底层：计算范式正在从“以应用为中心”转向“以智能体为中心”。

一旦默认入口变为智能体，今天的设备、芯片、操作系统，都将被重新定义一次。

在这场重新定义中，OpenAI将不再只是一家制作模型的公司。

*头图来源：AI 生成

来源：https://www.163.com/dy/article/KRKKCMMM05119FMA.html

OpenAI

延伸阅读

补充最近整理过的热点入口。