游乐游手机版
首页/AI热点日报/热点详情

Codex为何不推出类似Codex Design的产品

类型:热点整理2026-07-05
ClaudeDesign能生成高精度可交互原型,关键在于模型层具备UI UX设计和系统架构设计能力。Codex未推出类似产品,根本原因是GPT-5 5模型能力不足,无法在生成前完整规划数据结构、状态管理与交互逻辑。

在诸多Agent产品里,Anthropic的Claude Design是我近期使用频率最高的一个,尤其在编程之外的场景中。效果确实很惊艳:你只需要用一句话描述想要的App,它就能直接生成一个可交互的原型,点哪儿都有反馈,不仔细看的话,几乎以为是在操作一个真实的App。

有读者问:为什么Codex迟迟不推出类似Codex Design的产品?

答案其实很直接——GPT-5.5的模型能力还扛不住这个活儿。但要解释清楚背后的逻辑,得先理解一个关键的区分。

Agent的两层:模型与Harness

很多人把Codex、Claude Design和GPT-5.5、Claude Opus 4.8混为一谈,实际上它们是完全不同的两个层面。

Claude Design和Codex属于“产品层”,行业里称之为Harness,包括提示词、工具链、UI交互流程等工程层面的建设。而Claude Opus 4.8和GPT-5.5是“模型层”,是真正干活的大脑。

打个比方:Harness是厨房,里面摆着锅碗瓢盆(工具)和菜谱(Skills),而模型是厨师。同一间厨房,换个厨师,做出来的菜天差地别。

理解了这一点,后面的逻辑就顺了。

Harness不是真正的门槛

坦白说,Claude Design的Harness层在技术上并不复杂。花点心思逆向分析一下,提示词、工具代码几乎都能拿到手。已经有实践验证了这一点——借助Skill可以把Claude Design在其他模型上跑起来。工程层面没什么秘密。

真正拉开差距的,是背后的模型。

高精度可交互原型,难在模型

“Claude Design”这个名字容易让人误解,以为它交付的是Figma、Photoshop那样的静态设计图。实际上,它交付的东西比Figma更进一步:是融合了设计稿和原型的高精度可交互原型——你不仅能看见设计,还能直接上手操作。

这件事对模型的要求相当高。

举个例子。假设我想做一个类似X/微博的客户端。让模型画一个好看的静态界面,很多模型都能做到。但要让这个界面变得可交互,复杂度就一下子升上去了:切换不同的Timeline,展示不同类型的推文(文本、图片、视频),点赞要变成红心,删除推文要从列表里消失,从列表点进详情再返回,状态还得保持住。

要做到这些,模型必须在动手画UI之前,先把整套数据结构和状态管理想清楚:tweet长什么样、timeline有哪几种、每个按钮当前是什么状态、状态之间怎么联动。这已经不是画UI的活儿了,而是系统架构设计的活。

Claude Design对模型的要求,是同时具备优秀的UI/UX设计能力和系统架构设计能力,缺一个效果就大打折扣。这也是为什么之前一直反对只产出纯HTML的设计稿——那只是静态的UI设计,没有融合UX交互。

有条件的话,可以自己测试对比一下。比如用这个提示词:

Design a X Client for Mac, similar to Tweetbot for Mac from Tapbots

同样的提示词让Codex去做,也能出个东西,能看,也能简单交互。但一对比就能看出差距:列表能滚动,但sidebar点不了;点赞按钮没反应。来回迭代好几轮,才能勉强凑合。

而Claude Design做出来的效果完全不同。从Timeline切到通知页,从列表点进详情再返回,全程流畅,状态都能保持住。不仔细看,真以为在操作一个完成度很高的App——虽然数据都是模拟的。

显然,Claude Opus 4.8在设计和架构这类场景上做了大量针对性的训练和优化。

产出物就是代码

如果你仔细看过Claude Design的产出物,会注意到其中的data.jsx文件。它将整个设计的数据结构定义得极为清晰,并基于这个结构模拟了一套完整数据,然后用React在这套数据上构建UI。

设计产物本身就是代码(React、CSS、JSON),不是Figma或PSD。任何开发者拿到手,都能直接看出按钮的圆角、主色、间距,照着自己的技术栈实现就行。后续设计要变更?git diff一看就知道改了什么。设计和开发之间的沟通损耗被降到了最低。

说得准确一点,是设计Agent和开发Agent之间的沟通损耗被降到了最低。现在都是人在指挥Agent去设计,然后指挥Agent去写代码。

怎么用好Claude Design

很多人不知道该怎么用好它。其实有点像Vibe Coding:有个基本的想法,先让它做一个版本出来,然后通过对话去指挥Agent帮你改。调整几个版本,思路就清晰了。

整个调整的过程很神奇,有种“言出法随”的感觉——你想让它怎么改,它总能给你实现出来。这也是为什么现在对Claude Design越来越痴迷,反馈来得太快、太过瘾了。

还有一个小技巧:不要说太具体的要求,而是说出你的目标是什么,让它自由发挥。往往能得到更好的效果——毕竟它训练过几乎所有公开的UI设计。

回到最初的问题。Codex不推类似的设计产品,根本原因在于GPT-5.5还扛不住这个活儿。画个好看的界面很多模型都能做到,真正的难点在于动手之前,把数据结构、状态管理、交互逻辑都想清楚,然后一次性的交付一个完整的可交互原型。

目前只有Claude的模型做到了这一点。至于能领先多久,就取决于OpenAI或者其他家后面模型的进化速度了。

来源:https://www.bestblogs.dev/article/c3e760eb?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。