先说一个测试过程中的小插曲。GLM 5.2 到手已经测了两天,坦白讲,有些结果已经准备好了开喷的预案。但就在准备动笔时,突然意识到这次测试忽略了一个关键的变量——ZCode。
有个例子在 Claude Code 里始终跑不出结果,换到 ZCode 环境后,不仅正常跑通了,视觉效果还相当惊人。所以一个很自然的决定顺序是:先分享 ZCode 的体验,然后全部重新测一遍。
早上刷到消息说,ZCode 新用户有 5 天免费体验,订阅用户还能享受 150% 的配额增量。这波福利倒是个不错的入手时机,干脆让大家先玩起来再说。
其实之前一直在想,智谱什么时候才会出一个类似 Codex 或 Claude 那样的智能体软件开发套件。等有人告诉我“已经有了”,才意识到自己已经落后了半拍。
打开官网后第一眼有点恍惚——怎么感觉像是自己的“Codex”界面?页面上默认展示的项目居然叫 Gomoku。不能说一模一样,但右侧那个悬浮面板的布局,实在是太像了。这类智能体程序中,Codex 名声在外,体验口碑也很好。后续出现类似产品,难免让人下意识拿来比较。不过讲真,它们的模仿水平和我比起来还是差了那么一点点——当然,这是开玩笑的。说我已经有了一个类似的东西,那是认真的。
之前还帮它们做了一个 Claude 版本:界面看起来是 Opus 4.8,但内置的其实是 GLM 5.1 模型。本来想分享 JClaude 接入 GLM 的那种丝滑手感,结果官方版已经迭代到了 3.0.0。计划赶不上变化,有些稿子写了一半就废了。印象中很早之前好像也装过一个类似名字的软件,但当时似乎是 Claude Code 的套壳版。
今天就完整地来体验一下这个“新软件”。
打开官网后首屏非常简洁,除了头部导航,就是一个软件的界面展示,底部还有一点点功能说明。目前已经支持 Windows 和 macOS 两个平台。下载安装包一看,包装设计相当帅气。安装过程也很标准,双击、下一步,几分钟就好。
装完软件后需要登录,有三种方式可选:国际版 z.ai 账号、国内版 BigModel 账号、或者直接用 API 登录。因为是国内订阅用户,选择了 BigModel 登录。登录后就到了主界面,很快弹出了一个更新提示。
这个界面结构很简单,很好理解。有意思的是,还发现了手机接入的选项——确实有点东西。不过手机接入不是今天的重点,关键还是要测试软件本身的能力。
赶紧找个例子试试深浅。
手头有一个在 Claude Code 上反复失败的测试用例:设计一个网页,要求化身复古文字冒险游戏引擎。用户输入“开始”后,生成随机主题(比如“火星殖民地生存”或“古代修仙”),每一步选择都要实时生成不重复的 ASCII 艺术插图;游戏中要嵌入隐藏的“蝴蝶效应”逻辑——如果用户第 3 步选择了“捡起石头”,第 10 步遇到怪兽时必须体现这个选择的影响;面对无理取闹的输入(比如“我一拳打爆地球”),要用幽默方式拒绝并引导回剧情,不能报错。一个无限流文字冒险游戏,融入了蝴蝶效应设计,非常烧脑。
既然官方版来了,就拿这个例子开试。使用 ZCode 很简单:先创建项目文件夹,选择目录,在左下角设置访问权限,确认右下角模型是 GLM 5.2 且思考层级已拉到最高,点击发送,然后一边吃瓜一边等结果。
等了 10 分钟还没动响,心想又没戏了。结果到第 17 分钟时,居然出结果了。官方版果然不一样——虽然等得久,但至少跑出来了。更关键的是,这个结果超帅!静态图片看不出效果,实际有加载交互动效,那种交互感是我在同类测试中见过的数一数二的点赞。印象中 GLM 的前端一直不是强项,但这次界面的交互表现很出色。
问题来了:为什么 GLM 5.2 在 ZCode 里面判若两人?这究竟是抽卡的偶然,还是实力的必然?必须继续测试。
上第二个案例——《赛博朋克版清明上河图》。这个例子比较冷门,很少有模型事先做过优化训练,非常能考验底层能力。跑了大概 10 分钟,修改文件 506 行。最终结果一出:完成度很高,布局、配色、元素设计都在中上水平。给大家一个在 Claude Code 中生成的对比效果图,差距非常明显。
ZCode 这是有什么魔法吗?为什么它出来的 UI 效果这么好?感觉判若两人。
所有测试结果今天都会更新到 TOPAI 上面。界面(UI)是一眼就能看出来的,交互(UX)则需要实际网页操作才能感受差异,而交互恰恰是最考验模型能力的地方。本文主要带大家体验 ZCode 这个软件,先不展开详细评测,重点是用起来。
接下来会把所有测试例子都搬到这里重新测一遍,重点确认两件事:一是 UI 设计是否真的有加成;二是智能体能力是否真有提升。目前刚上手,属于“蜜月期”,体验确实不错。接下来就要进入“考验期”了——测试手段可不会太温柔。
