字节这波 Seed 2.1 Pro 的发布,确实引起了不小关注。很多人都在问怎么用上这个新模型——目前来看,最直接的方式就是通过它们自家的 Trae Work,而且上面是免费开放的。既然如此,不如就把 Work 这个工具好好盘一盘。
最近 Codex 那边似乎安静了不少,反倒是国内类似产品开始轮番登场。之前我们聊过智谱版的 ZCode,今天就来体验一下字节版的“Codex”——也就是 Trae Work,顺便看看它背后的豆包 Seed 2.1 Pro 模型表现如何。
重点先说清楚:Work 平台上所有模型目前都是免费使用的。昨天白天还排着上千人的队,到了晚上 3.1 Pro 就解锁了,而且跑起来非常丝滑——同时跑几个项目完全没问题。
下面直接进入正题。
去官网下载安装包,双击启动,一路 Next 就行。
安装完成后长这样:
Trae Work 的路线很明显对标 Codex,同时也借鉴了 Claude 的界面结构。它把主要功能分成了办公(Work)和编程(Code)两种模式,还支持手机远程控制。该有的通用智能体功能一个不少,字节的产品体验向来没得说——单论软件的丝滑程度,在国内绝对是第一梯队。
下面分三块来呈现这个软件:手机远程、办公 Work 和 Code。
1. 手机远程
虽然一年可能也用不上几次,但这类远程功能就是让人着迷。大致体验了一下,确实非常丝滑,尤其是对话同步这块。Codex 还需要多端科学上网,而 Trae Work 裸奔即可,用起来灵活得多。
装好手机版之后,几乎可以做到无感同步:
桌面版上有一个远程配置入口,点击后弹出配置界面:
其实不用配置什么,主要是开启控制权:
这一步只有两个选项:允许移动端控制设备,以及保持电脑唤醒状态。通常全部启用,PC 常年不关机。现在的笔记本合上盖子也没问题。
点击完成,所有对话、进度就会实时同步:
同步做得非常丝滑——消息通知、任务列表、详细对话信息全部无缝同步。
相比 ZCode,Trae Work 明显更偏向大众化,体验更友好;而 ZCode 更专业,面向开发者。之前远程工具主要用 GPT 手机版和 Claude 手机版,体验不错,但国产手机和 Windows 配合起来有些麻烦。现在用 Mate 手机、Windows 走 Trae 这条线就很方便了。
2. 办公 Work
随着模型能力增强,这类智能体早已不限于程序员。大家都在从 Coding Agent 转向 Work Agent,抢占打工人的市场。字节正在猛推它的 Work 功能——软件名字就叫 Trae Work。
下面来看看这个 Work 到底怎么样,都能干点啥。
打开软件后默认就在 Work 状态,界面极其简洁:一个输入框。右下角可以选模型,默认是 auto 模式,也可以手动切换到最新的 Seed 2.1 Pro。底部给了 4 个常见用例,今天逐个试一遍。
刚用的时候 2.1 版本还锁着,所以先用 auto 模式跑,效果如下。
第一个例子是“网页读取”:
执行时间和结果:
最终交付的是一个网页,点击即可查看:
页面做得不错,图文并茂。关键一点是它能自动根据上下文生成合适的图片——字节在多模态、图片和视频生成上都是国内顶级的,所以 Work 功能自然就比对手高出一个段位。类似 Codex 自带自家顶级图片生成能力一样,会直接领先。
第二个例子是“调研分析”:
点击用例直接发送:
这个任务耗时 13 分钟,生成了一个 21 页的 PPT:
包含了大量可视化元素:ECharts 柱状图(中国平台 MAU 对比)、雷达图(用户画像五维对比)、饼图(商业化收入结构)、数据对比表格(平台画像、算法机制、海外对比),以及 AI 生成的专业背景图(封面、章节分隔页)。
这是字节最擅长的领域,加上官方演示,效果自然惊艳。报告以网页 PPT 方式展示,思路清晰,角度全面,数据丰富,图文并茂。如果所有领域都能达到这个水准,那就真的很 Work 了。
第三个例子是“数据挖掘”:
同样点击用例发送:
耗时 7 分钟左右:
根据公开数据梳理了 2023 到 2025 年全球 AI 市场核心指标,最终形成网页版报告:
前一部分是自动生成的图片,这一部分则包含了大量可互动的表格:
图文、图表自动混排的报告看起来很舒服。
最后一个例子是“文件整理”,就不演示了——文件太多,乱中有整,一旦被整理了反而搞不清楚。
从这几个例子来看,Trae 的 Work 明显不同于很多常规的 Work 工具,它更偏向专业人士,不是简单做个 Word、PPT 或搞些生活琐事,而是知识和信息密集型的任务。整份报告很长,内容很多,大致预览下来,以不怎么 work 的旁观者角度看,确实挺专业。
而且当时用的还是自动选模型(大概率是上一代版本)。今天早上发现 Work 中的 2.1 Pro 已经解锁,新版本表现肯定更好。这类智能体软件界面都很简单,关键还是模型能力以及如何控制模型发挥得更好——这需要深入使用才能判断。除官方例子之外的场景表现如何,仍然是个问号。今天只是体验,不是测评,不展开说。
3. Code
Work 功能讲完,接下来是大家最熟悉的 Code 功能。小公司可能需要在 Work 和 Code 之间二选一,但字节这种大厂当然全都要。
先看 Code 主界面:
界面同样简洁:一个输入框、一个模型选择、底部一些用例(应用开发、项目理解、游戏创意、工具脚本)。这几个例子都跑了一下。
昨天白天 Code 部分的 2.1 Pro 还没解锁,先用 2.1 Turbo 跑了三个例子:
晚上发现 Pro 出来了,又全部重新跑了一遍。先不说结果,token 给得是真充足——晚上 11 点同时干好几个测试项目,居然没遇到频率限制。白天还吐槽字节小气,晚上直接跑了一堆项目,不知道烧了多少 tokens,爽得很。记得 ZCode 送了 500 万 token,可能一个项目就干没了。如果是 Kimi,即便收费套餐,跑完这些例子也得用好几天。对比下来,Trae 的用量确实大方。
看效果。第一个例子“应用开发”:
需求如下:
这个例子总共耗时 1 小时 8 分钟,最终产物如下:
没想到豆包能一口气干这么久——士别三日,当刮目相看。这是一个基于 React 18 + TypeScript + Vite + TailwindCSS 的项目,目录结构:
src/
├── components/layout/ # 布局组件(Na vbar, Footer, MainLayout)
├── pages/ # 13 个页面组件
│ ├── Home.tsx # 首页
│ ├── Login.tsx # 登录
│ ├── Register.tsx # 注册
│ ├── Courses.tsx # 课程列表
│ ├── CourseDetail.tsx # 课程详情
│ ├── Learn.tsx # 学习中心
│ ├── Vocabulary.tsx # 单词记忆
│ ├── Grammar.tsx # 语法练习
│ ├── Speaking.tsx # 口语跟读
│ ├── Listening.tsx # 听力训练
│ ├── Dashboard.tsx # 学习数据
│ ├── Community.tsx # 社区交流
│ └── Profile.tsx # 个人中心
├── store/ # Zustand 状态管理
├── data/ # Mock 数据
├── types/ # TypeScript 类型
└── utils/ # 工具函数
结构非常清晰,这套技术方案是 AI 最擅长的,面向 AI 编程的人一定见过很多次。开发完成后也做了质量保证:TypeScript 类型检查通过、生产构建成功、开发服务器正常运行、所有页面路由可访问、响应式布局适配。随后生成了两个文档:技术架构文档和 PRD 需求文档。技术文档包含架构设计、功能描述、路由定义、数据模型、核心功能、模块说明、性能优化等章节;PRD 包含产品概述、核心功能、核心流程、用户界面设计等。
毕竟是官方演示项目,做得非常全面。软件右上方显示完整待办列表,右下方显示上下文情况、技能、文件等信息。看看实际效果(多说不如看图):
首页:
学习功能页:
注册和登录:
底部效果:
课程页面:
写了 1 个多小时,例子非常完整。没有基础代码错误,布局也没有混乱,设计尚可,功能全面,注册登录、头部底部、每个板块内容基本都能用。单看这个例子,编程能力相当在线。当然,官方演示大家都懂,先不展开。
接着体验第二个例子“项目理解”:
刚好刚才开发了一个项目,让它理解一下并生成 Code Wiki。大概花了三分钟:
内容非常多,截个图意思一下:
章节划分清晰,每一章都按较好规范编写。这部分人类做起来很枯燥——十几年前,开发一个较大项目时写了数百页的交付文档,写了好几个星期,比写代码痛苦多了。写完无力复查,直接打印成厚厚一本,错别字不少。以后这种苦活累活可以交给 AI。Trae Code 的文档质量不错,应该做了专门优化训练。
第三个例子“创意游戏”:
不多评价——“菜就多练”。
软件相关的内容大致如此。这篇文章刻意避开了模型评测,只从应用角度展示 Trae Work 的使用感受。首次体验,初印象一般会好一些,熟了可能只剩吐槽。同类软件用过不少,Trae Work 整体非常好上手:无非一个输入框,选一下文件夹、选模型、输入需求、回车即可。
Trae 这个系列起步很早,是国内同类软件中起步最早的。之前在一些截图中间出现过那个绿色图标:
一直是最早的 Trae 国际版用户,最早白嫖,后来为了 Claude 3.7 充了 100 美元上了“贼船”,结果 Claude 3.7 立马被下架——所以 AI 产品不要随便充年卡。它们最早做类似 VS Code 的 IDE,后来干到 Solo,现在又到 Work。前面两个都第一时间体验过,Work 是第一次用。可以永远相信字节的用户体验——它确实是当前产品能力最强的科技公司之一。Trae 国内、国外两条腿走路,最为神奇的是,在国内不用科学工具也能直接用上国际版的 GPT 和 Gemini 模型(可惜 Claude 被掐了,否则就是主力工具)。因为开了年会员,一直用里面的 GPT 打打杂。接下来可能直接转向 Work 版了。
对于纯国内用户,Trae Work 似乎是个不错的选择:该有的都有——Work、Code、手机远程,几乎包括国内所有主流模型(自家 Seed 系列、GLM-5.2、Kimi-K2.7、MiniMax M3),平时这些模型还都是免费的(热门模型排队难免)。不过估计也扛不了多久,要逐步收费了。
就这样吧。已经在上面跑了好多编程测试项目,快的话下午应该能看到结果,慢的话明天。测测“豆姐”到底有多少斤两,ARENA 榜单是否靠谱,是否真的能和 Opus 4.7 掰手腕。对软件一般会宽容一些,对模型就会严格一些。
