数字商业顾问和科技媒体博主,每天的工作计划都排得满满当当,即便是这样,也常常需要加班才能收工。近两年AI火成这样,作为程序员出身,自然就想着怎么用工具来提效。市场上尝试过不少AI开发工具,直到碰上了字节旗下的扣子(coze.cn),才真正觉得——这就是我一直想要的那种可视化AI开发工具。
正好最近扣子发布了Project IDE,搭载了UI Builder,数据读写更灵活可控,图像流能力也做了升级,能搭建出带有完整前后端的AI应用。于是我就试着搭了一个"自媒体AI创作助手",整套开发下来一行代码都不用写,纯粹拖拖拽拽就能实现很强的功能。说实话,那一刻心里只有一句话:今年的优秀员工奖,非AI莫属了。

01
人人开发AI应用的时代,真的来了
以前的扣子,更多是聚焦在智能体开发上。虽然也做到了可视化,能跑复杂的工作流,但前端还是只能靠对话来交互,没有提供定制化页面的能力。
12月18号,字节火山发布会上,扣子正式官宣了1.5版本,推出了一个重磅功能——Project IDE。它提供了定制前端页面的能力,从前端到后端,零代码,每个人都能上手开发自己的AI应用。总结下来,主要特点有三个:
第一,Project IDE里面有个UI Builder,数据读写比以前更灵活,能搭出完整的前后端AI应用,还可以发布成微信小程序、抖音小程序、API服务、模板,甚至放到扣子商店里售卖。
第二,应用的业务逻辑靠编排好的工作流来实现,同时还能利用变量、插件、知识库、数据库这些工具,灵活地跟本地或线上数据互动。
第三,扣子提供了一大批页面组件和可视化编排工具,代码都不用写,就能快速开发出一套用户界面来。
Project IDE一出来,等于把开发AI应用的门槛直接拉到了最低。而且扣子还提供了丰富的模板,哪怕完全没有基础,从复制一个模板来修改,也能轻松开始。
02
AI应用开发,初体验
我要搭建的"自媒体AI创作助手",目标是帮自己写公众号文章、小红书种草文案、短视频脚本、播客脚本——稍微改改就能直接用,可以说是大大节省了时间。
接下来,就一起看看怎么零代码开发一个有前后端的AI应用。整个流程大致是这样:

传统的AI应用开发模式,需要后端程序、大模型API调试、前端程序、UI设计,再加上联调测试,没有一支开发团队基本搞不定。而用扣子来开发,一个人,五步,就能轻松搞定。
1)创建你的AI应用
登录扣子平台(https://www.coze.cn/),在左侧菜单栏点击"工作空间",选择一个工作空间。然后在项目页面点击右上角的"创建",选择创建应用。可以选择空白应用,也可以直接用官方提供的模板来起步。
2)编排业务逻辑
创建好AI应用项目后,在"业务逻辑"菜单下就能开始编排后端处理流程。下面是我已经搭好的业务逻辑,包含了几个不同的功能模块。
具体拿一个流程来演示:点击左侧工作流的"+"号创建一个新工作流,默认自带"开始"和"结束"两个节点。中间可以随意添加自定义节点——扣子提供了大模型、代码、意图识别、知识库写入与检索等丰富的工作流节点。把这些节点串起来,就形成了一个完整的工作流。
首先建立"开始"节点,它是默认自带的,输入几个页面带过来的参数。然后根据输入的提示词,调用大模型接口。这里选的是豆包大模型,市面上主流的大模型基本都能在平台里找到,非常方便。最后是"结束"节点,同样默认自带,标志工作流的结束。
到这里,业务逻辑的工作流设计就完成了,接下来进入界面设计环节。
3)设计界面
扣子最新发布的UI Builder,无需复杂指令,就能实现所见即所得的界面交互设计。通过前端页面来调用后端工作流,整套前后端AI应用就能跑起来。这次扣子一次性发布了17个组件,包括布局组件、展示组件、输入组件。只需要把对应组件拖入容器,再做一些设置,一行代码都不用写。

以公众号写作界面为例:添加文本、多行输入框、按钮等元素,直接把元素从左侧工具栏拖到中间的界面上,就完成了设计。点击每个元素,还能在右侧属性栏里给元素赋值。
接下来是添加"触发事件"。比如点击按钮后提交表单,需要添加OnSubmit事件,执行动作选择调用Workflow,再选之前建好的wx_article_writing工作流。Workflow的入参配置,就是界面上的组件值。通过配置事件和添加数据,业务逻辑和用户页面就联动起来了。
4)应用测试
开发结束后,点击右上角的"预览"按钮,就能运行程序,点按钮做功能测试。看看输出的结果是不是符合预期,有问题可以回到开发界面,对业务逻辑或UI设计进行修改。除了界面测试,也能单独对工作流做测试,点击右上角的"试运行"按钮就能调试。
5)应用发布
到了最激动人心的环节——亲手开发的AI应用,要发布了。点击右上角的"发布"按钮,就可以把应用发到商店,根据需求选择发布方式。重点来了:AI程序不仅支持H5页面,还可以直接托管发布为微信小程序、抖音小程序,真真是一次开发、多端发布,效果相当炸裂。应用正式发布后,大家就能在扣子商店里搜到你的作品。
03
多模态能力,全面升级
多模态能力一直都是行业里的关注焦点。这次扣子上线了升级的生图模型和视觉模型,体验下来确实很惊艳。
1)生图模型,能力增强
升级后的生图模型,图像质量更高,能稳定生成文字,还可以搭一个UI界面来制作自己的生图模板或工具。同时支持中英文文字渲染,适合短语场景;影像垂类的美感提升明显,真实感更强,光影更自然,质感更真实。大幅动作场景下,人体崩坏的情况明显减少,图文匹配程度也有所提升。下面这些图片,就是一句话生成的,看起来很酷炫。
可以说,这套生图模型已经完全具备搭建企业级AI应用的能力了。
2)视觉模型,让AI应用耳聪目明
12月18号刚刚官宣的豆包视觉理解模型(VLM),能理解图片里的视觉信息,并结合这些信息完成图片相关的任务,比如描述图片。豆包模型家族中的Doubao-vision-pro-32k,就属于VLM的一种。基于RTC加上视觉大模型/语言大模型的强大理解能力,扣子现在支持跟自建的智能体进行低延迟、高质量的视频实时通话——简单说,就是你的AI应用,既能听得见,也能看得见了。
