游乐游手机版
首页/AI教程/文章详情

零代码产品经理用WorkBuddy打造Three.js 3D驾驶舱迭代9版

时间:2026-06-04 17:19
先说结论:能用,但没那么神。踩了不少坑,最后确实做出来了。一个制造业数字化的产品经理,代码能力几乎为零,日常就是写写需求文档、做做竞品分析、画画架构图,前端的东西基本不碰。但最近有个需求:给客户做一个3D数字孪生驾驶舱的原型。要求大致是这样:全厂设备的3D场景,能旋转、缩放,点击设备能弹出KPI看板

先说结论:能用,但没那么神。踩了不少坑,最后确实做出来了。

一个制造业数字化的产品经理,代码能力几乎为零,日常就是写写需求文档、做做竞品分析、画画架构图,前端的东西基本不碰。但最近有个需求:给客户做一个3D数字孪生驾驶舱的原型。要求大致是这样:全厂设备的3D场景,能旋转、缩放,点击设备能弹出KPI看板;仓储区域要有玻璃架模型(A字架、L字架);40多个指标要可视化;而且得直接能发给客户演示,不是PPT里画的饼。

以前这种活,要么等前端排期(两周起步,还不一定排得上),要么外包(改一轮要三天,沟通成本巨大)。这次试了个新路子:用WorkBuddy,一个本地跑的AI编程助手,自己干。


第一版:先让它能跑

第一句话提的需求很简单:“帮我做一个工厂的3D数字孪生页面,用Three.js,单HTML文件。场景里要有切割机、磨边机、钻孔机、清洗机、钢化炉,设备用不同颜色的方块表示就行,点击弹出参数面板。”

两分钟后,一份能跑的HTML文件就摆在了眼前。说实话,很粗糙:设备就是几个彩色方块,地面一片灰色,灯光打得平平的。但关键是——它能跑。浏览器打开,鼠标拖拽能旋转视角,滚轮能缩放,点击方块能弹出一个半透明的信息面板。

这个“能跑”特别重要。因为从此刻开始,状态就不再是“写需求文档等排期”,而是“看着一个能动的东西提意见”。前者是空对空,后者是实打实的迭代。


接下来几轮:疯狂加需求

有了能跑的底子,就开始一轮一轮提需求了,全程自然语言,不用写一行代码。

第二轮,改外观:“设备太丑了,给切割机加个金属质感的材质,磨边机用深蓝色,钢化炉用橙红色表示高温。加个地面网格线,看起来有科技感。”它直接改了材质和颜色,加了地面网格,效果立竿见影——从“能看”变成了“能见客户”。

第三轮,加KPI看板:“加一个顶部的KPI看板区域,横跨整个页面宽度。放6个核心指标:今日产量、良率、设备稼动率、在制品数量、能耗、订单完成率。数字要大,一目了然。”它在页面顶部加了一排卡片式面板,每个指标有图标、数值、单位、涨跌箭头,还用了CSS动画做数字滚动效果,看着挺像那么回事。

第四轮,是个大活:“KPI数字要能点击,点击后弹出详情弹窗。比如点良率,弹窗里要显示各条产线的良率明细、最近7天趋势、异常产线标红。48个指标都要有对应的弹窗内容。”它建了一个kpiDetailMap对象,把48个指标的弹窗内容全塞进去:yieldRate: {title: '良率详情', trend: [96.2, 95.8, 97.1, 96.5, 95.3, 96.8, 97.2], lines: [ { name: '切割线A', value: 97.5, status: 'normal' }, { name: '磨边线B', value: 94.1, status: 'warning' }] },设备参数也做了一个paramDetailMap,25个参数(主轴转速、进给速度、温度、压力等)都能点。

这里有个小插曲:48个指标的弹窗内容,本来想自己一个个写,后来发现WorkBuddy可以按模板批量生成,只需要审核修正。它给“良率”生成的弹窗里,趋势数据是[96.2, 95.8, 97.1, ...],产线明细有切割线A、磨边线B。数据是假的,但结构是对的,只需要把真实数据换进去就行。

第五轮,加全屏:“加个全屏按钮,在右上角。客户演示的时候全屏效果好。”Fullscreen API,几行代码的事,但演示效果提升很大。

第六轮,设备动画:“设备要有状态动画。正常运行的设备加个缓慢旋转的效果,报警的设备加红色闪烁,停机的设备变灰。”它给每个设备加了动画回调,正常设备绕Y轴缓慢旋转,报警设备的材质颜色在红色和原始色之间插值闪烁,停机设备降低透明度。

第七轮,模拟实时数据:“KPI数据现在是写死的,加个模拟数据刷新。每3秒随机波动一下数值,看起来像实时数据。”加了定时器,数值在基准值上下随机浮动,涨跌箭头也跟着变,客户演示的时候数字一直在跳,看着挺唬人的。当然,实际对接的时候这些模拟数据要换成真实API调用,但原型阶段够用了。

到这里,一个页面已经1166行、65KB了。你可能会问:一个HTML文件搞这么大,不觉得该拆组件了吗?原型验证阶段,单文件就是最方便的。一个文件,微信发给客户就能打开,不用npm install,不用起服务,不用跟客户解释“你先装个Node.js”。等验证完了要产品化,再让前端来重构,到时候这1166行就是需求文档——比任何PRD都直观。


第八版:用工厂实拍照片改模型

前面几版的仓储区域,A字架和L字架都是WorkBuddy自己“想象”的——蓝色架子,整齐排列,看着像那么回事,但跟实际的完全不一样。发给工厂的同事看,人家直接说:“这不对。我们的A字架是白色烤漆的,A字造型,底下有4个红色万向轮。玻璃是竖着插在横梁之间的,不是平放的。”

光靠文字说不清楚,直接拍了两张工厂实拍照片发过去:一张A字架侧面照,一张L字架正面照。它真的看了照片,从照片里提取了白色漆面、A字造型、5根横梁、4个红色万向轮这些信息,然后用Three.js重建了模型。每一根横梁、每一个轮子都是独立的对象,有正确的尺寸和颜色。

但第一次改完有新问题。打开页面一看——玻璃“漂浮”在架子上方,跟架子之间有一道明显的缝隙。截图,用红圈标出漂浮的位置,发给它:“玻璃飘起来了,没有贴合横梁。玻璃底部应该跟最下面那根横梁齐平。”它改了Y轴偏移量。第二次打开,玻璃不飘了,但方向反了——本来应该面向通道的架子,转了180度面朝墙壁。“架子方向反了,玻璃面应该朝向工厂通道方向。”改了旋转角度。第三次,方向对了,但玻璃的间距太密,看着像一整块。“每片玻璃之间要有间距,就像实际插在架子里那样,能看到每片独立的玻璃。”第四次,终于对了。白色A字架,红色万向轮,玻璃一片一片竖着插在横梁间,间距均匀。

这个过程来回四五轮,花了大概半小时。回头看看,投入产出比其实挺高的。如果让前端来做这个模型,光理解“A字架长什么样”就得花半天——还得看照片、解释结构、确认尺寸。而WorkBuddy直接看照片就能提取结构信息,只需要在“不对”的时候指出来。

这段经历让想明白一件事:AI给你的不是一次性完美结果,而是一个可以反复磨合的搭档。要做的就是知道哪里不对、怎么描述不对、期望改成什么样。


第九版:翻车了

受前面成功的鼓舞,决定搞个大的:给五大工艺设备各做一个独立的数字孪生页面,每个页面有设备3D模型、实时参数面板、历史趋势图。满怀期待地打开第一个——切割机的页面。白屏。刷新,还是白屏。打开第二个,磨边机的——有东西了,但渲染到一半就卡住了,控制台一堆WebGL警告。

排查了好几轮,最后搞清楚了几个原因:浏览器的WebGL上下文数量有上限,同时开5个复杂3D页面会超限;Three.js的dispose()没调用,内存泄漏导致渲染崩溃;不同页面加载了不同版本的Three.js,互相冲突。最后的解决方案:不同时打开5个页面,改成一个导航页面点进去看单个设备,退出时释放资源。

教训就是:3D场景不要贪多。一次渲染一个,用完就释放,比同时塞5个场景靠谱得多。


踩过的其他坑

除了上面翻车那次,还踩了几个坑。

任务卡住不动。有一次,一个任务状态一直显示pending,等了10分钟还是pending。排查后发现是WorkBuddy的内部数据库(SQLite)里,这条任务的状态字段卡住了。解决方案:直接用SQL改状态,然后重启应用。UPDATE tasks SET status = 'completed' WHERE name = 'xxx' AND status = 'pending';。数据库路径在~/.workbuddy/workbuddy.db

macOS权限弹窗。macOS的隐私权限有时候会反复弹窗要求授权,即使已经在系统设置里授权过了,下次启动还是弹。tccutil reset Accessibility com.tencent.workbuddy重置后重新授权就好了。这个问题在macOS Sonoma上比较常见。

AI没有“物理直觉”。Three.js生成的3D模型,经常会有物理上不合理的问题:物体漂浮在空中、方向反了、穿模。AI没有“东西应该放在地面上”这种直觉,得自己看,发现问题后精确描述给它。一个技巧:截图标注比文字描述有效10倍。在截图上用红圈标出问题区域,然后说“这个位置的玻璃飘起来了,应该贴合架子顶部横梁”,比写一大段文字管用得多。

国内模型的兼容性。用Hermes做本地AI网关,接入了几个国内模型(小米MiMo、智谱GLM、百度千帆)。这些模型的API返回格式跟OpenAI不完全兼容——比如有些模型会多一个reasoning_content字段,存的是模型的思考过程。如果客户端没处理这个字段,要么报错,要么把思考过程当成回答吐出来。这个坑踩了才知道,先小规模测试比较稳妥。


最后的成果

迭代到V4.9.x,这个单HTML文件已经有了:全厂3D场景(设备、地面、通道、仓储区),48个KPI看板(可点击弹详情),25个设备参数(可点击查看实时数据),基于工厂实拍还原的A字架/L字架模型,全屏模式、设备状态动画、模拟数据刷新,五大工艺设备独立数字孪生页面。


几点感受

先跑通再优化。别追求第一次就完美。先让AI生成一个能跑的版本,然后在这个基础上迭代。那个驾驶舱第一版就是一堆彩色方块,但它能跑,这就是一切的起点。

你是产品经理,不是程序员。价值是知道“要什么”和“对不对”,不是知道“怎么写”。把精力放在需求描述和质量审核上,让AI去写代码。不需要会Three.js,但需要知道A字架长什么样、KPI看板该放哪些指标。

真实素材比Prompt管用。给AI看工厂实拍照片,比写500字的描述都管用。它能从照片里提取颜色、比例、结构这些很难用文字精确表达的信息。能拍照就别写字。

审核不能跳过。AI的产出不能直接用。它会犯低级错误(坐标算错、方向搞反),会遗漏关键信息,会把不确定的东西写得很肯定。工作是审核、修正、补充。审核比从零写快10倍,但不能省。

单HTML文件是原型阶段的最优解。不用装依赖、不用起服务、微信直接发。1166行看着大,但客户点开就能用。等要产品化了,这1166行就是最好的需求文档。


WorkBuddy解决不了行业认知问题,解决不了数据源问题,解决不了客户关系问题。这些还是得靠自己。但它解决了一个问题:让不懂前端的人也能快速做出可交互的原型。以前从“想法”到“可演示原型”这个环节,需要等前端排期两周。现在自己就能搞。不是替代前端,而是把原型验证的效率提上去了。


一个制造业数字化的产品经理,日常折腾ERP架构、3D数字孪生、AI落地应用。

来源:https://cloud.tencent.com.cn/developer/article/2681312
上一篇AI图片视频API接入的隐藏细节与常见陷阱 下一篇大模型工程实现五大落地路径从入门到实战详解
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Sentieon DNAscope Hybrid长短读长混合分析流程详解评测
AI教程 · 2026-06-07

Sentieon DNAscope Hybrid长短读长混合分析流程详解评测

一、前言 基因组学研究已进入下半场,精度与全面性成为临床诊断及群体研究的核心需求。然而,单一测序技术常常让人陷入选择困境:短读长测序(如 Illumina)准确性高、成本低廉,但在面对结构变异、重复序列和复杂区域时显得力不从心;长读长测序(如 Oxford Nanopore)虽能轻松跨越这些障碍,超

腾讯混元Hy3 preview 295B/21B MoE架构与上下文详解
AI教程 · 2026-06-07

腾讯混元Hy3 preview 295B/21B MoE架构与上下文详解

摘要: 295B 21B MoE 是腾讯 2026 年 4 月发布的混元 Hy3 preview 的核心架构标识。本文解释参数总量与激活参数的含义、MoE 的工作机制、为什么 Hy3 preview 能原生支持 256K 上下文,并说明它在 TokenHub 上的完整能力支持与价格档位。 一、读懂

腾讯云AI业务流架构师训练营重塑编程与业务的新范式
AI教程 · 2026-06-07

腾讯云AI业务流架构师训练营重塑编程与业务的新范式

AI业务流架构师训练营:在腾讯云上重塑编程与业务的新范式 到2026年,企业AI竞争的核心已不再是“拥有AI”,而是“谁的AI业务流架构更为高效”。这一转变彻底颠覆了传统编程模式。对于技术从业者而言,AI业务流架构师已成为舞台中央的关键角色——他们不再仅仅编写代码,而是将业务需求转化为自主运行的数字

推荐一款免费使用谷歌最新NanoBanana 2插件
AI教程 · 2026-06-07

推荐一款免费使用谷歌最新NanoBanana 2插件

谷歌近期推出了重磅更新——NanoBanana2模型正式登场。无论是在知识储备、图像生成质量、推理能力还是主体一致性方面,这一版本都实现了全面升级,堪称当前地表最强的AI生图模型之一。 生成速度直接减半,价格也同步腰斩,性价比表现极为突出。不过,国内用户想直接访问官方渠道依然困难重重,大部分路径都绕

企业生产管理系统选型排行榜
AI教程 · 2026-06-07

企业生产管理系统选型排行榜

企业在进行生产管理系统选型时,往往容易陷入一个常见的思维误区:首先问“哪家功能更全面”。但从实际部署与落地效果来看,真正决定系统价值的,往往不是模块数量的简单堆叠,而是它是否真正贴合实际生产流程、能否支撑高效的跨部门协作、以及是否具备随业务变化持续迭代升级的能力。迈入2026年,制造企业对生产管理系