大模型究竟能处理多复杂的任务?近期几个实操案例颇具说服力。先来看两款工具——在线 LaTeX 预览工具与智能体调试器。前者仅凭一条提示词便轻松完成,后者则经历了多轮迭代才勉强达标。
公式在线预览
提示词非常简洁:“帮我开发一个工具,基于 katex.js,用户输入公式即可实时预览渲染效果”。豆包立即生成了完整页面,连样式都已封装好。实际效果如下图所示:

不得不服,最令人头疼的样式难题,大模型一句话就搞定了。从这类展示型页面来看,大模型的生成能力已经非常成熟,即使完全不懂前端开发,稍微调整就能获得一个精美的网页。
智能体调试器
第二个工具的实现就没那么顺利了。起初打算用 Makepad 开发,但这个库过于小众,可用资料极少,大模型生成的代码幻觉率非常高,根本无法运行。同时 Makepad 的 DSL 调试起来也很困难,再三权衡后果断放弃。
初版只计划实现提示词修改功能——这纯粹是程序员特有的偷懒心态,不想手动修改库文件。大约花了十分钟,但由于大模型没有按照官方最新 API 生成,不得不手动调整了部分代码后终于运行成功。界面简洁、功能实用,完全能够满足业务场景中的提示词测试需求。
随着智能体应用日益增多,逐个到业务场景中去亲身体验简直是场灾难。于是很快开发了第二版:开启调试模式后,输入参数即可直接获取返回结果。不过此时响应仍要等待 SSE 流结束后才整体返回,交互是同步的,体验上略有欠缺。
第三版的开发重点转向了流式交互:如何让框架实时渲染大模型的返回内容?这次没有查阅官方文档,全程通过与大模型对话尝试调试,最终成功实现。随后又将 Dify 的“问题建议”功能集成进来,在 API 设计与界面展示上反复调整了多个版本。
最终效果如下:



整体使用下来,一个非常明显的感受是:大模型正在模糊技术的边界。无论是 Vue、Java、Go、Rust 还是 React,在大模型面前统统都变成了提示词。在工具类应用开发上,完全进入了面向提示词编程的时代。
当然,涉及大型项目时,大模型只能看到皮毛,无法顾及每一个细节。目前国内还没有能与 Claude Code 相匹敌的项目级工具。因此,从当前阶段的技术成熟度来看,大模型最可靠的杀手级应用方向,实际上是工具类的辅助生成。对于这个判断,您是否有不同看法?欢迎在评论区留言讨论。
