探索微信小程序开发的新路径,用大模型打造智能化问答体验。
核心内容:
1. 腾讯元宝与豆包的比较和小程序优势
2. 利用腾讯元器开发智能体的步骤和方法
3. 知识库配置、智能体设置及预览功能介绍
之前用扣子+豆包大模型开发的智能体应用"杭州中考小助手",虽然能对接微信公众号,但分享起来总是不够方便。身边同学家长很少装豆包APP,直接让用户在公众号对话框里咨询,感觉有点别扭,也不是长久之计。最近腾讯元宝广告铺天盖地,索性研究一下,看看有没有更优的方案。
对比下来,腾讯元宝和豆包功能上差不太多,甚至因为起步晚,功能还没豆包丰富。但它有一个杀手锏:除了APP端和WEB端,还有微信小程序端。小程序在微信生态里的分发优势,懂的都懂。
有了这个认知,自然要研究元宝的智能体是怎么开发的。不愧是宇宙级"借鉴"工厂,腾讯果然搞了一个对标"扣子"的平台,叫"腾讯元器"。这名字和"元宝"不能说一模一样,只能说体系化非常到位。
先用腾讯元器开发智能体
总体思路没变:把中考分数线数据做成知识库,对接大模型,实现智能化问答查询。用专业话术说,这叫RAG(检索增强生成)——用专项行业知识,增强通用大模型的内容生成能力。
第一步是准备知识库。腾讯元器的知识库有两个特色功能:支持上传QA问答类知识,还能对接公众号文章作为知识源。这和文心一言支持百度云盘文档类似,都是生态玩法的体现——大厂最不缺的就是生态。不过当前场景下,普通"文本类型"的知识库已经够用,具体知识准备、上传和处理过程就不展开了,官方文档写得很清楚。
接下来配置智能体。说实话,腾讯元器和扣子、Dify等平台大同小异。以前写过扣子配置+豆包APP的模式,这里不再重复。有基于"Prompt"提示词的零代码模式,也有基于工作流配置的低代码模式。以零代码模式为例简单说明。
Prompt的核心是角色定义、技能描述等基础信息。随着经验积累,越来越理解prompt对大模型AI应用的重要性——它本质上是用自然语言描述程序逻辑和指令要求,不用再像以前那样写代码。大模型恰好擅长理解这些描述文字,能按指令响应用户提问。这个特性大幅拉低了AI应用的门槛。
智能体基础设定完成后,在"高级设定"中对接知识库,同时在"模型设置"里选择大模型版本。需要留意的是,如果选择DeepSeek-R1,它不支持FunctionCall,也就没法调用工作流和插件等高级功能。需要用这些功能的话,得选腾讯自家的"混元"大模型。
完成所有设定后,右侧可以直接预览调试,通过后就能发布。
再发布元宝小程序
按上述步骤发布后,在元宝APP端和WEB端都能搜到并使用这个智能体。但元宝的特色在于支持小程序访问。在智能体卡片点击"使用方式",能看到三种渠道。微信扫一扫,直接打开元宝小程序并定位到智能体交互入口,也可以直接在微信聊天时分享给好友。
用公众号菜单对接元宝小程序
再分享一个小技巧:把智能体小程序对接到公众号菜单上,方便有类似运营需求的同学参考。
首先在公众号后台找到"小程序管理"入口,添加前面做好的小程序。点击"添加"后,用公众号管理员微信扫描,会出现一个输入界面,要输入小程序的ID。这个ID从哪里来?回到腾讯元器管理端,点击对应智能体卡片的"使用方式",在小程序体验下复制即可。
小程序添加成功后,在公众号后台找到"自定义菜单",在要设置的具体菜单的消息类型中选择"跳转小程序",选刚才加入的小程序,再把对应的路径复制进去。
保存发布后,公众号主页的菜单就能直接打开智能体交互入口了。对公众号大V来说,这应该是推广智能体最方便的途径。
做这些探索,核心目的并不是转型搞智能体开发。而是在思考:为什么支撑行业智能化业务时,不能直接使用云端大模型,而要私有化?为什么不能基于AnythingLLM或Dify这类开源工具对接私有化大模型,而要进行工程化落地?带着这些问题,有必要对基于云端和开源工具的RAG及智能体开发,做深度了解和体验。
这个过程中有两个重要收获。一是让知识库RAG、向量化嵌入Embedding、智能体Agent、思维链CoT、提示词指令Prompt、提示词工程Prompt Engineering、智能体开发平台和LLMOps等概念形成了体系化认知。下一步可以往纵深底层技术了解,包括模型训练、微调、蒸馏Distill、量化版本等基本原理,以及CUDA架构、vLLM推理加速等底层逻辑。
二是触发对软件研发过程和交互模式的思考。未来软件研发可能真的不需要写代码了——把软件需要具备的能力用prompt告诉大模型,它能理解指令,按要求生成界面、前后端代码、测试用例等。注意,这种方式的产出仍是传统软件范畴,只是研发过程被智能化了。
更进一步,大模型理解prompt后直接生成智能体,这个智能体按指令响应用户的提问。这将是软件交互模式的巨大改变——为什么软件交互一定要是GUI模式?从电脑软件到移动端APP,本质上都是基于菜单点击和表单填写的GUI交互,无非是交互设备从鼠标键盘变成了触摸屏。
未来的软件交互,或许只需要一个问答框。用户用语音或文字告诉智能体诉求,智能体基于大模型理解意图后,结合知识库和工作流等基础技能,就能完成相应处理。现在还只是畅想,后续继续深入学习,再继续分享。
—End—
