游乐游手机版
首页/AI热点日报/热点详情

大模型与智能体:加速AI应用落地的双骄

类型:热点整理2026-07-03
AI技术要实现快速落地,是否有捷径可走?在最近举办的WOT全球技术创新大会上,58同城高级总监、AI Lab负责人詹坤林给出了明确答案——大模型与AI智能体技术的协同应用,正是破局的关键。这两者并非孤立工具,而是能够相互配合、共同发力的“双骄”。 从本质上看,从底层AI算力到上层实际应用之间,存在一

AI技术要实现快速落地,是否有捷径可走?在最近举办的WOT全球技术创新大会上,58同城高级总监、AI Lab负责人詹坤林给出了明确答案——大模型与AI智能体技术的协同应用,正是破局的关键。这两者并非孤立工具,而是能够相互配合、共同发力的“双骄”。

从本质上看,从底层AI算力到上层实际应用之间,存在一道巨大的鸿沟。算力只是基础,真正的挑战在于如何让业务部门像搭积木一样,将各种能力组合成真正解决问题的应用。58同城AI Lab的应对方案可总结为三层架构:底层为AI计算引擎,统一管理CPU/GPU资源,实现“模型即服务”;中间层集成图文音算法、大语言模型及多模态模型,供业务方直接调用;上层则是AI应用平台层,打包了智能对话、数字人、Agent等解决方案。最终目标只有一个——让AI能力渗透到销售、客服、产品乃至内部办公的全链条中。

加速AI应用落地,大模型与智能体何以成为“双骄”

搭建大模型平台:从“重复造轮子”迈向“统一基座”

具体到执行层面,为何必须优先构建一个大模型平台?原因很直接:作为平台部门,AI Lab需要提供一个通用基座,避免各业务线各自为战、重复造轮子。更重要的是,通用大模型依靠Prompt提示能解决部分问题,但经过大量场景实践后会发现,仍需进行微调,针对特定任务做定制化处理。

因此,平台的路径十分清晰:集成主流开源大模型,将LoRA、QLoRA等微调算法以及MoE训练策略内置其中,实现从微调到一键部署的全流程打通。业务方只需上传数据、选择微调方法,即可快速上线专属模型。当然,仅有平台还不够,还需持续追踪业界最新进展,例如利用MoE架构将大模型拆解为小模块,以降低推理时的参数消耗;或针对GPU资源紧张问题,采用S-LoRA技术在一张显卡上容纳多个微调后的模型,大幅降低部署成本。

打造垂类大模型“灵犀”:用行业数据训练出的才是真功夫

平台搭建完成后,通用大模型在58同城的实际场景中却显得有些“水土不服”。房产、招聘、汽车、本地服务等垂直领域的数据,通用模型接触有限,表现自然难以令人满意。为此,AI Lab在开源模型基础上开展增量预训练,借助58同城的海量业务数据,打造出专属的垂类大模型——灵犀。

训练过程分为三个阶段:首先融入58同城的业务数据,再搭配公共数据,精心配比,确保模型既能吸收领域知识,又保留通用语言能力,避免“灾难性遗忘”。随后进行微调与对齐,使模型在特定任务上达到最优。评测结果同样亮眼——在同尺寸开源模型中,灵犀在多项指标上明显占优。尤其在安全领域,灵犀安全大模型在涉政、涉黄信息识别上,足以与GPT-4一较高下,优势显著。

有趣的是,詹坤林还分享了一个反直觉的发现:在某些应用场景下,百亿参数模型的性能与效果反而优于千亿参数的闭源模型。这表明参数量并非万能,模型选择应依据具体场景,不必盲目追求“大”。

为让不同技术背景的团队都能便捷使用,AI Lab还构建了一套全面的大模型API体系——既能快速部署内部模型,也集成了市面上主流的商用模型API,调用流程极为简化。应用方玩法灵活多样:可直接在平台上微调模型,或选择垂直模型的定制方案;即便缺乏技术基础的团队,也能直接享受一站式服务。

AI Agent平台:加速应用落地,再进一步

即便已拥有平台和垂类模型,对于小型团队而言,微调大模型仍然成本高、周期长。因此,58同城AI Lab以灵犀大模型为“大脑”,构建了一套AI Agent平台,直接推动应用快速落地。

该平台的构建思路非常务实:基于开源模型微调出适应Agent场景的模型,强化角色扮演(例如扮演HR、销售)和工具调用能力。经过优化,工具调用准确率大幅提升,模型通用性能也进一步增强。平台的一大杀手锏是自主研发的RAG功能——上传文档即可快速构建知识库,使AI回答更有依据。工作流自动化则让Agent能够独立执行任务,减少人工干预。

与市面上许多只能在自有生态中生成智能体页面的平台不同,58同城的这套方案可直接生成智能体API,开发者能无缝将智能体嵌入到自定义应用中。实测表明,在综合场景下,由于对文本向量化和大模型进行了针对性微调,平台RAG方案的优势非常明显。运营方即便没有算法团队,只需上传文档,系统便会自动完成解析、向量化、检索与排序,由大模型给出回答,文档问答的实现过程大幅简化。

目前,58同城已经全面铺开大模型技术,在销售、客服、用户体验和内部办公等领域部署了超过50款AI应用。

三大场景,三种落地路径

不妨看几个具体的例子。

第一个场景是销售培训。58同城的电销团队人员流动性较大,新员工需快速上手。传统培训成本高昂,依赖大量人力一对一指导话术。引入基于大模型的角色扮演机器人作为陪练后,它能够模仿优秀销售的沟通方式以及不同客户的反应,新员工通过互动练习快速提升技能,大幅降低真人培训的投入。

第二个场景是内部办公与研发效率提升。SQL智能助手是一款专门优化数据分析流程的工具,能够生成SQL语句、自动纠错,还能响应自然语言查询——例如“给我本周的部门收入数据,做个图表”,它便能迅速完成。决策者和业务团队以往需要等待较长时间才能获取关键数据,如今速度提升了数个量级。

结语:三个关键判断

最后,詹坤林总结了几条核心经验:

第一,对于垂直领域的公司而言,基于开源大模型开发垂类模型是一条性价比极高的路径,效果显著。

第二,不要被“参数量”这个数字所绑架。模型大小并非决胜因素,关键在于它能否解决你的具体问题。

第三,无论是做垂直模型、大模型平台还是智能体平台,最终目标始终只有一个——孵化出真正有影响力的应用。

一句话总结:企业应当以开放心态拥抱大模型,通过定制化与开放合作,在垂直领域打磨出高价值、高影响力的新应用。这一趋势将在未来几年持续发酵,并真正推动行业变革。

来源:https://www.53ai.com/news/LargeLanguageModel/2025031303542.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。