大模型技术正以前所未有的速度重塑人工智能的版图,而在这一浪潮中,智能体(Agent)扮演的角色愈发关键。它如同一个精巧的转换器,将大模型的强大潜力,转化为解决具体业务问题、实现自然交互的实际能力。如今,智能体已深度渗透到大模型应用的各个环节,成为推动整个产业生态演进与变革的核心力量。

行业规范化是技术健康发展的基石。中国信息通信研究院(简称“信通院”)人工智能研究所一直紧密追踪智能体的技术演进与应用落地。为此,信通院联合产业各方,共同制定了《智能体技术要求与评估方法》系列标准。这套标准体系相当全面,覆盖了从平台工具、技术能力到应用服务的各个层面,并针对金融、政务、手机等关键行业提出了具体要求,为整个行业提供了清晰的发展框架和评估标尺。基于这套规范,信通院已开展了广泛的评估工作,累计为19家企业的23个项目提供了专项评估,切实引导着智能体技术朝着有序、可靠的方向迈进。
在这场权威评测中,蚂蚁数科旗下的企业智能体开发平台Agentar取得了亮眼的成绩。在2025年6月,该平台依据《智能体技术要求与评估方法第1部分:平台和工具》,成功通过了最高等级(5级)的评估。评测主要从三个维度展开:平台管理和运营、开发和管理,以及API服务和管理。
平台运营:稳固可靠的基石
一个优秀的企业级智能体开发平台,首先需要坚实的管理与运营底座。Agentar在这一维度展现了全面的能力。从用户管理、存储管理到数据回流、日志审计,再到安全策略,平台构建了一套完整的支撑体系。这意味着企业不仅能精细化管理不同角色的用户权限,保障数据高效存取与追溯,还能通过数据回流持续优化智能体表现,并通过严密的安全防护,确保业务数据与用户隐私万无一失。这些能力共同保证了平台在生产环境中的高效、稳定与安全。
开发管理:高效敏捷的引擎
在智能体的开发与生命周期管理上,Agentar提供了高度的灵活性和完整性。平台支持自定义模板、多种开发模式、能力扩展、版本管理、服务与组件管理等核心功能。简单来说,开发团队可以根据业务需求,选择合适的“配方”快速搭建智能体,并对其版本迭代、知识更新进行系统化管理。这种覆盖设计、开发、测试、上线、优化全流程的支持,极大地提升了项目落地效率,降低了管理复杂度。
API服务:性能与易用的平衡
对于企业级应用而言,API服务的质量至关重要。Agentar的API管理能力在安全、稳定、兼容、易用等基础要求上做得相当扎实。更值得关注的是其性能表现:高响应速度、高请求成功率、强大的并发处理能力和吞吐量。这确保了基于Agentar构建的智能体应用,在面对大规模、高并发的实际业务场景时,能够提供及时、可靠的服务响应,满足金融等高标准行业的严苛要求。
那么,这样一个全栈式平台,究竟能为行业,特别是金融领域带来什么?答案在于“可信”与“赋能”。Agentar以可信智能体技术为核心,从底层大模型、智能体供给、任务执行到最终的场景评测与归因分析,构建了全链路的可信保障,确保推理过程、知识来源、交互行为乃至效果评估都可靠、可追溯、可优化。
平台沉淀了亿级的高质量金融专业数据,并创新性地搭建了金融MCP服务广场,整合了超过百个核心金融工具与服务。这相当于为开发者提供了一个“即插即用”的行业知识组件库,大幅降低了金融智能体的开发门槛,真正打通了从技术到业务场景的“最后一公里”。同时,平台内置了金融级的数据安全防护与实时监测能力,为智能体应用的安全合规运行提供了全方位护航。
目前,基于Agentar平台构建的金融智能体解决方案,已在多个核心业务场景中落地生根。例如,在财富管理领域,智能体能够依据客户画像和市场变化,提供个性化的资产配置建议,提升服务效率和客户体验;在风险控制场景中,它能实时监测交易流水,精准识别潜在风险,有效降低损失。这些实践不仅证明了技术的可行性,更彰显了其带来的实际业务价值。
蚂蚁数科Agentar平台获得信通院5级评估,无疑是对其技术实力与产品成熟度的高度认可。这不仅仅是一个评级,更为企业级智能体开发平台树立了一个可信赖的标杆。它标志着智能体技术正从探索走向深入,从工具走向生态。展望未来,随着此类平台的持续进化与普及,必将加速千行百业的智能化转型进程,为数字经济注入更强劲、更可靠的智能动力。
