游乐游手机版
首页/AI热点日报/热点详情

Azure AI Foundry发布Responses API与计算机操作智能体CUA

类型:热点整理2026-07-04
聊到AI智能体,如今已成为不可回避的行业热点。从保险理赔到供应链优化,再到辅助医生分析病历,这些场景正逐步被AI深度渗透。近期,Azure AI Foundry一口气推出了两项重磅更新,让自动化的想象空间再度大幅拓展。 具体是哪两项呢? Responses API:一个设计用来帮助AI应用更顺畅地获

聊到AI智能体,如今已成为不可回避的行业热点。从保险理赔到供应链优化,再到辅助医生分析病历,这些场景正逐步被AI深度渗透。近期,Azure AI Foundry一口气推出了两项重磅更新,让自动化的想象空间再度大幅拓展。

具体是哪两项呢?

  • Responses API:一个设计用来帮助AI应用更顺畅地获取信息、处理数据、执行动作的统一接口。

  • 计算机操作智能体(CUA):一个能直接操作软件界面、自主完成任务的AI模型。

这两项技术叠加在一起,意味着AI不再仅仅是“回答问题的工具”,而是正在进化为真正能上手干活的“虚拟劳动力”。下面,我们来逐一拆解。

Azure AI Foundry 发布 Responses API 与计算机操作智能体(CUA)


Responses API:将零散的AI能力整合为一条指令

开发一个能干活儿的AI智能体,过去需要协调多套不同的API和接口。Azure AI Foundry此次推出的Responses API,思路非常直接——把这些能力统一封装。

它融合了 Chat Completions API的易用性、Assistants API的高级功能,以及Azure AI Agent Service的编排能力。从开发者的视角看,这意味着什么呢?

意味着你只需调用一次API,就能同时指挥CUA、执行函数、搜索文件,还能让AI记住你刚才聊过的内容。这种“上下文记忆”能力,对复杂的多轮交互场景至关重要。

具体支持的能力包括:

  • 一键调用AI工具:一次API调用即可整合多种能力。
  • 计算机操作:让AI直接操控软件界面。
  • 文件搜索:从企业数据中动态提取信息。
  • 函数调用:开发者可以编写自定义函数,交由智能体调用。
  • 多轮交互:通过唯一的Response ID,AI能记住历史对话,避免每次重新理解。
  • 企业级安全:底层由Azure的安全合规体系全面保障。

将检索、推理、执行整合进同一个API,确实能大幅节省开发成本。对于客服、IT运维、金融、供应链等场景,这套方案尤其适用。如果场景更复杂,还可以配合Azure AI Agent Service,利用Semantic Kernel和AutoGen搭建多智能体协作系统。


计算机操作智能体(CUA):当AI开始自主“使用软件”

CUA是这次更新中最令人振奋的部分之一。它不再依赖传统API对接,也不依赖写死的脚本。它是一个真正能“看”屏幕、“理解”界面、“操作”应用的AI模型。

换句话说,过去我们让AI干活,需要专门为它铺设API通道;现在,它学会了走正门——打开窗口、填写表格、翻页操作,全部自主完成。

它的几个核心优势:

  • 自主UI交互:无需预设脚本,能主动打开应用、完成多步骤任务。
  • 动态适应:界面变化?它自己会调整操作流程,无需重新编写脚本。
  • 跨应用执行:Web应用、桌面应用均可操作,无需额外API适配。
  • 自然语言指令:你说“帮我把这份报表导出成PDF”,它就能理解并执行。

更关键的是,CUA正在与Windows 365、Azure虚拟桌面(AVD)深度集成。未来你可以在云端托管CUA,大规模部署AI自动化,同时保持安全合规。这才是真正意义上的虚拟劳动力。


安全与可控:自主性越强,防护越要到位

一旦AI真的能自己操作软件,安全问题就必须严肃对待。CUA作为首批能直接操作软件环境的智能体模型,考虑到的风险包括:防滥用、防止误操作、对抗性攻击等。

微软为此设计了一套多层防护:

  • 模型层安全:CUA内置安全策略,会主动拒绝恶意任务、屏蔽未授权操作。
  • 系统层监控:提供实时的内容过滤和执行监控,拦截异常行为。
  • 关键任务确认:面对不可逆的操作(如删除数据、发起交易),会要求用户二次确认。
  • 企业合规工具:基于微软可信AI框架,日志、审计、可观测性一应俱全。
  • 持续风险检测:自动化与人工审核相结合,不断测试和优化安全策略。

必须承认,CUA目前仍处于持续优化阶段,尤其在非浏览器环境下,可靠性还有提升空间。对于高敏感度的操作,现阶段仍建议保留人工监督。


总的来说,Azure AI Foundry这次带来的两项更新,指向同一个趋势:AI正在从“被动的辅助工具”转向“主动的执行者”。随着Responses API和CUA的到位,企业在大规模部署AI自动化的道路上,又多了一把利器。

来源:https://www.53ai.com/news/zhinengyingjian/2025032461892.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。