首页 游戏 软件 资讯 排行榜 专题
首页
科技
Windows AI助手免费版:一键操控电脑、登录网页与生成代码

Windows AI助手免费版:一键操控电脑、登录网页与生成代码

热心网友
37
转载
2025-10-31

Windows Copilot终于迎来正式版更新,现在人人都能免费拥有这位桌面AI助手了。

这次更新的核心亮点在于Microsoft 365 Copilot中的Researcher智能体新增了“计算机使用”(Computer Use)能力,让它能够开展更智能的研究、提供更深入的洞察并生成更全面的报告。

为什么深度研究智能体需要“计算机使用”功能?微软给出了几个关键理由:

安全访问需要登录认证的企业内部数据。

通过代码生成PPT、表格或应用程序。

利用私人会议记录、文件和聊天记录来完善工作报告。

具体效果可以通过以下视频演示直观了解:

这项更新目前已在Microsoft 365 Copilot的预览版中上线,参与Frontier Program测试计划即可体验。

AI助手从“说”到“做”的跨越

与以往只能通过API调用特定功能不同,支持计算机使用能力的是一系列可由Researcher编排层调用的新工具。

编排层连接到一个沙箱环境,并提供每一步操作的截图。

当模型确定需要执行某个操作时,就会启动一个运行在Windows 365上的虚拟机,它托管在云端,与内网和用户设备完全隔离。

虚拟机完全处于临时的沙盒环境中,仅在当前会话期间有效。虚拟机默认已安装浏览器并具备执行模型预测命令所需的所有组件。

智能体的指令通过安全通道发送,任何用户凭证都不会持久保存,也不会在沙盒环境内外传输。

沙盒环境中配备虚拟浏览器、终端和文本浏览器,浏览器和终端界面的输出截图会返回给模型,文本浏览器可以加速纯文本内容的推理和搜索。

所有中间推理步骤都包含屏幕截图、终端界面输出,可以实时查看智能体的操作。

当模型要求用户确认操作或填写密码时,可通过安全的屏幕共享连接来控制沙盒。

性能测试

在GAIA和BrowseComp基准测试中,Researcher with Computer Use的表现相当亮眼,这些基准测试衡量AI系统在开放网络上进行推理、搜索和综合信息的能力。

在专注于复杂多步骤浏览任务的基准测试BrowseComp中,Researcher with Computer Use的性能比当前版本的Researcher提升了44%。以下是一个任务示例:

“在2010年代末期,一家采用非传统管理结构(设有多个CEO)的公司提供脑外科手术辅助服务。该公司声称是员工持股公司,截至2024年3月尚未在公开市场交易。该公司在其年度报告中披露,董事会在2013财年召开了12次会议。请问该公司董事会在2024年召开了多少次会议?”

Researcher将散落在多个网页上的信息拼凑起来,把财务报告、新闻稿和公司文件联系起来,从而得出了一个经过验证的答案。

在衡量人工智能系统在真实世界数据中查找、验证和推理能力的GAIA测试中,Researcher with Computer Use的性能比当前版本提升了6%。在GAIA测试中,该模型回答了以下问题:

“根据世界银行的数据,在2001年至2010年期间,哪些国家的年度储蓄总额超过GDP的35%?为了解决这个问题,智能体找到了相关的世界银行数据集,直接通过其终端环境下载了该数据集,并使用Python提取和筛选了数据。

不过微软比较鸡贼地只公布了两项测试中的成绩提升,但没有公布原成绩具体是多少。

鉴于微软与OpenAI的合作关系,只能参考一下OpenAI DeepResearch在两个测试上的成绩了,比较新的数据来自Qwen。

参考链接:

[1]https://techcommunity.microsoft.com/blog/microsoft365copilotblog/introducing-researcher-with-computer-use-in-microsoft-365-copilot/4464766

来源:https://36kr.com/p/3532412380896389
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

顶尖赛车手
顶尖赛车手
体育竞技 11-04
绝密档案
绝密档案
休闲益智 11-04
独裁者2
独裁者2
棋牌策略 11-04
大头菜菜历险记
大头菜菜历险记
角色扮演 11-04

热门推荐

尼克尔Z 26mm f/2.8镜头评测:轻巧饼干头首发体验,3149元值不值?
科技
尼克尔Z 26mm f/2.8镜头评测:轻巧饼干头首发体验,3149元值不值?

  2024年2月7日尼康正式发布了尼克尔Z85mmf 1 2S与尼克尔Z26mmf 2 8饼干镜头,尼克尔Z26mmf 2 8是目前尼克尔Z系列中最轻便的镜头,尼康称这支镜头在做到轻便的同时还兼顾

热心网友
11.04
索尼发布会调查:近半玩家不满,外媒评价如何?
科技
索尼发布会调查:近半玩家不满,外媒评价如何?

索尼最新一期的State of Play发布会已于今早结束,此次共展示了14款面向PS5和PSVR2平台的游戏作品,涵盖索尼旗下多个第一方工作室正在开发的新项目。其中,《宇宙机器人》和《Concor

热心网友
11.04
全民街篮Steam抢先体验开启!同步开测资格及玩法速览
科技
全民街篮Steam抢先体验开启!同步开测资格及玩法速览

《全民街篮》抢先体验版本现已在Steam平台上线,所有玩家均可免费加入,尽享街头篮球的快节奏竞技魅力!《全民街篮》是一款全新推出的篮球竞技端游,它摒弃了复杂的数值养成系统,专注于纯粹的操作技巧和团队

热心网友
11.04
币圈新手的第一大误区:只买不卖VS频繁交易,哪个错得更离谱?
web3.0
币圈新手的第一大误区:只买不卖VS频繁交易,哪个错得更离谱?

对于初入币圈的新手,两种极端操作思维极具迷惑性:一是坚信“钻石手”,只买不卖;二是沉迷短线搏杀,频繁交易。这两种策略都可能导致严重亏损,但其危害程度不尽相同。

热心网友
11.04
腾势N8售价29.98万:超安全大六座,重塑豪华家用出行新标杆
AI
腾势N8售价29.98万:超安全大六座,重塑豪华家用出行新标杆

“大六座安全豪华SUV”腾势N8L近日正式登陆市场,推出两款不同配置车型,最新指导价区间为29 98万元至32 98万元。这款新车以“五心体验 三感相伴”为核心,通过六大核心科技配置,重新定义家庭出

热心网友
11.04