游乐游手机版
首页/AI教程/文章详情

探秘Marvis:一个能完全接管你电脑的AI多智能体系统

时间:2026-06-04 17:28
作为一名在 Windows、Mac、手机三端之间频繁切换的开发者,我一度被文件搜索、重复设置和远程任务搞得焦头烂额。直到最近,我深度体验了一款来自腾讯的桌面级 AI 助手——Marvis。它不是那种只会对话的聊天机器人,而是一个能直接调用系统 API、调度本地模型、协同多个专业 Agent 的「操作
作为一名在 Windows、Mac、手机三端之间频繁切换的开发者,我一度被文件搜索、重复设置和远程任务搞得焦头烂额。直到最近,我深度体验了一款来自腾讯的桌面级 AI 助手——Marvis。它不是那种只会对话的聊天机器人,而是一个能直接调用系统 API、调度本地模型、协同多个专业 Agent 的「操作系统级大脑」。 ![image.png](https://developer.qcloudimg.com/http-sa ve/yehe-11352753/01862085d49dd53138d9513dc4f56bb6.png) 在近两周的实测里,我用它整理了三年来累积的 200G 本地文件、远程安装了大型游戏、还顺带优化了系统性能。这篇文章会抛开产品宣传话术,从技术架构入手,再结合真实用户视角,分享具体操作步骤、避坑指南和一些进阶技巧。希望能给同样对 AI Agent 感兴趣的朋友,提供一份硬核参考。 ## 一、技术基石:「1 5」多智能体协作与端云协同 ![image.png](https://developer.qcloudimg.com/http-sa ve/yehe-11352753/5ad4dc78359af8bb198cc3e8546469f0.png) 模式选择的核心,在于算力与隐私之间的权衡。Marvis 提供了两种底层运行模式: * **效率模式**:这是其「端云协同架构」的体现。当你发出复杂指令(比如“帮我写一份项目计划书”)时,主 Agent 会把任务理解和规划部分上传到云端(调用腾讯混元、DeepSeek-V4 等大模型),而文件读取、系统操作这类具体执行则留在本地。这种模式响应快、逻辑强,适合大多数日常场景。 * **本地模式**:所有计算完全在端侧完成,依赖本地部署的轻量化模型。文件处理、索引构建等数据 **100% 不离机**,隐私保护拉到最满。实测在主流配置(比如 i5-12500H,16G 内存)下,文档理解、文件搜索这类任务依然流畅,但处理复杂推理时响应时间会明显增加。 技术实践建议是:日常使用可以开着「效率模式」;而在处理高度敏感的数据(比如合同、财务报表)时,手动切到「本地模式」,并在设置里关掉所有联网选项,这样就能做到万无一失。 ## 二、杀手级体验:手机远程接管,实现真·跨端协同 ![image.png](https://developer.qcloudimg.com/http-sa ve/yehe-11352753/b6773f697008d2d216451877de65d4eb.png) 这绝不仅仅是远程桌面,而是 **AI Agent 能力的远程延伸**。连接成功后(用同一腾讯账号扫码或动态配对码),手机端会实时显示电脑桌面,你可以像操作本地设备一样点击、滑动。关键区别在于以下几点: 1. **语音/文字指令接管**:你不需要精准点击。比如,手机端输入“帮我把 C 盘‘项目资料’文件夹里最新的 PDF 发邮件给张三”,Marvis 就会调度 File Agent 搜索文件,Browser Agent 打开邮箱并填写内容,你只需要最后确认一下。 2. **离线备用方案**:如果电脑断网,手机会无缝切换到“云 Marvis”模式。虽然没法操控电脑了,但基础的问答、搜索、文档生成这些云端能力依然可用。 3. **真实场景案例**:上周日,我在外面收到一个紧急需求,需要公司电脑里的一份设计稿。我直接对着手机下令:“找到‘UI设计稿’文件夹里上周五修改过的 Sketch 文件,压缩后发我微信。” Marvis 自动完成了搜索、压缩以及通过微信文件助手传输的全流程。 ***实操技巧**:远程操控前,建议在电脑端 Marvis 的设置里开启“保持唤醒”,防止电脑休眠导致连接中断。 ## 三、文件智能管理:从“关键字”到“语义”搜索的跃迁 ![image](https://developer.qcloudimg.com/http-sa ve/yehe-11352753/af50b738be9550283622126cdc2545c0.webp) 传统搜索依赖文件名和路径,而 Marvis 的 File Agent 通过本地模型(Gemma-2B 等)和向量数据库技术,实现了**内容语义理解**。 * **语义搜索实战**:输入“找一下去年关于预算讨论的会议纪要”,它能理解“去年”的时间范围和“预算”这个主题,并从你所有文档(Word、PDF、甚至图片中的文字)中找出相关段落,而不是只匹配文件名里有没有“预算”两个字。 * **AI 图库与文档库**:它会自动扫描图片,通过视觉模型识别人物(比如“所有包含小明的照片”)、地点、事件(比如“春节聚餐”),进行智能分类。文档库则能按项目、主题自动聚合相关文档,初步形成个人知识库。 * **踩坑点**:首次全盘索引耗时较长(500G 硬盘大约需要 1-2 小时),建议在空闲时进行。索引建好后,搜索速度就是毫秒级的。 ## 四、系统设置与优化:一句话释放系统管理员权限 ![image](https://developer.qcloudimg.com/http-sa ve/yehe-11352753/9c37c0a5e12a463fb028d384383b72b2.webp) Computer Agent 直接与 Windows 系统 API 对话,绕过了繁琐的图形界面。 最佳实践清单如下: * **信息查询**:说一句“我的电脑内存和硬盘还剩多少?”,它就会直接弹窗显示详细配置和使用情况。 * **性能优化**:说一句“开机启动项太多了,帮我优化一下”,Agent 就会列出所有启动项,分析影响,并建议禁用哪些第三方软件。 * **网络诊断**:问一句“为什么网速这么慢?”,它会运行 Ping、Tracert 等命令,并给出初步诊断报告(比如“DNS 延迟较高”)。 * **隐私安全提醒**:所有涉及系统关键设置的修改(比如修改注册表、删除系统文件),Marvis 都会强制弹窗要求用户二次确认,这属于其 L2 级安全兜底机制的一部分。 ## 五、文件深度处理:不只是阅读,更是生成与重构 ![image](https://developer.qcloudimg.com/http-sa ve/yehe-11352753/11fa5d3f2ab8a643b71b1015c708ba0d.webp) 这是 File Agent 和云端模型协同的深水区。你可以把一个混乱的原始数据文档丢给它,然后给出复杂指令。 **实测案例:数据报告生成** 1. **指令**:“分析‘销售数据.xlsx’中第三季度的表现,找出环比增长最快的三个品类,用表格总结,并生成一段 200 字的分析建议。” 2. **执行流**:File Agent 读取 Excel → 云端模型分析数据、计算环比 → 本地生成总结表格和分析文本。 3. **产出**:几秒钟内,就得到了一个格式清晰的 Markdown 表格和一段结构化的分析文字,可以直接复制到周报里。 ***格式转换与润色**:对长文档说“翻译成英文并保持格式”,或者“把这篇技术文档润色得更通俗易懂”,它都能在保持排版(标题层级、列表)基本不变的情况下完成任务。 ## 六、安全、隐私与未来展望 **安全设计**是 Marvis 作为系统级 Agent 的底线。其核心是 **“AI 中间层”设计**:用户与复杂系统之间隔着一层智能调度器。所有涉及删除、支付、关键配置的操作,都必须经过用户确认(硬垂询)。在本地模式下,模型在沙箱环境中运行,确保不会意外修改系统文件。 **隐私保护**方面:本地模式数据零上传;效率模式下,云端只接收任务指令和必要的非敏感上下文,不主动上传文件内容。其隐私协议明确规定了数据处理边界,符合国内数据合规要求。 **局限与展望**:目前,它对专业软件(比如 IDE、设计工具)的深度操控仍有局限,更多是打开、关闭、切换窗口。其 App Agent 的能力边界取决于软件本身是否提供 API。未来,随着更多软件开放接口,以及多模态理解能力的增强,Marvis 有望从“系统助手”进化成真正的“数字工作副脑”,实现跨应用、跨端的复杂工作流自动化编排。 ## 总结:谁适合使用 Marvis? 如果你符合下面任意一条画像,那强烈建议尝试一下: * **效率追求者**:厌倦了在文件海洋里手动翻找,频繁调整系统设置。 * **多设备用户**:需要在手机、电脑之间无缝衔接任务。 * **隐私敏感者**:有大量本地文件需要智能管理,但不愿上传云端。 * **AI 技术爱好者**:想亲身体验多智能体协作、端云协同这些前沿架构的落地产品。 **最后给个建议**:把它当作一个需要“驯化”的助手。指令越具体、越符合它 Agent 能力的划分(文件、系统、应用),它的表现就越惊艳。从“帮我整理桌面”这类模糊指令,进阶到“把下载文件夹里一周前的图片,按日期移动至‘历史截图’文件夹”这种精确指令,你会真切感受到生产力的跃升。
来源:https://cloud.tencent.com.cn/developer/article/2682111
上一篇Hermes Agent身份定制设计:3层提示词与14人格源码解析 下一篇7大宝藏市场 收录全网最火Agent Skills
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
手把手教你免费获取小米MiMo百万亿Token及Claude Code配置全流程
AI教程 · 2026-06-04

手把手教你免费获取小米MiMo百万亿Token及Claude Code配置全流程

前言:百万亿Token免费额度领取指南 近期,小米MiMo大模型推出了重磅福利——百万亿Token的免费额度,申请流程极为简便,额度也十分充足,并且支持直接接入Claude Code等主流工具。本文将完整演示从注册申请、获取API密钥,到最终在Claude Code中完成配置的全流程,跟着操作即可轻

Sentinel-3B OLCI L3全球降分辨率叶绿素数据2022.0版
AI教程 · 2026-06-04

Sentinel-3B OLCI L3全球降分辨率叶绿素数据2022.0版

Sentinel-3B OLCI Level-3 Global Mapped Earth-observation Reduced Resolution (ERR) Chlorophyll (CHL) Data, version 2022 0 叶绿素a浓度全球网格化数据集简介 叶绿素a浓度是衡量海洋浮

我每月省千元组建一支全天候云端AI团队
AI教程 · 2026-06-04

我每月省千元组建一支全天候云端AI团队

先说个有意思的现象。 前两天,我的视频生成团队“入职腾讯”了。在WorkBuddy专家团里,不少伙伴已经开始用这个工具做短视频。本来以为这事儿就这么定了,结果这两天,反而开始疯狂返工——我发现它只能生成文字驱动的视频,还不能像真正的视频团队那样,把配图的活儿也给干了。 于是,继续优化。 先给你看个好

如何编写合格的AI工作流指令:提升编辑技能
AI教程 · 2026-06-04

如何编写合格的AI工作流指令:提升编辑技能

如何编写一个合格的 Skill:AI 工作流核心指令集指南 在 AI 工作流的实际应用中,Skill(技能指令)常常被误解。许多人将其与普通提示词(Prompt)混淆,导致写出的指令过于宽泛或模糊,AI 难以精准执行。实际上,Skill 的本质是一套结构化的行为指令集,它引导 AI 助手在特定场景下

TRAE AI编程入门第三讲:Rules、Memory、MCP与Skills突破边界
AI教程 · 2026-06-04

TRAE AI编程入门第三讲:Rules、Memory、MCP与Skills突破边界

最近几天我会逐步公开自己策划的系统化 AI 编程入门课程大纲,欢迎各位提出宝贵建议。 这套课程暂定 4+1 节:4 节主课以 TRAE 为载体,带领大家零基础入门 AI 编程;外加 1 节扩展课,专门为非技术背景的学员补充软件工程基础知识。具体安排如下: 第一节:TRAE AI 编程入门——Vibe