Monica 昨晚正式发布了旗下全新 AI Agent 产品 Manus,消息一出,我所在的几个 AI 交流群瞬间沸腾,讨论热度持续攀升,各大媒体也纷纷刷起了惊叹号。
从外行看热闹到内行看门道,本文将从 8 个维度系统剖析 Manus——不吹不黑,客观分析它的真正亮点,以及需要理性看待的部分。

1. 首先,必须祝贺 Monica,这次操作确实漂亮。他们完成了一次非常出色的垂直整合。透过这款产品,能明显感受到团队对技术栈的深刻理解和强大执行力。
2. Manus 让普通用户感到惊艳,这一点毫无悬念。因为它呈现出了一种“真人干活”的既视感——AI 逐步打开浏览器、搜索、操作,整个过程完全可视化,视觉冲击力极强。但这种惊艳主要面向普通用户。如果 AI 媒体也跟着喊“炸裂”“第一”“首创”,其实大可不必。按理说,AI 媒体之前不可能没用过 Devin 吧?不难推测,Devin 的产品思路对 Manus 的产研团队产生了深刻启发。
3. Manus 本质上是 UI 层面的探索。虽然并非首创,但 Monica 是第一个把这种交互范式带入普通用户场景的团队——此前 Devin 主要面向编程场景,用户基数小且门槛高。Manus 扩大了用户范围,同时形成了更高的价值势能差,这一点值得点赞。可以说,这是既有勇气又有能力的体现。
4. “有能力”具体体现在以下三点:
(1)对模型进行了相当规模的 post train(后训练)。这是惊艳感的本质来源。之前就强调过:要想拥有“魔法感”,就必须加入端到端的训练。
(2)实现了多 Agent 协同,同时也做了多模型的整合调用——并非只接入了某一家单一模型。要知道,Monica 本来就是做模型聚合的,在这方面有自己的 know-how,而这次正好用到了 Manus 上。谁说套壳没有 know-how?谁说这些 know-how 不重要?
(3)垂直整合了多个现有技术。是的,Manus 背后涉及的主要技术都是现成的,并非底层技术的突破。但整合这些技术本身就是能力的体现——也许和一般人的直觉相反,从行业经验来看,整合能力其实是更难、更高级的能力。
这三点,应该就是 Manus 能在某些 benchmark 测试中超过 OpenAI Deep Research 的原因。不过必须说,这个“超过”并没有技术壁垒上的意义——但话说回来,为什么一定要有呢?
5. 不要仅仅停留在“真人干活”的惊艳感上。基于以上分析,可以预见,Manus 并不会比其他各家 Deep Research 产品拥有多大的碾压优势。从目前展示的任务案例来看,产出效果和价值感与 Claude 或 GPT 并没有太大区别。
6. 但反过来,如果因为“没有太大区别”就说 Manus“不怎么样”,那也是不对的。Devin 以及今天的 Manus 所带起来的这一 UI 交互范式,本身是有价值的。看着 AI 展示自己打开浏览器刷网页,本质上跟看到 DeepSeek 展示思考过程是一样的——人们就是希望看到这些。这符合基本的交互设计原理:掌控感 + 过程介入。
更重要的是,交互的变化会带来能力的变化。当前技术方案所形成的交互形式,确实能更好地让 AI 完成一些仅靠后端调用和解析很难完成的任务。更何况,这只是目前的产品效果,一个早期的尝试。接下来呢?如果模型未来再经过几代训练,如果交互带来的能力进一步发展——也许将打开新的天地。
7. 这件事,即便是 OpenAI 或 Claude 做出来,也值得惊艳一把。考虑到 Monica 的公司规模和发展阶段,他们这次完成了一个极其漂亮的作品。
8. 不要想当然地评价一件事的价值和难度。就像之前一篇文章里说的那样:不是每个套壳都是垃圾,有的套壳就是未来。
