短短不到一周时间,"AI从嘴强王者变成执行狂魔"这句话就在科技圈内迅速传开。Manus的爆火,其实有其必然性。它就像一位不知疲倦的数字管家,能干的事情跨度极大——从简历筛选到股票分析,从旅行规划到跨领域任务编排,甚至在用户睡觉的时候,它就能把三天的工作量全部搞定。
这一周多以来,各种理念层面的解读,甚至误伤,确实不少。有人说Manus就是个套壳产品,不过是调用了Claude的高级API;也有人觉得邀请码机制是一场刻意营销。但这些质疑,无法动摇一个事实:Manus身上确实有足够惊艳的创新亮点。
首先,交付结果相当精彩。传统智能体多半是给你一篇文字报告,Manus则直接端出超炫酷的网页展示。其次,执行过程极度透明——即便你没有那个抢破头的邀请码,也可以通过"回放功能"完整观看AI执行任务的每一个环节。第三,成本真的压得很低。对比OpenAI每月200美金的订阅门槛,Manus单次任务执行只要2美金。
其实要说最难受的,还是OpenAI。当年OpenAI发布o1慢思考模型,却没有向外界开放思考过程;结果DeepSeek的"嗯,用户让我..."深度思考模式填上了这个空白。同样,当OpenAI推出Operator和DeepResearch这样的超级Agent时,只对200美金/月的付费用户开放;结果Manus依靠"回放功能"的病毒式传播,又一次抢走了风头。免费加上好的产品体验,再加上可传播性——这套组合拳,轻松碾压那些看似高高在上的东西。这个道理,从未改变。有因,便有果。
这两天Github上那份越狱流传出来的【Manus Tools and Prompts】值得仔细琢磨。里面有几张图信息量很大:

—— 这张图点明了Manus的核心定位:收集信息、创造内容、解决问题。

—— 圈定了Manus的技能和工具边界,说白了就是它到底能干什么。

—— 解释了Manus本质上是一个多Agent系统,需要把多种Agent与上述工具能力组合起来,才能完整地完成用户布置的任务、提交最终成果。

—— 展示了Manus在执行任务时,会调用一系列特殊的固定能力模块。

—— 这说明Manus也对能力使用有严格的规范和约束,包括浏览器规则、编码规则、信息规则等。
也难怪,昨天OpenAI终于坐不住了,一口气向开发者发布了"3+2"套件能力。
"3"是三个高级Agent工具:网页搜索能力(Web Search)、文件与私域数据搜索能力(File Search),以及可自主在云端浏览网页查找信息的Computer Use Agent。
"2"则是两个对话反馈模式的高级整合:Response API从原来只能聊天,升级为对话+执行+搜索的组合模式;Agent SDK则从单一Agent完成任务,升级为可以调动多个Agent协同完成复杂任务。
OpenAI这次和2月份被DeepSeek捅破天时的被动不同,多少有点"有备而来"的味道。所以他们反复强调:2025年是Agent之年,The Year of Agent。
为什么这么说?里面有个重要的逻辑,得先看明白Manus是怎么工作的。
过去我们熟悉的AI助手,更像是一个只掌握了菜谱但永远下不了厨的学徒——你问"糖醋排骨怎么做",它能从第一步背到最后一步,却永远不会开火、不会切肉。而Manus就完全不同了,它像一位米其林主厨。接到"准备八人宴席"的指令后,自动买菜、调配灶具、掌控火候,最后端出色香味俱全的整桌菜肴。
这种质变,源于三个核心设计。
第一,"三脑协同"的智能中枢。规划脑像一位交响乐指挥家,运用蒙特卡洛树搜索算法(类似围棋AI的决策方式)动态拆解任务。比如处理100份简历时,它会先扫描文件结构,像主厨根据现有食材调整菜单那样,优先筛选学历匹配的候选人,再分析工作经验,最后合成报告。执行脑整合了超过200个工具接口,模拟人类操作浏览器点击、滚动,自动调用Excel生成图表,甚至编写Python分析代码。验证脑则通过对抗性测试模块来把关质量,这种"三重签名"机制——三个模型独立计算后交叉验证,确保结果可靠。
第二,"动态菜谱"进化系统。传统AI的"菜谱"是静态的,Manus支持实时反馈迭代。用户可以随时修正输出格式,好比食客要求"少盐多辣",主厨立刻调整配方并记住偏好。即便任务中途崩溃,它也能像智能冰箱那样保存进度,并用替代方案继续完成烹饪。
第三,"无菌厨房"安全机制。通过浏览器沙箱技术隔离操作,像在封闭实验室处理食材一样,避免隐私数据泄露。记忆偏好系统则像私人管家,持续学习用户习惯,在云端构建个性化的策略库。
说得直白一点,Manus就是把市面上能拿到(无论是付费还是免费)的优秀API工具,有机地组合在一起运作。每一个单点的能力都不是我的,但把它们组合起来,就成了Manus的神奇之处。
当传统模型巨头们还在持续打造"更大参数、更强推理能力"的模型,自产自用时,Manus团队选择成为"瑞士军刀工匠"。通过工程化组合多种模型和工具,他们核心解决了三个问题:一是工具适配,让一个厨师能熟练使用所有品牌的厨具;二是长线任务管理,传统AI像快餐厨师,必须用户盯着才能工作,Manus则像慢炖锅,能离火后继续焖煮;三是跨界能力,Manus可以同时处理简历筛选和股票分析,突破了垂直领域限制。
既然Manus能做到,其他人当然也能做到。当最基础的一批模型能力供给达到行业共识,当这些模型的能力边界被逐渐看清楚,上层应用的大幕就拉开了。
但这里有一个悖论:Manus是不是真的能像他们定义的那样,成为"通用Agent"?如果是,那其他Agent还有什么存在的必要?Agent的应用之年又从何谈起?如果大家用的是同样的模型API能力、同样的组合方式和工程效果,Manus1和Manus2又有什么区别?
答案很明显。模型可以通用,但Agent产品,必须百花齐放。在不同垂直行业,面向不同的用户群体,做不同的体验流程设计。Manus或许不是终点,但它无疑是一个新的起点。
即便在GAIA基准测试中接近人类水平(三级测试分别达到86.5%、70.1%、57.7%),Manus仍面临挑战。这些问题也是所有Agent产品共通的:模型API能力的局限性;稳定性和幻觉的潜在风险;以及商业模式的悬而未决。
但我们依然需要充分肯定Manus的价值。正如蒸汽机曾经漏气、电脑曾经死机,每一次技术突破都伴随着迭代的阵痛。Manus的意义在于,它证明了当AI突破"纸上谈兵"的阶段,真正成为"手脑并用"的执行者时,人机协作将进入前所未有的深度。当更多团队继承这种"手脑并用"的哲学,或许我们距离那个"动动嘴就能改变世界"的未来,真的不再遥远。
