游乐游手机版
首页/AI热点日报/热点详情

Manus启示:Agent产品设计应减少结构约束

类型:热点整理2026-07-03
Manus AI agent的产品设计,为Agent产品的未来指明了方向。核心内容:1 Manus的核心功能:虚拟机、自主任务规划及全流程无人值守2 如何碘伏传统“套壳”认知,实现更广更深的搜索能力3 Manus设计理念“Less structure More intelligence”的深远

Manus AI agent的产品设计,为Agent产品的未来指明了方向。
核心内容:
1. Manus的核心功能:虚拟机、自主任务规划及全流程无人值守
2. 如何碘伏传统“套壳”认知,实现更广更深的搜索能力
3. Manus设计理念“Less structure More intelligence”的深远影响

Manus 给 Agent 产品设计带来的启示:Less Structure

前晚,一个名为 Manus 的 AI agent 产品 Demo 视频悄然刷屏 AI 媒体圈。

看完整段视频,不少人深夜都在反思工程思维的固化,以及团队对模型能力边界反应迟钝的代价。这段时间项目上有个困扰了许久的难题,Manus 这个看似简单的 Demo,竟然点醒了解决方案。

次日醒来,Manus 已经点燃了国内圈子,邀请码一码难求,二手平台上甚至有人花 5 万求一个——这个让大模型拥有“整台电脑”的通用 Agent,彻底碘伏了人们对“套壳”的原有认知。

当然,爆火的产品少不了媒体的吹捧,也少不了那些没拿到邀请码者的酸葡萄心理。

其实从行业视角来看,Manus 是不是第一个通用 Agent、其能力如何并不是关键。真正值得关注的,是 Manus 团队提出的 Agent 设计理念:“Less structure More intelligence”。这一理念对后续产品的启发,远比一场短暂的热度更有价值。

01 · Manus 做了什么

Manus 的名字源于拉丁语“Mens et Manus”(意为“知行合一”,麻省理工的校训)。

与市面上需要人工编排 Workflow 的 Coze、Dify 等产品不同,Manus 的核心在于三个层面:

  • 给模型一台“虚拟机”:将 Computer Use 与 Tool Use 深度融合,让模型能够独立于人类工作,而不必与人抢电脑。

  • 自主任务规划:模型根据目标自动拆解、规划 Todo 并执行,而非依赖人为搭建的 Workflow。

  • 全流程无人值守:从“生成 PPT 大纲”到“输出完整 .pptx 文件”,无需人类中途干预(当然,实测中部分 case 仍需要人工介入,例如遇到验证码时)。

相当于给 AI 配置了一个完整的工作台,让它像真人一样操作电脑完成任务——不仅有普通大学生的水平,还能任劳任怨地干那些脏活累活。

02 · 为什么说改变了人们对“套壳”的认知

抛开 Computer Use、MCP、自主规划这些早已存在概念不谈,有一个问题在看完 Demo 视频当晚值得反复推敲:

为什么要给模型一台 PC?这与我直接通过 Function Call 输出结果,有什么区别?

直到 Manus 放出邀请码,实测了几个案例后,答案才浮现出来。

首先,最大的区别在于:Manus 通过操作浏览器加视觉识别,获取到了更多 API 未能提供的信息。搜索的广度与深度都大大增加,在 Deep Research 任务上的表现不输普通校招生或实习生。

目前最具代表性的案例——海辛老师让 Manus 教她拍恐怖片。Manus 打开了 B 站,现学了 20 多分钟,甚至在看了搜狐上相关文章后还顺手点了举报……(Manus:顺手的事儿~)

众所周知,小红书中拥有大量优质笔记内容,日均搜索量约 6 亿次,近三分之一用户打开小红书的第一个动作就是搜索。可惜它并没有开放的搜索接口,让模型能直接获取其中的优质内容。

当模型拥有了 PC 之后,社区便没有了真正的围墙。

其次,模型对工具的使用产生了质变——从“顾问”升级为“高级牛马”的角色。

想必大多数人都尝试过让 AI 生成 PPT。结果往往是:AI 只输出大纲与些许内容,好一点的调用 AIPPT 套个固定模板,或者直接用 HTML 画一个给你,你还得找到“导出”才能拿到 .pptx 文件。

确实,这种方式能解决一些简单的 PPT 需求,但总觉得它太反 AI 了。

Manus 把 PC 交给模型,经过自主搜集信息、学习,设计出更符合场景的 PPT,并将 .pptx 文件直接交到你手中。

当模型真正开始“使用”而不仅仅是“调用”工具时,人们确实瞥见了一丝通用 Agent 的光。

以下是将同一份教案交给 AIPPT 和 Manus 制作英语教学课件的结果——显而易见的是,没有老师会拿着前者去上课,否则就是教学事故……

无 PC 产出物(Gamma)

带 PC 产出物(Manus)

所以,Manus 能爆火、能被媒体吹捧,是因为它让人们看到了一种 Agent 的新范式,改变了人们对产品层“套壳”所产生化学反应的认知。这绝不仅仅是因为邀请码稀缺。

诚然,冷静者也指出:Manus 只是把 Claude、Computer Use、MCP、自主规划等早已在各种 Agent 概念产品上实现过的功能进行了套壳缝合,并没有技术突破。

产品应用上的实现落地,硬要归结为技术突破,恐怕是对牛弹琴。很多公司能开发出第二个“抖音”,却不见得能做出第二个“抖音”。

从结果来看,Manus 团队能将这些零散的概念深度融合并先行落地,在爆火的同时让更多人了解了 AI Agent,这本身就足以证明其优秀。

套壳本身不是问题,问题在于套不好壳、或者有壳不套。

大家总是会从一个极端走向另一个极端。我们的态度是不要过于捧杀或 diss,甚至还出现了许多阴谋论……过犹不及。能够以足够的包容和理性去看待 Manus,去对待华人创业团队。现在的爆火也出乎 Manus 团队意料之外,设置邀请码是因为 Multi-Agent 很消耗算力资源,让一个创业团队完全开放给所有用户并不现实。

——《一些关于 Manus 的独家信息和慢思考》特工宇宙

回到开头的主题,从 Manus 的理念中能获得一个核心启发:Less structure, more intelligence——尽可能屏蔽人类认知框架对模型的限制,多去探索模型的能力边界,让智能涌现。

受限于对模型能力边界的认知局限,以往为满足复杂 case,行业里设计过无数 Prompt、Workflow。最终过度依赖人工设计框架去约束模型的后果,就是“人工智能,人工多于智能”。

在某些场景下,给足工具后,放手让模型自由创造,或许会得到更好的结果。

03 · 上头后的冷水

实话实说,Manus 虽然给 Agent 设计带来了新范式,但离真正的通用还有距离。看了大量实测 case 后,卡死率仍然不低。以下是几个主要问题:

  • 效率:即使是简单的 case,也需要耗时 2-4 小时。例如电商商品比价,有杀鸡用牛刀之感。

  • 资源:每个任务需要独立的 Docker 容器,服务器压力巨大。

  • 视觉:模型对 UI 的理解能力尚显不足。除上下文限制外,大多数任务卡死都源于界面理解问题。

  • 细分领域:在强依赖领域内数据的场景中,即便通过浏览器也难以搜集到有效信息。

至于算力消耗的问题,暂且不提。毕竟算力价格一直在下降。

04 · 对 Agent 赛道两级分化的思考

可以看到 Agent 创业的两条路径:

  • 通用派:追求“Less Structure, More Intelligent”的通用智能。

  • 垂直派:深耕细分领域,用专业知识与不开源的业内数据构筑护城河。

在 Manus 的闭门分享会上,有一页 PPT 内容写道:

“Agent Killer”——大致解读是,现阶段以 Manus 为代表的通用派已经“杀死”了细分派 Agent。

作为身处教育细分赛道的 Agent 设计者,这一观点并不令人认同。

跪拜 Coding 领域,有 GitHub 这样一个强大的开源社区,使得 Devin、MetaGPT 成为最先成熟落地且商业化的 Agent。但在金融、医药等其他领域,隐藏着大量冰山角下的私有数据。数据,才是最深的护城河。

当大模型尚未内化行业 know-how 时,细分领域专家设计的 Structure 仍是刚需。业内私有数据训练的专家模型,仍不可或缺——不过这扇窗口期可能比想象中更短。

在硅基与碳基的十字路口,人机协作的范式正在被不断改写。变革之中没有永恒的赢家,只有持续的进化者。感谢 Manus “弱框架,强智能”架构带来的启发,这或许就是许多当前项目的破局点。

来源:https://www.53ai.com/news/LargeLanguageModel/2025031736594.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。