Manus启示：Agent产品设计应减少结构约束_AI热点日报

Manus启示：Agent产品设计应减少结构约束

类型：热点整理2026-07-03

Manus AI agent的产品设计，为Agent产品的未来指明了方向。核心内容：1 Manus的核心功能：虚拟机、自主任务规划及全流程无人值守2 如何碘伏传统“套壳”认知，实现更广更深的搜索能力3 Manus设计理念“Less structure More intelligence”的深远

Manus AI agent的产品设计，为Agent产品的未来指明了方向。
核心内容：
1. Manus的核心功能：虚拟机、自主任务规划及全流程无人值守
2. 如何碘伏传统“套壳”认知，实现更广更深的搜索能力
3. Manus设计理念“Less structure More intelligence”的深远影响

Manus 给 Agent 产品设计带来的启示：Less Structure

前晚，一个名为 Manus 的 AI agent 产品 Demo 视频悄然刷屏 AI 媒体圈。

看完整段视频，不少人深夜都在反思工程思维的固化，以及团队对模型能力边界反应迟钝的代价。这段时间项目上有个困扰了许久的难题，Manus 这个看似简单的 Demo，竟然点醒了解决方案。

次日醒来，Manus 已经点燃了国内圈子，邀请码一码难求，二手平台上甚至有人花 5 万求一个——这个让大模型拥有“整台电脑”的通用 Agent，彻底碘伏了人们对“套壳”的原有认知。

当然，爆火的产品少不了媒体的吹捧，也少不了那些没拿到邀请码者的酸葡萄心理。

其实从行业视角来看，Manus 是不是第一个通用 Agent、其能力如何并不是关键。真正值得关注的，是 Manus 团队提出的 Agent 设计理念：“Less structure More intelligence”。这一理念对后续产品的启发，远比一场短暂的热度更有价值。

01 · Manus 做了什么

Manus 的名字源于拉丁语“Mens et Manus”（意为“知行合一”，麻省理工的校训）。

与市面上需要人工编排 Workflow 的 Coze、Dify 等产品不同，Manus 的核心在于三个层面：

给模型一台“虚拟机”：将 Computer Use 与 Tool Use 深度融合，让模型能够独立于人类工作，而不必与人抢电脑。
自主任务规划：模型根据目标自动拆解、规划 Todo 并执行，而非依赖人为搭建的 Workflow。
全流程无人值守：从“生成 PPT 大纲”到“输出完整 .pptx 文件”，无需人类中途干预（当然，实测中部分 case 仍需要人工介入，例如遇到验证码时）。

相当于给 AI 配置了一个完整的工作台，让它像真人一样操作电脑完成任务——不仅有普通大学生的水平，还能任劳任怨地干那些脏活累活。

02 · 为什么说改变了人们对“套壳”的认知

抛开 Computer Use、MCP、自主规划这些早已存在概念不谈，有一个问题在看完 Demo 视频当晚值得反复推敲：

为什么要给模型一台 PC？这与我直接通过 Function Call 输出结果，有什么区别？

直到 Manus 放出邀请码，实测了几个案例后，答案才浮现出来。

首先，最大的区别在于：Manus 通过操作浏览器加视觉识别，获取到了更多 API 未能提供的信息。搜索的广度与深度都大大增加，在 Deep Research 任务上的表现不输普通校招生或实习生。

目前最具代表性的案例——海辛老师让 Manus 教她拍恐怖片。Manus 打开了 B 站，现学了 20 多分钟，甚至在看了搜狐上相关文章后还顺手点了举报……（Manus：顺手的事儿～）

众所周知，小红书中拥有大量优质笔记内容，日均搜索量约 6 亿次，近三分之一用户打开小红书的第一个动作就是搜索。可惜它并没有开放的搜索接口，让模型能直接获取其中的优质内容。

当模型拥有了 PC 之后，社区便没有了真正的围墙。

其次，模型对工具的使用产生了质变——从“顾问”升级为“高级牛马”的角色。

想必大多数人都尝试过让 AI 生成 PPT。结果往往是：AI 只输出大纲与些许内容，好一点的调用 AIPPT 套个固定模板，或者直接用 HTML 画一个给你，你还得找到“导出”才能拿到 .pptx 文件。

确实，这种方式能解决一些简单的 PPT 需求，但总觉得它太反 AI 了。

Manus 把 PC 交给模型，经过自主搜集信息、学习，设计出更符合场景的 PPT，并将 .pptx 文件直接交到你手中。

当模型真正开始“使用”而不仅仅是“调用”工具时，人们确实瞥见了一丝通用 Agent 的光。

以下是将同一份教案交给 AIPPT 和 Manus 制作英语教学课件的结果——显而易见的是，没有老师会拿着前者去上课，否则就是教学事故……

无 PC 产出物（Gamma）

带 PC 产出物（Manus）

所以，Manus 能爆火、能被媒体吹捧，是因为它让人们看到了一种 Agent 的新范式，改变了人们对产品层“套壳”所产生化学反应的认知。这绝不仅仅是因为邀请码稀缺。

诚然，冷静者也指出：Manus 只是把 Claude、Computer Use、MCP、自主规划等早已在各种 Agent 概念产品上实现过的功能进行了套壳缝合，并没有技术突破。

产品应用上的实现落地，硬要归结为技术突破，恐怕是对牛弹琴。很多公司能开发出第二个“抖音”，却不见得能做出第二个“抖音”。

从结果来看，Manus 团队能将这些零散的概念深度融合并先行落地，在爆火的同时让更多人了解了 AI Agent，这本身就足以证明其优秀。

套壳本身不是问题，问题在于套不好壳、或者有壳不套。

_{大家总是会从一个极端走向另一个极端。我们的态度是不要过于捧杀或 diss，甚至还出现了许多阴谋论……过犹不及。能够以足够的包容和理性去看待 Manus，去对待华人创业团队。现在的爆火也出乎 Manus 团队意料之外，设置邀请码是因为 Multi-Agent 很消耗算力资源，让一个创业团队完全开放给所有用户并不现实。
——《一些关于 Manus 的独家信息和慢思考》特工宇宙}

回到开头的主题，从 Manus 的理念中能获得一个核心启发：Less structure, more intelligence——尽可能屏蔽人类认知框架对模型的限制，多去探索模型的能力边界，让智能涌现。

受限于对模型能力边界的认知局限，以往为满足复杂 case，行业里设计过无数 Prompt、Workflow。最终过度依赖人工设计框架去约束模型的后果，就是“人工智能，人工多于智能”。

在某些场景下，给足工具后，放手让模型自由创造，或许会得到更好的结果。

03 · 上头后的冷水

实话实说，Manus 虽然给 Agent 设计带来了新范式，但离真正的通用还有距离。看了大量实测 case 后，卡死率仍然不低。以下是几个主要问题：

效率：即使是简单的 case，也需要耗时 2-4 小时。例如电商商品比价，有杀鸡用牛刀之感。
资源：每个任务需要独立的 Docker 容器，服务器压力巨大。
视觉：模型对 UI 的理解能力尚显不足。除上下文限制外，大多数任务卡死都源于界面理解问题。
细分领域：在强依赖领域内数据的场景中，即便通过浏览器也难以搜集到有效信息。

至于算力消耗的问题，暂且不提。毕竟算力价格一直在下降。

04 · 对 Agent 赛道两级分化的思考

可以看到 Agent 创业的两条路径：

通用派：追求“Less Structure, More Intelligent”的通用智能。
垂直派：深耕细分领域，用专业知识与不开源的业内数据构筑护城河。

在 Manus 的闭门分享会上，有一页 PPT 内容写道：

“Agent Killer”——大致解读是，现阶段以 Manus 为代表的通用派已经“杀死”了细分派 Agent。

作为身处教育细分赛道的 Agent 设计者，这一观点并不令人认同。

跪拜 Coding 领域，有 GitHub 这样一个强大的开源社区，使得 Devin、MetaGPT 成为最先成熟落地且商业化的 Agent。但在金融、医药等其他领域，隐藏着大量冰山角下的私有数据。数据，才是最深的护城河。

当大模型尚未内化行业 know-how 时，细分领域专家设计的 Structure 仍是刚需。业内私有数据训练的专家模型，仍不可或缺——不过这扇窗口期可能比想象中更短。

在硅基与碳基的十字路口，人机协作的范式正在被不断改写。变革之中没有永恒的赢家，只有持续的进化者。感谢 Manus “弱框架，强智能”架构带来的启发，这或许就是许多当前项目的破局点。

来源：https://www.53ai.com/news/LargeLanguageModel/2025031736594.html

ai 人工智能

延伸阅读

补充最近整理过的热点入口。