AI智能体产品实用测评三款热门工具真实体验对比

时间：2026-05-25 09:43

自Manus发布以来，关于这类通用型智能体的讨论就未曾停歇。如今，当舆论热潮逐渐退去，或许正是我们冷静审视其真实面貌的好时机。全网爆火的Manus到底能做什么？超多演示案例来了！三月初，Manus的亮相几乎席卷了整个科技AI圈。那么，它究竟是什么？简单来说，它代表了一种构建思路：通过多模型协作，

自Manus发布以来，关于这类通用型智能体的讨论就未曾停歇。如今，当舆论热潮逐渐退去，或许正是我们冷静审视其真实面貌的好时机。

全网爆火的Manus到底能做什么？超多演示案例来了！

三月初，Manus的亮相几乎席卷了整个科技AI圈。那么，它究竟是什么？简单来说，它代表了一种构建思路：通过多模型协作，试图向那个理想的“世界大模型”迈进。这个方向本身值得肯定。

然而，理想丰满，现实却有些骨感。在实际测试中，号称要“重新定义AI协作”的Manus，却暴露了不少问题：生成的PPT打不开WPS、股票分析用错了数据……诸如此类。这类产品的出现，无疑推动了行业对智能体未来的思考，但从实际可用性的角度来看，目前多数的通用智能体，似乎都难逃“噱头大于实用”的现状。

接下来，我们将对目前市面上三款颇具代表性的“通用Agent”产品进行一次深入剖析。先抛出核心结论：目前这三款产品的可用性普遍不足，任务成功率偏低。在文字处理等核心能力上，它们与大型语言模型的原生功能差异不大，所谓的“通用Agent”附加价值相当有限。

一、能力对比

1. Manus

主观评分：☆☆

信息收集：能够访问网页，并读取其中的图片及PDF文档内容。

编程：接入了Claude代码大模型。

PPT生成：支持编辑，但生成质量较差。

图像生成：不支持。
视频生成：不支持。

资费：提供免费版，每月1000积分；付费套餐分为Starter和Pro，月费分别为39美元和399美元。

2. Genspark

主观评分：☆

信息收集：可访问网页及读取其中的图片、PDF内容。

编程：接入了多种代码大模型混合使用。

PPT生成：采用代码方式编写PPT，视觉效果尚可，但生成的文件不可直接编辑。

图像生成：直接接入Flux、ideogram等图像大模型。

视频生成：直接接入可灵、minimax等视频大模型。

资费：免费版每日200积分；Plus版月费24.99美元。

3. 扣子空间

主观评分：☆

信息收集：可访问网页及读取其中的图片、PDF内容。

编程：接入豆包代码大模型。

PPT生成：视觉和结构尚可，同时提供PDF、PPT、文字三个版本，支持二次编辑。

图像生成：支持通过添加MCP拓展实现图片生成。

视频生成：不支持。

资费：目前完全免费，但每日有4-5个任务的数量限制。

二、产品深度剖析

Manus

1. 核心架构

其基础模块聚焦于信息收集、信息分析和代码编写，缺乏生成图片、视频等多模态功能。它采用多袋里架构，将任务拆分为规划、执行、验证等子模块，每个袋里基于独立的语言模型或强化学习模型，通过API协同工作。

优势：工作流程条理性较强，通常会先确定任务步骤，再依次执行；推理过程所使用的文件均可下载，流程透明度较高。

劣势：需要“魔法上网”，对部分用户构成使用门槛；多模态能力较弱，缺乏图像处理等工具；工具集有限，严重依赖Python脚本，例如可以生成PPT文件但质量较差且无法二次编辑；性能上，推理过程较慢，从收集资料到生成分析文档总计耗时接近30分钟。

2. 代码生成

代码能力直接依赖于调用的外部LLM模型，因此性能与所选模型保持一致。下图是其生成的前端页面示例。

3. 多模态与分析功能

对于图像仅有基本的分类功能，未配置专门的图像处理模型，因此深度分析效果不佳。在深度分析任务中，它会收集信息并使用代码方式生成调研报告发布在网页上，但其信源搜索和分析的全面性一般，与其他AI工具相比并无显著优势。

Genspark

1. 核心架构

基础模块覆盖AI对话、生图、视频、翻译等，沿用ChatGPT、可灵等主流模型。它定位为工具型智能体，提供了5类专业场景应用：综合智能体、深度研究智能体、事实核查智能体、数据表智能体、打电话智能体。不过，其宣传的“80+工具”实际多是基于“AI聊天、AI生图、AI视频、翻译”等基础类型的排列组合。

优势：功能模块全面，涵盖AI搜索与浏览器、图片工作室、视频生成、深度研究等；任务执行效率较高，尤其在处理多轮对话和复杂任务时。

劣势：同样需要“魔法上网”；工具创新不足，超过90%的功能与竞品同质化，仅有视频生成算独家配置（但当前质量未达可用标准），尚未形成真实竞争力；技术整合度低，更像是多模型的简单堆砌，缺乏深度调优；营销与实际存在落差，所谓的“概念智能体”并未突破传统Agent框架，部分格式转换等工具实为API封装。

2. 综合分析能力

实际使用流程与Manus类似：输入任务，Genspark自动安排工作并输出结果。生成的PPT视觉效果尚可，但同样无法进行二次编辑修改。

3. AI聊天

官方宣传其集成了多模型系统（含GPT-4、Claude3及自研模型），但实测发现，在常规对话、文本生成和信息检索等基础场景中，其表现与使用单一优质模型并无显著差异。

4. 图像生成

Genspark会编写一套提示词，然后调用Flux等公开模型（有时是旧版）直接生成图片。其生成效果通常逊于直接使用专业的生图工具。

5. 视频生成

视频生成调用的是可灵等开放模型，存在清晰度低、画面不稳定等问题，且积分消耗巨大，一次生成就可能耗尽当日所有免费积分。最终效果也差于直接使用原生的生视频工具。

当视频在手机上无法加载，可前往PC查看。

扣子空间

1. 核心架构

Agent类型：
通用Agent：与Manus思路相似。
专家Agent：在通用Agent基础上内置了特定提示词，目前主要面向用户研究、股票分析等场景。

两种主要模式：
探索模式：用户无法修改AI规划的任务步骤。
规划模式：允许用户修改AI规划的任务步骤内容。

此外，它支持通过接入图片生成MCP来产出图片，并基于豆包大模型处理多模态数据。

优势：无需“魔法上网”，目前完全免费；提供探索和规划两种模式，赋予用户更多控制权；支持MCP扩展，理论上能不断扩展Agent能力边界。

劣势：官方宣传的“各行各业「领域专家」”，目前仅有两个，且无法在规划模式下调整其执行任务的内容；MCP扩展目前是固定列表，不支持自定义，应用空间受限；性能上依赖豆包模型的逻辑能力，处理复杂任务（如商业模型分析）时易出现细节缺失，规划模式的推理过程也较慢，暂不具备高可用性；任务完成后无法进行二次对话；作为Beta版本，高峰期服务器易拥堵，影响响应速度。

2. 通用Agent（探索模式）任务示例：品牌对比分析报告

通用Agent会进行快速思考并启动浏览器搜索，获取信息后生成并部署网页。但存在数据不够新的问题（例如仍使用2023年内容），且生成文档中的引用未标注具体来源，可信度存疑。