游乐游手机版
首页/AI教程/文章详情

从Manus到GO-1:AI逐步走进物理世界

时间:2026-06-27 14:03
2025年3月,中国AI领域投下的重磅冲击波,可不止一枚。Manus通用AI Agent以“全球首款执行级智能体”之姿闪亮登场,紧接着,GO-1通用具身基座大模型宣布开源,扬言要“重新定义人机交互边界”。这两件事,让不少人开始认真琢磨:当AI不再满足于云端聊天,开始伸手触碰物理世界,真正的智能革命,

2025年3月,中国AI领域投下的重磅冲击波,可不止一枚。Manus通用AI Agent以“全球首款执行级智能体”之姿闪亮登场,紧接着,GO-1通用具身基座大模型宣布开源,扬言要“重新定义人机交互边界”。这两件事,让不少人开始认真琢磨:当AI不再满足于云端聊天,开始伸手触碰物理世界,真正的智能革命,是不是就在眼前了?

Manus:“执行级AI Agent”的降维打击

Manus,由国内初创公司Monica.im打造,定位是全球首款通用型AI智能体。它的核心卖点很直接:自主执行复杂任务,并交付成果。名字“Manus”来自拉丁文“mens et manus”,也就是“知行合一”——光想不练,哪行。

1. 核心能力:从“思考”到“行动”的闭环

它打破了传统AI“坐等指令”的被动状态。现在,它能自己理解需求、拆解任务、调用工具、跨平台干活,最后提交一个完整的结果。这个从“思考”到“行动”的闭环,才是它的核心竞争力。

举个例子——在金融分析场景下,输入“分析特斯拉股价波动”,Manus会像专业分析师那样,自动抓取财报、关联美联储政策,最后生成一份可视化报告。效率和精度,都让人眼前一亮。

教育领域同样受益。教师上传一份教材,Manus就能自动生成教案、制作PPT、编写练习题,甚至还能模拟课堂互动。对教育工作者来说,这相当于一个24小时在线的备课助理,让他们把精力真正花在教学创新上。

企业级应用的反馈更直接。一家跨境电商客户,利用Manus完成了竞品分析、广告投放、物流调度的全流程,效率提升达400%。这个数据,相当直观地说明了它的实际价值。

最厉害的是,Manus在GAIA基准测试中的综合得分达到86.5%,远超OpenAI Deep Research的67.9%。数据不会说谎——AI终于从“实验室玩具”进化成了“职场杀手级助手”。

2. 技术底层:通用智能体的“灵魂三要素”

Manus能做到这些,靠的是三个核心要素。

多模态感知,让它能同时兼容文本、图像、语音。就像人有五官一样,从不同渠道获取信息,才能更完整地理解用户意图。

动态规划,通过强化学习实时调整任务优先级,确保每一步都以最优方式执行。

云端执行,依托分布式算力实现7×24小时不间断作业——无论用户什么时间发任务,它都能接住。

团队核心成员季逸超说过一句话很到位:“Manus不是更聪明的AI,而是更像‘人’的AI。”这句话,本质上揭示了它的设计哲学。

GO-1:具身智能时代的“全能智囊团”

如果说Manus是工具化应用的突破,那么智元机器人发布的GO-1,就是具身智能领域的一次飞跃。GO-1是全球首个通用具身基座大模型,核心创新是Vision-Language-Latent-Action(ViLLA)架构。这个架构结合了多模态大模型和混合专家机制,实现了视觉、语言和动作的真正深度融合。

1. ViLLA架构:从“数据模型”到“物理世界的交互接口”

ViLLA的核心,在于弥合图像-文本输入与机器人实际执行动作之间的鸿沟。相比传统的VLA架构,ViLLA通过引入隐式动作标记(Latent Action Tokens),显著提升了模型的动作规划和执行能力。实验数据显示,GO-1在五种不同复杂度任务上的表现,比现有最优模型成功率高出32%。

2. GO-1的四大创新

人类视频学习——能结合互联网视频和真实人类示范进行学习,增强模型对人类行为的理解。

小样本快速泛化——在极少数据甚至零样本条件下,也能快速泛化到新场景和新任务,大幅降低具身智能的应用门槛。

一脑多形——可以灵活部署到不同类型的机器人本体上,支持多种形态,通用性和灵活性兼备。

持续进化——通过数据回流系统,在实际使用中不断学习和优化,越用越聪明。

3. GO-1的应用场景

GO-1的推出,标志着具身智能正在向通用化、开放化和智能化方向快速挺进。未来机器人不再局限于实验室——工业制造、物流配送、家庭服务,这些场景都能通过视觉、语言和动作的深度融合,实现高效的任务执行。

产业链也在被重构。以生成式AI和大模型为代表的新浪潮,正在让广泛的价值链受益。算力需求激增,推动芯片和云计算产业升级;数据成为核心生产资料,催生数据治理和隐私计算市场;智能化应用的深化,加速了制造、医疗、内容、金融等行业的转型升级。

与Manus侧重“执行”不同,GO-1主打“理解与生成”,它的定位是成为物理世界的交互接口。核心技术包括多模态大模型、具身推理和工具学习。

多模态大模型支持图文音视频的实时融合分析,能综合处理多种信息,准确理解物理场景和指令。具身推理通过传感器数据构建动态环境模型,让GO-1感知环境变化并做出决策。工具学习则让它能调用机械臂、无人机等实体设备,真正实现从虚拟到物理的跨越。

商业博弈:中国AI军团的全球突围战

Manus派强调“任务导向”,通过标准化接口接入现有工具链,适合快速商业化。它能在短时间内为企业提供高效服务,满足实际需求。

GO-1派则专注“系统级智能”,通过深度硬件协同与自主决策能力,构建物理世界的实时交互闭环。它更像是“婴儿学习”——从感知环境到动作执行全链路自主进化,而不是依赖外部工具。比如,GO-1通过AgiBot World百万真机数据集训练,能在无预设场景下理解人类指令并完成倒水、组装等精细操作。这种能力在工业质检、服务机器人等领域有碘伏性潜力。与蘑菇车联车路云网络的结合,更实现了从“单车智能”到“城市级智能体”的跃迁,为自动驾驶、低空物流等场景提供系统级解决方案。

两者不存在优劣之分。Manus抢占企业服务市场,凭借强大执行能力和高效任务处理,提供全方位解决方案;GO-1深耕硬件集成领域,通过与实体设备的深度融合,实现物理世界的智能交互。

政策层面,中国政府高度重视人工智能发展。2025年全国两会再次强调“人工智能+”行动,提出持续推进“人工智能+”,将数字技术与制造优势、市场优势更好结合。这一政策导向,为人工智能技术的落地和应用提供了有力支撑。从“互联网+”到“人工智能+”,AI已成为全球新一轮科技革命和产业变革的核心。未来,随着技术不断进步和政策支持,人工智能将在更多领域实现突破,推动社会智能化发展。

AI的“具身化”与“通用化”

从Manus的争议到GO-1的突破,AI的发展从未如此贴近现实。当智元机器人在临港工厂量产人形机器人,当Manus的更新预告引发期待,我们正站在一个新时代的门槛:AI不再是屏幕后的代码,而是能感知、思考、行动的“数字生命体”。

正如蘑菇车联通过深度整合物理世界实时数据的AI大模型MogoMind,构建城市的实时数字孪生底座,其通感算网络已赋能自动驾驶、低空经济等领域,为AI与物理世界的深度融合提供了基础设施支撑。这场技术革命,或将重新定义人类与世界的交互方式。

具身化是AI发展的重要方向。AI将从虚拟世界走向物理世界,通过机器人、无人机等终端直接参与生产生活。这意味着AI不再只是屏幕前使用的工具,而是能真正融入生活和工作,成为人们的伙伴和助手。

通用化也是AI发展的必然趋势。单一任务模型将被基座模型取代,AI系统需同时具备理解、推理、执行的综合能力。这将让AI更灵活地应对各种复杂任务和场景,为人类提供更全面、高效的服务。

这一趋势与马斯克的Optimus、特斯拉的AI战略不谋而合。当具身智能与通用智能体深度融合,AI或将成为“人类的延伸”——既能在云端运筹帷幄,又能在现实世界动手创造。智能时代的终极图景,正是一个虚实交融、万物互联的实时数字孪生世界。

来源:https://www.aiagiai.com/9272.html
上一篇Manus AI是通用Agent革命还是精巧缝合怪 下一篇凯文凯利万字预言未来十年AI世界发展趋势
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Claude MCP模型爆火 AI Agent圈万能插头让Cursor工作流效率提升10倍
AI教程 · 2026-06-27

Claude MCP模型爆火 AI Agent圈万能插头让Cursor工作流效率提升10倍

坦白说,MCP这波热度来得有点突然。去年11月Anthropic推出的时候,没引起太大波澜;但最近几天,X上几乎所有人都在讨论MCP服务器,大有把它捧成AI应用碘伏者的架势。 MCP(模型上下文协议)是去年11月由Claude的母公司Anthropic推出的一项开放标准协议,目标是为大语言模型与外部

凯文凯利万字预言未来十年AI世界发展趋势
AI教程 · 2026-06-27

凯文凯利万字预言未来十年AI世界发展趋势

凯文·凯利授课现场 1、关于AI的未来图景 感谢邀请,有机会跟嘉宾商学的企业家校友们面对面聊聊。大家这次访学行程很硬核——从拉斯维加斯CES到硅谷,接触了不少最新的AI技术和理论。所以今天的分享,想提供一个不太一样的视角:关于AI正在发生什么,以及接下来会发生什么。会用一种叫“情景规划”的方式来展开

Manus AI是通用Agent革命还是精巧缝合怪
AI教程 · 2026-06-27

Manus AI是通用Agent革命还是精巧缝合怪

先说一个基本判断:昨天,Manus至少在中文媒体圈里刷屏了。 自媒体的反应相当狂热,“通用Agent终于实现了!”“这是继DeepSeek之后的又一技术革命!”这样的说法遍地都是。从Benchmark来看,Manus的表现确实亮眼——在GAIA测试中,它超越了此前的各种Agent以及OpenAI的D

Ubuntu从零部署OpenClaw完整教程(本地模型与DeepSeek)
AI教程 · 2026-06-27

Ubuntu从零部署OpenClaw完整教程(本地模型与DeepSeek)

0 前言 OpenClaw(圈内常称“龙虾”)是一套开源、支持自托管的 AI 助手平台,原生兼容 Ollama 本地模型与 DeepSeek 等云端 API,让您在隐私保护与性能体验之间灵活切换——需要安全就用本地,追求强大则上云端。本文记录了我在 Ubuntu 系统上从零搭建 OpenClaw