游乐游手机版
首页/AI热点日报/热点详情

字节硬核开源两款类Manus智能体项目

类型:热点整理2026-07-04
字节跳动近日在开源社区发布了重磅更新——同步开源了两款类Manus的智能体项目,将AI自动化交互提升至全新水准。这一动态非常值得深度关注:从桌面操控、跨平台GUI自动化,到任务规划、信息检索与AI计算,所覆盖的应用场景极为全面。 Agent TARS:用自然语言直接指挥电脑 首先聚焦 Agent T

字节跳动近日在开源社区发布了重磅更新——同步开源了两款类Manus的智能体项目,将AI自动化交互提升至全新水准。这一动态非常值得深度关注:从桌面操控、跨平台GUI自动化,到任务规划、信息检索与AI计算,所覆盖的应用场景极为全面。

硬核,字节一口气开源了两个类Manus智能体项目

Agent TARS:用自然语言直接指挥电脑

首先聚焦 Agent TARS。这是字节跳动开源的一款基于视觉语言模型(VLM)的桌面端AI Agent工具,核心亮点非常直接:你只需通过自然语言下达指令,它就能代为操作电脑。简言之,让AI替你完成鼠标点击和键盘输入,且跨平台兼容——Windows、macOS、Linux均能运行。

它能做哪些事?举例来说,你直接说“发送一条包含‘Hello World’的推文”,或者“帮我查询一下旧金山的天气”,模型就会自动解析你的意图,并逐步执行对应操作。这背后依赖于多模态感知与交互能力——它不仅能理解文字,还能“看懂”屏幕上的界面元素,从而精准完成任务。

在性能方面,Agent TARS在OSWorld基准测试、AndroidWorld等评估中表现十分亮眼,证明其在实际桌面场景下的自动化能力已相当成熟。效果示例中还包含一个清明节旅行规划的演示,颇具趣味。

https://github.com/bytedance/UI-TARS-desktop

LangManus:社区驱动的AI自动化框架

另一个项目名为 LangManus,这是一个由社区驱动的AI自动化框架。它的定位更偏向“工具集”——整合语言模型与多种专用工具,用于网络搜索、爬虫、Python代码执行等任务。同时,该框架特别强调回馈社区,因为其本身也建立在众多开源项目的成果之上。

LangManus的核心能力包括:

  • 任务规划与细分——智能地将复杂任务拆解为子任务,并选择最优执行路径。
  • 信息检索与数据抓取——集成Tavily、Playwright等工具,自动从互联网获取所需信息。
  • 人工智能计算与分析——借助AI模型(如OpenAI、DeepSeek)进行数据处理和推理分析。
  • 自动生成研究报告——根据研究需求,自动生成格式化报告文档。

从这些功能组合来看,LangManus已不只是一个简单的自动化脚本,而是一个能承担端到端研究任务的Agent系统。从信息收集、分析到输出报告,全程自动化,在企业级应用中潜力巨大。

https://github.com/langmanus/langmanus

总体而言,字节跳动这两个项目的开源,标志着AI Agent的能力正从理论走向实用。无论是桌面端的直接操控,还是复杂任务的自动化编排,如今都有了可落地的开源方案。对于开发者而言,这不仅是工具,更是探索下一代人机交互方式的绝佳起点。

来源:https://www.53ai.com/news/OpenSourceLLM/2025032628395.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。