首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
手机通用Agent实测:一键点外卖、自动生成PPT,还能帮你找工作

手机通用Agent实测:一键点外卖、自动生成PPT,还能帮你找工作

热心网友
95
转载
2025-08-22

每天睁眼后的第一件事是什么?刷手机。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

睡前的最后一件事是什么?还是刷手机。

但你有没有算过,每天要在不同App之间切换多少次?淘宝比价、美团点外卖、小红书找攻略——我们的手机里装着几十个App,却要靠十个手指在它们之间来回奔波。

这些碎片化的时间往往一天下来,足以让我们开始怀疑人生——时间都去哪儿了。

所以当AI Agent浪潮席卷而来时,我们的第一反应就是希望能有一个真正的手机通用Agent。它应该像一个随身助理,不管你在做什么,都随时响应你的需求,同时能够在后台默默工作,不打断你正在进行的任何事情。

其实早在Manus刷屏之前,智谱就已经在Agent赛道上埋头苦干了。我们之前测过他们的初代AutoGLM,印象还不错。而就在刚刚,智谱再次升级了AutoGLM Agent功能。

带着这样的疑问,我们想看看这款Agent能否把“手机自动驾驶”这个概念变成现实。

一句话就能让AI帮你打卡追剧点奶茶,AutoGLM Agent开启手机自动驾驶

据智谱官方介绍,AutoGLM Agent支持一句话实现“云端操作+自动执行”。简单来说,就是给你配一台云手机和云电脑,你说话,它干活。

你只需要通过自然语言发布指令,AutoGLM就能在云设备上自动完成各种任务:打开App、浏览网页、点外卖、订酒店、制作PPT和网页、生成视频,甚至可以在多个App间协同操作。

由于所有任务都在云端执行,也因此不占用你的手机或电脑资源,也不打断你正在进行的操作。打个比方,Chatbot告诉你“怎么做”,AutoGLM直接“帮你做”。

不过,目前市面上完美的AI产品是不存在的,整体体验下来,AutoGLM偶尔还是会犯迷糊,稳定性有待提升,同时,它目前仅支持部分预装应用,在安全性上,这样的限制是合理的,虽然理解,但确实有点“不够野”。

超话定时打卡有多难受,追星人懂的都懂。

“帮我给赵露思的微博(注释:目前已注销)超话打卡”——老实说,我就是想看看它能不能理解这个植根于中文互联网文化的需求。

结果它准确定位到了超话页面,完成了我的任务需求,说明这个Agent真的“混”过中文互联网,知道什么是超话,懂粉丝的日常。这种文化密码,国外AI学都学不来。

分享一个小tips,要想体验地更丝滑,建议还是需要提前完成账号登录。在实测中也发现,部分应用的登录状态可能没法长期保存,这是一个小小的痛点。

追星之外,我还把它用在了游戏场景里。

最近,痴迷于王者荣耀的我用杨戬打上了王者,但在打巅峰赛的时候已经感觉有些吃力,需要去“偷师学艺”一下。

于是我让AutoGLM Agent帮我在B站找到热度较高的博主,它很快就理解了我的语境和意图,帮我找到了合适的博主,效率拉满。

再比如追番,已经不想和没看过《凡人修仙传》国漫的朋友说话了。

前几天韩立结婴的消息一出,由于观看人数太多,B站都被挤崩溃了,虽然作为散修的我,由于没有VIP,同样被拦在了“护宗大阵”门外,但这并不妨碍我在预告里发表弹幕:“恭贺韩天尊结婴”,主打一个仪式感。

而这整个过程同样也都是交给AutoGLM Agent解决的。

不过,如果Agent只能执行单一任务,其实意义并不大。真正有价值的,是它能否执行复杂的长链路任务,所以我们继续上点强度。

“先打开QQ音乐,播放我的收藏里的第一首歌,接着打开小红书搜索贵州黄果树瀑布旅游攻略,找到收藏最多的图文笔记,点赞并收藏,然后关注发布这个笔记的博主”。

这可是跨越2个App的十几个操作。按以往经验,肯定会在某个环节掉链子。但实测结果中,整个流程一气呵成,几乎没有任何卡顿,这才是Agent该有的样子。

在生活里,它同样能带来小惊喜。

上班喝奶茶,是打工人的最后倔强。别的不说,光是能准确理解“蜜雪冰城的杨枝甘露”这个需求,就已经超过了我对现阶段AI的期待。要知道,这不是简单的文字识别,而是需要理解品牌、产品类别。

再比如化身剁手党的我,让它“在京东搜索最新款的AirPods Pro并收藏”——结果它不仅准确找到了商品,还很贴心地停留在详情页让我确认了一下价格。这种细节把控,像极了资深代购。

我把备课发帖求职都交给AutoGLM,结果还挺省心

聊完生活化的场景,再回到打工人的主业——工作。显然,在手机上处理复杂任务并不合适,真正的生产力工具还是得看电脑。而在内容创作方面,这款Agent同样表现出了不俗的实力。(体验地址:autoglm.zhipuai.cn)

我抛出了第一个需求:“我是一名语文老师,下节课我要给学生讲解《将进酒》,帮我制作一份课件”

生成的PPT让我眼前一亮,包含了诗歌全文、作者背景、诗歌赏析等内容。老实说,过去几年我体验过不少AI一键生成PPT的功能,但就这个作品的排版和审美来说,这款Agent给了我很大惊喜,值得厂商们抄作业。

或许正是因为审美要求更高,其生成速度比常见的AI PPT工具要慢一些,但瑕不掩瑜,对老师来说,能省下备课时间,这点等待完全值得。

还记得ChatGPT Agent刚上线时,不少网友第一时间选择用这项功能发了第一条小红书。那这款网页端Agent能同样做到这一步吗?

“用宫崎骏吉卜力风格画一座漂浮在云端的城市,孩子们骑着飞行鲸鱼穿梭其中,然后将这张图片发表在小红书。”

先说生成效果——真的很棒。色彩温和,构图有诗意,确实有那种吉卜力动画的感觉。虽然细节上还达不到宫崎骏本人的水准(废话,那可是大师),但对于一般用户来说,这个质量已经完全够用了。

此外,它还会自动配上文案、标题,不过要最终发布,还需要我本人确认,但这种从创作到发布的一条龙服务,对内容创作者来说,已经非常实用。

AutoGLM背后是智谱的GLM-4.5和GLM-4.5V模型,其在推理、代码、智能体等综合能力上达到开源SOTA。这意味着,它还能满足一些技术需求。

我抛出了个高难度任务:

“搭建一个交互式网站,用户在网页左侧输入想要描绘的场景,在右侧下拉菜单中选择艺术流派(如巴洛克、像素风、蒸汽波或敦煌壁画),点击生成后,页面将呈现对应风格的场景插画或海报,并同时展示该流派的简要发展脉络及代表性艺术家。”

说实话,作为代码小白的我,也压根没指望自己能做出媲美专业团队的作品。但让AutoGLM打造一个能跑通的原型产品?已经基本绰绰有余。

当然,还有一个更有趣的场景:既然AutoGLM已经能帮我写稿、做图、处理琐事,我干脆一不做二不休,直接让它去帮我找工作。这款Agent是由智谱开发,那索性用它向智谱AI发出求职申请(再见了,APPSO)

体验下来,AutoGLM给我的感觉,更像是希腊神话中由工匠之神赫淮斯托斯创造的青铜巨人——塔罗斯,它肩负着守护克里特岛的神圣使命,每天绕岛巡逻三次,一旦发现威胁就会投掷巨石驱逐入侵者——无需任何人类干预就能忠实履行职责。

其实早在去年,AutoGLM就凭借“能操作手机的Agent”火了一把。只是这次更新后,它彻底进化成了一个真正人人能用的手机Agent。

划重点:这是全球第一个手机通用Agent。

怎么理解这个“通用”?以前的AI助手只能在特定App里帮你忙,AutoGLM可以直接操控整个手机系统。看小说、订外卖,购物,这些日常操作它都能一手包办。同时据智谱官方剧透,AutoGLM将很快上线“定时任务”功能,让AI每天主动给你干活。

而且这是第一个真正面向普通人的Agent,你可能听说过Manus在海外市场的火爆,但它有一定体验门槛,相比之下,AutoGLM选择了另一条路:用自研的GLM-4.5模型,让国内用户有机会真切感受到什么是“既会思考,又能执行”的AI助手。

数据最有说服力。基准测试结果显示,AutoGLM在Computer Use(OSWorld)中达到48.1分,显著超越Operator;而在Browser Use(WebVoyager)中,AutoGLM的得分也达到87.7。

当然,AutoGLM现在还有一些限制,但即便如此,它已经足以胜任那些占据我们大量时间的日常操作,而当智谱与一些手机厂商达成更系统级的合作后,这个Agent的想象空间将彻底打开,成为我们真正期待的数字助理。

甚至不必等到那一天,现在的AutoGLM已经足够聪明,你可以把一些“数字苦力活”打包扔给AutoGLM,腾出手做点更有趣的事。与此同时,我们也终于迎来了真正“动口不动手”的时代。

附 AutoGLM 下载地址:https://autoglm.zhipuai.cn/htdocs/download.html

本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO

-->

本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO,原文标题:《这个AI让我躺平,实测首个手机通用Agent:点外卖、做PPT,连工作都能帮我找》,题图来自:AI生成

每天睁眼后的第一件事是什么?刷手机。

睡前的最后一件事是什么?还是刷手机。

但你有没有算过,每天要在不同App之间切换多少次?淘宝比价、美团点外卖、小红书找攻略——我们的手机里装着几十个App,却要靠十个手指在它们之间来回奔波。

这些碎片化的时间往往一天下来,足以让我们开始怀疑人生——时间都去哪儿了。

所以当AI Agent浪潮席卷而来时,我们的第一反应就是希望能有一个真正的手机通用Agent。它应该像一个随身助理,不管你在做什么,都随时响应你的需求,同时能够在后台默默工作,不打断你正在进行的任何事情。

其实早在Manus刷屏之前,智谱就已经在Agent赛道上埋头苦干了。我们之前测过他们的初代AutoGLM,印象还不错。而就在刚刚,智谱再次升级了AutoGLM Agent功能。

带着这样的疑问,我们想看看这款Agent能否把“手机自动驾驶”这个概念变成现实。

一句话就能让AI帮你打卡追剧点奶茶,AutoGLM Agent开启手机自动驾驶

据智谱官方介绍,AutoGLM Agent支持一句话实现“云端操作+自动执行”。简单来说,就是给你配一台云手机和云电脑,你说话,它干活。

你只需要通过自然语言发布指令,AutoGLM就能在云设备上自动完成各种任务:打开App、浏览网页、点外卖、订酒店、制作PPT和网页、生成视频,甚至可以在多个App间协同操作。

由于所有任务都在云端执行,也因此不占用你的手机或电脑资源,也不打断你正在进行的操作。打个比方,Chatbot告诉你“怎么做”,AutoGLM直接“帮你做”。

不过,目前市面上完美的AI产品是不存在的,整体体验下来,AutoGLM偶尔还是会犯迷糊,稳定性有待提升,同时,它目前仅支持部分预装应用,在安全性上,这样的限制是合理的,虽然理解,但确实有点“不够野”。

超话定时打卡有多难受,追星人懂的都懂。

“帮我给赵露思的微博(注释:目前已注销)超话打卡”——老实说,我就是想看看它能不能理解这个植根于中文互联网文化的需求。

结果它准确定位到了超话页面,完成了我的任务需求,说明这个Agent真的“混”过中文互联网,知道什么是超话,懂粉丝的日常。这种文化密码,国外AI学都学不来。

分享一个小tips,要想体验地更丝滑,建议还是需要提前完成账号登录。在实测中也发现,部分应用的登录状态可能没法长期保存,这是一个小小的痛点。

追星之外,我还把它用在了游戏场景里。

最近,痴迷于王者荣耀的我用杨戬打上了王者,但在打巅峰赛的时候已经感觉有些吃力,需要去“偷师学艺”一下。

于是我让AutoGLM Agent帮我在B站找到热度较高的博主,它很快就理解了我的语境和意图,帮我找到了合适的博主,效率拉满。

再比如追番,已经不想和没看过《凡人修仙传》国漫的朋友说话了。

前几天韩立结婴的消息一出,由于观看人数太多,B站都被挤崩溃了,虽然作为散修的我,由于没有VIP,同样被拦在了“护宗大阵”门外,但这并不妨碍我在预告里发表弹幕:“恭贺韩天尊结婴”,主打一个仪式感。

而这整个过程同样也都是交给AutoGLM Agent解决的。

不过,如果Agent只能执行单一任务,其实意义并不大。真正有价值的,是它能否执行复杂的长链路任务,所以我们继续上点强度。

“先打开QQ音乐,播放我的收藏里的第一首歌,接着打开小红书搜索贵州黄果树瀑布旅游攻略,找到收藏最多的图文笔记,点赞并收藏,然后关注发布这个笔记的博主”。

这可是跨越2个App的十几个操作。按以往经验,肯定会在某个环节掉链子。但实测结果中,整个流程一气呵成,几乎没有任何卡顿,这才是Agent该有的样子。

在生活里,它同样能带来小惊喜。

上班喝奶茶,是打工人的最后倔强。别的不说,光是能准确理解“蜜雪冰城的杨枝甘露”这个需求,就已经超过了我对现阶段AI的期待。要知道,这不是简单的文字识别,而是需要理解品牌、产品类别。

再比如化身剁手党的我,让它“在京东搜索最新款的AirPods Pro并收藏”——结果它不仅准确找到了商品,还很贴心地停留在详情页让我确认了一下价格。这种细节把控,像极了资深代购。

我把备课发帖求职都交给AutoGLM,结果还挺省心

聊完生活化的场景,再回到打工人的主业——工作。显然,在手机上处理复杂任务并不合适,真正的生产力工具还是得看电脑。而在内容创作方面,这款Agent同样表现出了不俗的实力。(体验地址:autoglm.zhipuai.cn)

我抛出了第一个需求:“我是一名语文老师,下节课我要给学生讲解《将进酒》,帮我制作一份课件”

生成的PPT让我眼前一亮,包含了诗歌全文、作者背景、诗歌赏析等内容。老实说,过去几年我体验过不少AI一键生成PPT的功能,但就这个作品的排版和审美来说,这款Agent给了我很大惊喜,值得厂商们抄作业。

或许正是因为审美要求更高,其生成速度比常见的AI PPT工具要慢一些,但瑕不掩瑜,对老师来说,能省下备课时间,这点等待完全值得。

还记得ChatGPT Agent刚上线时,不少网友第一时间选择用这项功能发了第一条小红书。那这款网页端Agent能同样做到这一步吗?

“用宫崎骏吉卜力风格画一座漂浮在云端的城市,孩子们骑着飞行鲸鱼穿梭其中,然后将这张图片发表在小红书。”

先说生成效果——真的很棒。色彩温和,构图有诗意,确实有那种吉卜力动画的感觉。虽然细节上还达不到宫崎骏本人的水准(废话,那可是大师),但对于一般用户来说,这个质量已经完全够用了。

此外,它还会自动配上文案、标题,不过要最终发布,还需要我本人确认,但这种从创作到发布的一条龙服务,对内容创作者来说,已经非常实用。

AutoGLM背后是智谱的GLM-4.5和GLM-4.5V模型,其在推理、代码、智能体等综合能力上达到开源SOTA。这意味着,它还能满足一些技术需求。

我抛出了个高难度任务:

“搭建一个交互式网站,用户在网页左侧输入想要描绘的场景,在右侧下拉菜单中选择艺术流派(如巴洛克、像素风、蒸汽波或敦煌壁画),点击生成后,页面将呈现对应风格的场景插画或海报,并同时展示该流派的简要发展脉络及代表性艺术家。”

说实话,作为代码小白的我,也压根没指望自己能做出媲美专业团队的作品。但让AutoGLM打造一个能跑通的原型产品?已经基本绰绰有余。

当然,还有一个更有趣的场景:既然AutoGLM已经能帮我写稿、做图、处理琐事,我干脆一不做二不休,直接让它去帮我找工作。这款Agent是由智谱开发,那索性用它向智谱AI发出求职申请(再见了,APPSO)

体验下来,AutoGLM给我的感觉,更像是希腊神话中由工匠之神赫淮斯托斯创造的青铜巨人——塔罗斯,它肩负着守护克里特岛的神圣使命,每天绕岛巡逻三次,一旦发现威胁就会投掷巨石驱逐入侵者——无需任何人类干预就能忠实履行职责。

其实早在去年,AutoGLM就凭借“能操作手机的Agent”火了一把。只是这次更新后,它彻底进化成了一个真正人人能用的手机Agent。

划重点:这是全球第一个手机通用Agent。

怎么理解这个“通用”?以前的AI助手只能在特定App里帮你忙,AutoGLM可以直接操控整个手机系统。看小说、订外卖,购物,这些日常操作它都能一手包办。同时据智谱官方剧透,AutoGLM将很快上线“定时任务”功能,让AI每天主动给你干活。

而且这是第一个真正面向普通人的Agent,你可能听说过Manus在海外市场的火爆,但它有一定体验门槛,相比之下,AutoGLM选择了另一条路:用自研的GLM-4.5模型,让国内用户有机会真切感受到什么是“既会思考,又能执行”的AI助手。

数据最有说服力。基准测试结果显示,AutoGLM在Computer Use(OSWorld)中达到48.1分,显著超越Operator;而在Browser Use(WebVoyager)中,AutoGLM的得分也达到87.7。

当然,AutoGLM现在还有一些限制,但即便如此,它已经足以胜任那些占据我们大量时间的日常操作,而当智谱与一些手机厂商达成更系统级的合作后,这个Agent的想象空间将彻底打开,成为我们真正期待的数字助理。

甚至不必等到那一天,现在的AutoGLM已经足够聪明,你可以把一些“数字苦力活”打包扔给AutoGLM,腾出手做点更有趣的事。与此同时,我们也终于迎来了真正“动口不动手”的时代。

附 AutoGLM 下载地址:https://autoglm.zhipuai.cn/htdocs/download.html

本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO

来源:https://www.huxiu.com/article/4714816.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

英伟达豪掷千亿投资OpenAI背后的商业逻辑
科技数码
英伟达豪掷千亿投资OpenAI背后的商业逻辑

英伟达和OpenAI达成世纪合作!最新消息,英伟达计划向OpenAI投资最高1000亿美元,OpenAI则要用这笔钱构建至少10GW的AI数据中心,全用英伟达的系统。10GW,相当于400万~500

热心网友
12.12
AI取代哪些岗位?从业者如何应对危机
科技数码
AI取代哪些岗位?从业者如何应对危机

人工智能技术正以前所未有的速度重塑全球劳动力市场,但它在不同人群中引发的情绪却截然不同。德意志银行9月23日发布的研报显示,面对AI可能带来的岗位冲击,最熟悉数字世界的年轻人,反而对AI取代其工作的

热心网友
12.12
微软OpenAI战略变局下,亚马逊联手Anthropic如何破局
科技数码
微软OpenAI战略变局下,亚马逊联手Anthropic如何破局

美国的AI市场,正上演两大阵营的对垒。台前,是全球最大的两家AI创业公司,OpenAI和Anthropic。幕后,则是微软、亚马逊这两家科技巨头,也是全球前两大云厂商,两家长期把持着云市场60%以上

热心网友
12.12
AI取代工作真相:半数失业后GDP为何不降?
科技数码
AI取代工作真相:半数失业后GDP为何不降?

在大多数人的直觉里,只要经济持续增长,工资总会水涨船高。可最新的一篇论文却抛出残酷预言:在AGI时代,经济会因为算力扩张而狂飙不止,但普通人的工资却被“算力成本”锁死,彻底与增长脱钩。也就是说,哪怕

热心网友
12.12
门店管理:AI与人力协同决策的关键在哪里?
科技数码
门店管理:AI与人力协同决策的关键在哪里?

在瑞幸咖啡的门店,AI基于180天历史数据和12项实时指标(如客流、设备状态、天气等)预测各时段客流,自动生成排班表;在绝味鸭脖门店,店长Agent“绝智”把销冠的经验,转化成智能排班、活动策略、实

热心网友
12.12

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查
web3.0
美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查

加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这

热心网友
04.08
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币
web3.0
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币

微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿

热心网友
04.08
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch
web3.0
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch

稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D

热心网友
04.08
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线
web3.0
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线

基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一

热心网友
04.08
PAAL代币如何参与治理?社区投票能决定哪些事项?
web3.0
PAAL代币如何参与治理?社区投票能决定哪些事项?

PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票

热心网友
04.08