先说几个感受很深的点。
使用QoderWork一段时间后,确实觉得它很香。但有一个问题一直让人头疼——回复慢、卡顿、时不时抽风,稍微复杂一点的本地任务,等得人脑壳疼。本地Agent这类工具,追求的就是快速和稳定,如果每次都要傻等,使用体验就彻底碎了。
给你们看个实例。这是用本地Agent完成的图片排版,一句话就能自动将多张照片精美重排。
整个流程耗时不到5秒,从此截图拼接、标注甚至美化,再也不需要打开PS了。
今天是元宵节,利用小红书Skills写一篇小红书文案并生成图片,自动发布到小红书吧。
这个Agent能直接唤起浏览器,安全性更高。
让该本地Agent直接搜索最新的AI新闻,然后自动帮我发一条X(含配图),也是轻松搞定。全程我只用闪电说发了句语音指令,喝茶看着就行。
链接公众号文章解析技能,扔个链接给Agent,它能自动提取要点及文章的详细信息:
然后调用信息图生成Skills,快速生成几张信息图,也可以智能合并成一张。
甚至完全可以再次借助小红书技能,直接转换为小红书文案及图片,并自动发布到小红书。
要知道,之前用秒哒开发的“公众号一键转小红书”产品,迭代了230次。这下好了,用Agent又革了自己的命。
现在,通通都不用。你只需把任意公众号文章链接丢给这个Agent,就能转成小红书,甚至还能借助remotion-best-practices skill生成教学视频。
说到视频,甚至可以将之前开发好的漫剧Skills,配合抖音视频下载Skills、视频解析Skills,直接对爆款视频进行极限二创及复刻。
比如,这是一个本地的带货视频:
现在直接让这个Agent分析并写一份详尽的报告:
这是Agent逐帧解析总结后给出的详细报告,从叙事结构到专业营销手法,分析得相当透彻。
基于这份报告,可以生成带图片的公众号文章。给的提示词如下:
基于你的分析,帮我生成一篇公众号文章,要有短标题,要有配图,配图你可以从视频中去拿,尽量口语化,句子和段落不要太长,帮我生成 markdown 文章
这还没完。基于解析的结果,直接配合之前开发的漫剧Skills,仿照着该视频把AI眼睛这个产品,做成一个古风版本的带货视频。
该Agent会自动调用manga-style-video Skills,根据分析报告中的爆款手法,自动写脚本,自动生成分镜视频,并完全保持角色和场景的一致性。
现在整个过程全部由Agent自主执行,Skills负责生成视频及控制风格。
已经很不错了——只给了一个参考视频而已,全凭Agent自主干活。
当然,如果看到抖音上的爆款视频想复刻,只需要在这个Agent安装一个抖音下载Skills,以及长视频分析Skills。
原视频在这里:
然后只需把它丢给Agent,去喝茶就行了。
视频下载好后,解析视频。这个原理是借助大模型能力,无需单帧截图解析。
然后调用漫剧技能,转为吉卜力风格的漫剧视频。
视频就复刻好了:
虽说也没那么完美,但至少整个流程是完全打通的,接下来只需要做优化就好。
短视频创作的门槛,又一次被这个Agent拉低了。
聪明的人估计已经想到了——用这东西去做视频、切片,配合剪辑Skills,简直无敌。由于时间关系,这里就没再展示了。
卖了这么长的关子,估计很好奇这是个什么Agent?
这就是阿里推出的桌面端Agent,叫QoderWork。之前也分享过,很强大,但之前只支持Mac,现在也支持Windows了。
和Openclaw不同的是,QoderWork无需部署,本地电脑就能直接使用。只需通过简单的自然语言,就能调用电脑里的应用,帮你完成复杂任务,比如文件整理、数据处理、文档生成,自动做PPT和视频等。以上所有的任务都是在QoderWork中完成的。
QoderWork还增加了标准与旗舰两档模型可供选择。日常文档处理、信息整理选标准模式就够了,省token;复杂任务就用旗舰模型。
QoderWork运行在本地的沙盒环境中,首次打开就会启动这个环境,相对更独立、安全和稳定。
这次最大的不同是,QoderWork集成了很多场景化的Skills,比如用到的小红书图片Skill及文章信息图Skill,都是在市场一键安装的,无需任何配置。
自己的Skills也可以手动安装,或者让QoderWork自动安装,比较方便。
相比Openclaw,感受比较明显:一个是更稳定了,另一个是对很多任务会更快。对于本地电脑办公类任务,完全可以交给QoderWork。
它甚至能帮忙识别发票,然后整理金额放到excel表格中,计算报销金额——这玩意儿,谁用谁知道有多爽。
当然,一句话合并多张发票到一个PDF里面,也非常简单方便,在QoderWork中都能完成。
说真的,用完QoderWork,有个很强烈的感受。
以后的内容创作,拼的不再是你有多会剪辑、多会写文案、多会P图。
真正拼的是——你会不会用Agent,会不会组合Skills。
视频复刻、一键转漫剧、公众号转小红书、发票整理,以前这些东西哪个不得整把小时?现在丢给Agent,你去喝茶。
短视频、图文、视频创作的门槛,又被拉低了一个台阶。
而且这才刚刚开始。
现在已经越来越相信一件事:下一个时代,人和人之间最大的差距,就是会不会用AI帮自己干活。
你现在不上车,以后别说没人提醒过你。
