先从图像编辑这个功能聊起,带大家深入了解它的实际能力。
先交代一下背景。LongCat AI 是美团自主研发的多模态大模型,自2025年11月起逐步开源,到2026年6月30日,直接推出了1.6万亿参数的 LongCat-2.0 版本。这个规模意味着什么?它不仅能聊天、写诗,更关键的是,它把图像编辑、图像生成、代码编写、会议记录,甚至本地生活的深度分析,全部整合到了真实可用的产品中。

因此,接下来我们要拆解的,不是一份概念演示,而是一个已经落地、开箱即用的 AI 助手。
它不只是一个聊天窗口
说实话,市面上“对话即服务”的 AI 工具很多,但 LongCat AI 的定位很特别:它不是一个让你坐下来慢慢聊天的界面,而是一个“能动手”的执行者。
举个例子。你上传一张猫的照片,告诉它“把这只猫变成穿西装的柴犬”,它真的能帮你改图。你说“帮我对比家附近这三家餐厅,看看哪个性价比高、哪个排队时间短”,它不会给你一段泛泛的文字,而是直接调用美团的实时数据,生成一张带链接的对比表格。你再丢进去一段一个小时的会议录音,它三秒内就能输出一份完整的会议纪要,连待办事项和责任人都在上面标好了。
这些操作,都是在真实产品里跑通的。也就是说,无论是官方 App、longcat.ai 网页端,还是 Tabbit 浏览器插件,你上手就能用。
图像编辑:动动嘴就能改图,不用碰 PS
改动图片这件事,有两条路可以走。
方法一:网页端快速编辑
路径很直接。打开 longcat.ai,点进「AI生图」或「图片编辑」标签,把动物类图片(猫、狗优先)拖进去,然后在 Prompt 框里用中文写下你的想法——“给这只金毛戴上飞行员护目镜,背景换成机场停机坪”。点击生成,等上 15 到 25 秒,结果就出来了。
整个过程没有门槛,但有一个细节值得注意:上传图片的分辨率最好控制在 400×400 到 800×800 之间。太大了显存容易溢出,太小了细节会模糊。
方法二:本地部署高阶控制
这条路适合手上有一块 NVIDIA 显卡、显存至少 18GB 的朋友。执行一句 bash /root/build/start.sh,然后在浏览器里访问 http://本机IP:7860,调用 LongCat-Image-Edit 模型,就能获得更精细的控制。蒙版擦除、局部重绘、多轮迭代编辑,统统可以实现。
而且本地运行时所有数据都不出设备。如果你对隐私有硬性要求,这是唯一的选择。
深度研究:吃喝玩乐的 AI 参谋
这个功能,属于那种用了之后会“回不去”的类型。
进入 longcat.ai 或 LongCat App,找到「深度研究」入口,然后输入一个非常具体的需求,比如:“规划上海迪士尼周边3公里内,人均200以内、带儿童餐、评分4.7以上、周末免排队的午餐方案。”
等上 2 到 4 分钟,你拿到的不是一长串列表,而是一份完整的报告。里面有餐厅名称、实拍图、大众点评的直达链接、预估等位时间,甚至连“该店午市12:15–13:00翻台最慢”这种避坑提示都给你标好了。
这背后的逻辑在于,它调用的不是通用知识库里的僵化信息,而是美团的实时商户数据、客流监测,以及真实的消费者评价。报告底部的每一条链接,都能直接跳转到对应的大众点评页面去验证。
代码与文档:程序员和学生的得力助手
在任意对话框里,直接粘贴代码片段,或者上传 PDF、PPT、Word 文档,然后说一句“优化这段 Python 爬虫,加异常重试和日志”,或者“总结这份财报的三大风险点,用表格呈现”。
AI 会即时响应。而且 LongCat-Flash-Thinking-2601 这个版本,对技术文档的理解能力尤其突出。它能识别 PyTorch 版本之间的兼容性警告,能在一份 PPT 里指出逻辑断层,甚至能从 200 页的 PDF 里精准定位到“第三章第二节的违约责任条款”。
不过有一点需要留意:上传文件的大小上限是15MB,超过了可以分拆后再上传。
总的来说,LongCat AI 目前呈现出来的状态,是“工具属性”大于“对话属性”。它不追求陪你侃大山,而是追求能不能帮你把事情办成。从这个角度看,它确实和市面上大多数聊天框型 AI 不太一样。
