近期,Agnes AI 有所动作——其最新发布的一系列高性能多模态模型,已成功登上多个第三方 AI 模型评测榜单,并向用户和开发者开放了免费体验。具体推出了哪些模型?覆盖哪些应用场景?实际表现如何?值得详细了解一下。
Agnes AI 的产品矩阵涵盖 Agent、文本、图像、视频等多模态模型及对应应用场景。此次登榜的模型共计三款:Agnes-2.0-Flash、Agnes Image 2.0 Flash 以及 Agnes-Video-V2.0,分别专注于文本/Agent 任务、图像编辑与视频生成领域。
目前,这些模型已在 Agnes 旗下的 App(Agnes 和 PA VO)中开放直接体验。开发者和企业用户亦可前往 Agnes AI 官方网站申请 API 接入及免费试用额度。
Agnes-2.0-Flash:专为 Agent 场景打造的高性能模型,现已免费开放体验
首先来看 Agnes-2.0-Flash。该模型入选了 Claw-Eval 榜单。与传统的数学、知识问答、代码能力评测不同,这个榜单更贴近真实 Agent 产品的任务执行链路。模型不仅需要理解目标任务,还必须能够拆解任务、调用工具、处理返回结果,并在多轮对话上下文中持续推进任务进程。

(数据来源:Claw-Eval 榜单,截至发稿时排名可能有所变动)
具体而言,该评测主要考察以下几个方面:指令遵循能力、任务规划能力、工具调用准确率、上下文保持能力以及任务执行完整度。从 Claw-Eval 榜单的表现来看,Agnes-2.0-Flash 在部分任务上已经超越了 Gemini Flash 等模型,展现了针对 Agent 场景的综合执行实力。
据官方介绍,该模型适用于文本生成、代码生成、知识问答、搜索,以及复杂任务规划与工具调用等场景。企业可借助它构建知识库、智能客服、文档处理系统,或用于代码开发、自动化工作流及 Agent 应用,均能胜任。
这里有一个关键点需要注意:在 Agent 应用中,token 消耗通常远高于普通对话。复杂任务往往涉及多轮推理、搜索、工具调用、代码执行及结果修正,实际调用量会随着任务链路延长而急剧增加。如何降低使用门槛?Agnes 官方宣布,自 6 月 1 日起,Agnes-2.0-Flash 的 API 接口无限期免费开放体验。这意味着,用户无需任何前期投入即可全面测试模型在问答、客服、知识库、代码生成及 Agent 工作流中的真实表现。
举几个具体场景:在普通问答中,假设一次对话平均消耗约 1000 tokens,免费额度足以支撑大量基础问答测试;在多轮客服或知识库问答场景下,每轮任务可能包含上下文、检索结果及工具调用信息,用户同样可以通过免费试用完成多轮复杂交互验证;在编程场景中,开发者可以直接测试代码生成、修改、调试及自动化执行等任务。
换言之,即便在 token 消耗较高的多轮对话、Agent、编程及企业知识库场景中,开发者也能完全免费地完成模型验证、产品原型搭建和业务流程测试——这无疑降低了 AI 应用从试验到部署的门槛。
在实际测试中,Agnes-2.0-Flash 的模型能力可以支撑从需求理解到代码生成的完整流程。以小游戏生成为例,模型输出的内容涵盖了页面结构、交互逻辑、计分机制、倒计时、失败判定及重新开始等完整代码模块,展现了良好的连续执行能力。
射击游戏
Agnes Image 2.0 Flash 与 Agnes Image 2.1 Flash:图像编辑模型现已免费开放
接下来关注图像编辑模型。Agnes Image 2.0 Flash 此次入选了 Artificial Analysis 的 Image Editing Leaderboard。该榜单颇具特色——采用用户盲评与 Elo 评分机制,参与者在不知晓图片由哪个模型生成的情况下,仅依据输出结果进行偏好选择。这使其更贴近真实用户对图像质量、指令遵循及编辑效果的评估。

Agnes Image 2.0 Flash 支持的任务类型十分丰富:图改图、多图融合、局部修改、背景替换、风格转换、文字编辑、图像修复等。应用场景同样清晰——电商主图、广告素材、社交媒体配图、产品海报、人物图片编辑等需要多次生成、反复修改、高频迭代的图像创作领域。
此外,还有一款进阶版本——Agnes Image 2.1 Flash。它在各方面生成效果上更胜一筹,并且补齐了文生图的能力短板。如果打算使用 Agnes 的图像模型,建议直接选用 2.1 Flash。





目前,该模型已向用户开放免费体验。创作者、电商商家、设计团队及内容团队均可通过 Agnes 的产品直接测试图像编辑效果,或前往官网了解 API 接入方式。



实际测试显示,Agnes Image 2.0 Flash 在局部编辑方面表现较为稳定。模型对“仅修改指定区域、保持其他部分不变”的理解能力良好。无论是商品替换背景、调整人物形象、替换海报元素,还是批量素材改版,模型都能较好地保留主体结构及原图的关键信息。





对于电商图、社交媒体配图、广告素材等需要反复微调的场景,免费体验确实降低了试错成本。用户可以在正式投入业务流程之前,先充分测试不同的提示词、风格及编辑方案,从而提升最终素材的可用率。
Agnes-Video-V2.0:原生音画同步输出,支持 1080P,免费开放体验
在视频模型方面,Agnes-Video-V2.0 入选了 Artificial Analysis 的 Image to Video Leaderboard(With Audio) 榜单。其核心亮点在于原生音画同步输出,输出分辨率可选 720P 或 1080P,同时支持首帧生视频、首尾帧生视频、多帧生视频等多项功能。

在内容生成方面,Agnes-Video-V2.0 较为擅长人物对话、图生视频等任务,同时支持景别切换、第一视角运镜、光影氛围塑造及多镜头内容生成。可服务于短视频创作、广告素材、剧情分镜及社交媒体视频等场景。
Agnes AI 视频:野外老虎纪实
Agnes AI 视频短剧任务表演“这世间的情与爱……”
根据官方信息,Agnes-Video-V2.0 已开放免费体验。创作者、内容团队及 AI 视频应用开发者,可以通过免费试用测试模型在图生视频、音画同步、多镜头生成及剧情分镜等场景中的表现。
对于视频创作而言,多版本创意测试、素材迭代及自动化视频工作流通常需要较高的生成频次。免费体验开放后,用户能够以更低门槛尝试不同镜头语言、画面风格及视频脚本,使 AI 视频从单次尝鲜逐步走向实际内容生产流程。
多模态模型组合,降低 AI 应用规模化门槛
从文本/Agent 到图像编辑,再到视频生成,Agnes AI 此次发布的模型组合,覆盖了当前 AI 应用中最核心的几类生产场景:任务执行、内容生成、视觉编辑与视频创作。
在模型能力持续提升的同时,使用门槛正成为 AI 应用能否规模化落地的关键因素。对开发者而言,免费体验意味着更大的测试空间与更高的产品容错率;对企业来说,则意味着可以在正式部署之前,更充分地验证 AI 能力是否适用于客服、营销、内容生产、办公自动化及业务流程系统等场景。
随着 Agnes-2.0-Flash、Agnes Image 2.0 Flash、Agnes Image 2.1 Flash 及 Agnes-Video-V2.0 开放免费体验,Agnes AI “多模态、可落地、低门槛” 的模型组合,正为开发者、企业和创作者提供全新的 AI 基础设施选择。感兴趣的话,不妨亲自上手试一试。
