游乐游手机版
首页/科技数码/文章详情

微软自研图像模型再降价 41%,当纳德拉开始用“毛利率”定义AI模型

时间:2026-04-21 17:52
微软图像模型“降本增效”新动作:MAI-Image-2-Efficient发布,AI联盟暗流涌动 4月15日,微软正式推出了MAI-Image-2-Efficient,这是其旗舰文生图模型MAI-Image-2的一个“经济适用”版本。新模型的定价策略相当直接:每百万输入token收费5美元,每百万输

微软图像模型“降本增效”新动作:MAI-Image-2-Efficient发布,AI联盟暗流涌动


4月15日,微软正式推出了MAI-Image-2-Efficient,这是其旗舰文生图模型MAI-Image-2的一个“经济适用”版本。新模型的定价策略相当直接:每百万输入token收费5美元,每百万输出图像token收费19.5美元。算下来,输出成本比旗舰版的33美元下降了约41%。

性能方面,微软给出的数据颇具吸引力。据称,新模型在NVIDIA H100硬件上运行速度提升了22%,每GPU的吞吐量效率更是提高了4倍。在延迟表现上,它甚至优于谷歌的Gemini 3.1 Flash、Gemini 3.1 Flash Image及Gemini 3 Pro Image三款模型,平均领先幅度达到40%(基于p50中位数基准测试)。

值得注意的是,这是微软AI超级智能团队自去年11月公开亮相以来,模型矩阵中的最新成员。更关键的是,从旗舰模型发布到推出优化变体,整个过程不到一个月,这种“初创公司式”的迭代节奏,在巨头身上并不多见。而这一切,都发生在一个微妙的背景之下:微软与OpenAI那曾经定义了一个时代的合作关系,正悄然出现裂痕。

双模型策略:Efficient与Flagship

微软对这两个模型的定位区分得非常清晰。MAI-Image-2-Efficient被定位为“生产线工具”,瞄准的是产品摄影、营销创意、UI样机、品牌资产管道以及实时交互应用这类场景。它的特长是干净利落地处理标题、标签这类短文本,非常适合那些对延迟和预算有严格要求的批处理环境。

那么,什么时候需要请出“精密仪器”呢?当任务涉及最高级别的照片级真实感、复杂的风格化转换(比如动漫或插画),或者需要处理更长、更复杂的图像内嵌文字时,企业客户依然需要依赖MAI-Image-2这款旗舰模型。

这种“高低搭配”的分层策略,在AI行业其实已是常规操作。无论是OpenAI的GPT模型梯队、Anthropic的Haiku-Sonnet-Opus产品线,还是谷歌的Flash-Pro区分,背后的定价逻辑都如出一辙。但在图像生成这个领域,单张图像的成本经济学,往往直接决定了规模化部署的成败。

根据相关报道,新模型已经在Arena.ai(原LMArena)图像生成排行榜上位列第三,排在它前面的是谷歌Gemini 3.1 Flash和OpenAI的GPT Image 1.5。评测者普遍认为,MAI-Image-2在照片真实感方面拥有“真正的优势”,其文字渲染能力也“超出预期地一致”,尤其在处理复杂排版时。在一些直接对比中,MAI-Image-2甚至在图像质量和文字渲染上超越了OpenAI的GPT Image 1.5——尽管在综合排行榜上仍居其后。

不过,原模型也存在一些明显的限制:比如生成间隔有30秒的冷却时间、原生界面每日上限15张、仅支持1:1宽高比、缺乏图生图功能,以及有时会过度屏蔽无害创意提示的内容过滤策略。此次发布的Efficient版本是否继承或放宽了这些限制?微软在公告中并未给出明确说明。

微软-OpenAI联盟松动

要真正理解这次发布的意义,就不能孤立地看待它。特别是当下,微软与OpenAI之间的关系已经出现了肉眼可见的裂痕。

就在4月12日,OpenAI新任首席营收官Denise Dresser向员工发送了一份内部备忘录。据报道,这份备忘录在批评竞争对手Anthropic的同时,也提到了一个关键点:“我们与Microsoft的合作是我们成功的基础,但它也限制了我们在企业所在的地方与他们相遇的能力,对很多企业来说,那个地方是Bedrock(亚马逊AWS的AI服务平台)。”备忘录还透露,自2月底宣布与亚马逊合作以来,来自客户的入站需求“坦率地说令人震惊”。

其实,裂痕的迹象出现得更早。微软早在2024年7月底的年度报告中,就已经将OpenAI列入了竞争对手名单。而OpenAI这边也没闲着,它正通过CoreWea ve、谷歌和甲骨文来多元化其云基础设施,以减少对微软Azure的依赖。

MAI模型家族,正是微软这一战略脱钩意图最具体的表达。试想,当微软能够以每百万输出token仅19.5美元的成本,用自研模型生成生产级质量的图像时,继续授权OpenAI的图像模型并与之分享收入的商业逻辑,就会发生戏剧性的转变。每一个达到生产质量的MAI模型,都意味着一个项目可能从OpenAI的资产负债表上,被移到微软自己的账下。

此前,在3月17日微软披露的全面重组中,公司将消费者和商业Copilot业务统一至单一领导团队,Jacob Andreou升任Copilot执行副总裁直接向CEO纳德拉汇报。关键在于,主导组建MAI超级智能团队的微软AI CEO Mustafa Suleyman的角色也被重新聚焦。纳德拉在给员工的信中写道,公司正在“加倍投入超级智能使命,用人才和算力构建在评估、成本削减(COGS reduction)和前沿推进方面产生实际产品影响的模型”。

这里提到的“COGS reduction”(销售成本削减)这个企业黑话,直指核心的经济动机:每节省一美元支付给合作伙伴的授权费用,就直接转化为公司的毛利率。换句话说,就是降低每生成一张图所消耗的算力、推理和运营费用。

为什么便宜快速的图像生成至关重要

还有一个维度让此次发布具有深远的战略意义,甚至可能是最重要的一个:AI Agent(智能体)的崛起。

据报道,微软正在测试将类似OpenClaw的功能集成到Microsoft 365 Copilot中,目标是构建能够长时间执行多步骤任务的“常驻”智能体。公司已经推出了Copilot Cowork(在Microsoft 365应用内行动的智能体)、Copilot Tasks(完成多步骤个人生产力任务的智能体)和Agent 365(纳德拉重组备忘录中提及)。预计在今年6月的Build开发者大会上,微软将集中展示这些智能体能力。

在智能体的世界里——AI系统不再仅仅是回答问题,而是能够自主执行复杂的工作流——图像生成就从一个用户手动操作的独立产品,转变为了智能体可以编程调用的基础组件。想象一下,一个负责构建营销活动的企业智能体,它可能需要自动生成数十张产品图片、创建社交媒体素材、制作演示文稿图形,并在无人干预的情况下不断迭代设计概念。

这种工作流的经济学,完全由“按token计费”的定价模式和延迟时间所支配。而这,恰恰是MAI-Image-2-Efficient优化的核心所在。如果微软对Copilot的愿景,涉及在日常大型工作流中例行调用图像生成的智能体,那么这些智能体所需要的图像生成服务,就必须足够快以避免成为流程瓶颈,也必须足够便宜,以确保每天数千次的调用不会击穿成本预算。

所以,4倍的效率提升和41%的价格削减,绝不仅仅是漂亮的营销数字。它们实际上是微软押注公司未来于智能体战略的、硬性的架构要求。

未解答的问题与明确的轨迹

当然,此次发布仍留下了一些关键问题有待解答。

微软没有披露MAI-Image-2-Efficient是否解决了评测者在原模型中指出的宽高比限制和激进的内容过滤问题。公司也没有说明,在复杂提示下,这种速度与质量的权衡是否会导致可见的图像质量下降——毕竟在公告中,“生产就绪质量”和“旗舰质量”这两个词被互换使用,但任何类型的模型蒸馏通常都伴随着某种程度的质量妥协。

此外,MAI Playground目前仅在美国等选定市场可用,欧盟的可用性被标记为“即将推出”。与Copilot的集成工作仍在进行中,尚未完成。而通过Foundry平台提供的企业API虽已上线,但仍处于早期部署阶段。

尽管如此,轨迹已经明确无误。在MAI超级智能团队宣布成立后不到五个月的时间里,微软已经推出了一个旗舰图像模型、三个其他基础模型,以及现在这个成本优化的生产变体。而这一切,都是在重组整个Copilot组织、应对与最重要AI合作伙伴的紧张关系、并为可能重新定义企业生产力的智能体功能奠定基础的同时完成的。

对于这家在生成式AI时代的前两年,主要扮演他人技术“转售商”角色的公司而言,微软现在正在做一些它很久未在AI领域做过的事:按照自己的时间表、以自己的价格、交付自己的技术成果——并挑战整个市场跟上它的步伐。

(本文首发钛媒体APP,作者 | 硅谷Tech_news,编辑 | 秦聪慧)

来源:https://www.163.com/dy/article/KQI68JGB05118O92.html
上一篇双热洗地机严厉的父亲!追觅H70 Ultra直接把体验拉到行业第一 下一篇消博会焦点|汇天李锐:低空经济成支柱产业,陆地航母开启人人可飞时代
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宫本茂亲签3DS XL拍卖价破两万美元
科技数码 · 2026-05-29

宫本茂亲签3DS XL拍卖价破两万美元

今天来说一件挺有意思的事:2015年任天堂世界锦标赛冠军约翰·戈德堡,近日将他当年夺冠时赢得的宫本茂亲笔签名版3DS XL掌机放上了拍卖平台。截至2026年5月29日,这台签名掌机的竞拍价已突破两万美元,并且价格还在持续攀升。戈德堡在社交媒体上发布声明表示,经过相当长时间的慎重考虑,他决定将这台对自

七彩虹隐星P16 Pro游戏本新配置仅售7799元
科技数码 · 2026-05-29

七彩虹隐星P16 Pro游戏本新配置仅售7799元

七彩虹近期推出隐星P16Pro游戏本新配置,售价7799元。其搭载酷睿i9-13900HX处理器与RTX5060显卡,配备16英寸2 5K高刷电竞屏及高效散热系统。存储组合为16GB内存与1TB固态硬盘,支持后续扩展。该配置主打高性能性价比,适合预算有限但追求强劲性能的游戏玩家与轻度创作者。

苹果iPhone Hikawa握把支架448元重新上架
科技数码 · 2026-05-29

苹果iPhone Hikawa握把支架448元重新上架

苹果公司重新上架了与艺术家贝利·桧川及PopSockets合作设计的iPhone专用握把支架。该配件采用磁吸设计,兼具握持与支架功能,旨在通过人性化设计降低握持负担,并提供三种配色可选,售价448元。

苹果体育应用扩展至170市场 为2026世界杯引入对阵图
科技数码 · 2026-05-29

苹果体育应用扩展至170市场 为2026世界杯引入对阵图

苹果体育应用新增覆盖90多个国家和地区,全球可用市场总数超过170个。为迎接2026年世界杯,应用加入了完整的赛程对阵图和可视化阵型卡片,方便用户追踪赛事与战术。同时,应用支持实时活动功能,可将比分固定在锁屏或表盘,并新增一键跳转至新闻的入口。目前该应用仍仅限iPhone用户使用。

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产
科技数码 · 2026-05-29

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产

据博主爆料,小米下一代自研玄戒芯片计划于今年6月正式进入量产阶段,此次将采用台积电3nm工艺。初代玄戒O1累计出货量已突破100万颗,量产验证十分扎实。新一代芯片的产能将显著提升,这意味着供货问题基本得到解决。 根据现有曝光信息,这颗迭代芯片极有可能命名为玄戒O3,首发搭载机型预计为小米MIX Fo