
2025年11月5日,微软本月正式将其首款自研AI图像生成模型MAI-Image-1投入实用,目前已集成到Bing图像创作工具及Copilot的音频表达功能中,不过欧盟地区用户暂时还无法体验这项新服务。
微软AI部门负责人Mustafa Suleyman透露,该模型在生成美食、自然景观、艺术化光影以及写实细节类图像方面展现出显著优势。最新测试数据显示,MAI-Image-1在处理写实光照效果(如反射与漫反射)以及复杂风景图像时表现优异,相较于部分参数规模更大、响应更慢的模型,其实用性更为突出。该模型在生成速度与图像质量之间实现了良好平衡,让用户能够更高效地将创意可视化,加快迭代过程,并方便将创作成果导入其他应用进行后续优化。
此外,MAI-Image-1还将应用于Copilot文本转语音平台Audio Expressions的"故事模式"中,为AI生成的音频故事自动匹配同步图像内容,有效增强叙事表现力。
值得注意的是,微软已于今年8月推出首批自研AI模型,包括语音识别模型MAI-Voice-1和文本生成模型MAI-1-preview,并明确后者将在特定场景中逐步用于Copilot助手功能。这一系列动作表明,公司正持续降低在AI技术路线上对外部模型的依赖。
现阶段,Copilot聊天机器人正在迁移至GPT-5架构,同时新增Anthropic旗下Claude系列模型作为用户可选方案,旨在提供更灵活的AI服务配置选择。
在Bing图像生成服务中,MAI-Image-1已作为三大核心模型之一上线,与DALL-E 3及GPT-4o并列供用户选择,进一步丰富了图像创作的工具生态。
