苹果Manzano模型发布：看图绘图多模态AI实现近无损融合

时间：2026-01-15 09:49

1 月 15 日消息，科技媒体 Appleinsider 今天（1 月 15 日）发布博文，报道称苹果发表重磅研究论文，详细介绍了名为“Manzano”的多模态模型，融合“视觉理解”与“文本生成图

1月15日消息，科技媒体Appleinsider今日发布报道称，苹果公司发表了一项重磅研究成果，详细介绍了名为“Manzano”的多模态模型。该模型创新性地融合了“视觉理解”与“文本生成图像”两大核心功能。

这一模型最显著的突破在于其“双向能力”：它不仅能够像人类一样精准解读图像中的内容与语义，还能根据文本描述生成高质量的视觉图像。

苹果发表 Manzano：近乎无损融合“看图”与“绘图”的多模态 AI 模型

在此之前，行业内仅有少数模型能够同时兼顾这两项任务，且往往需要在生成质量与理解深度之间做出妥协。研究人员指出，其核心矛盾在于处理“视觉分词”的方式不同。

简单来说，AI在进行“图像理解”时，倾向于处理连续的数据流，类似于观看视频；而在进行“图像生成”时，则更依赖离散的数据块，类似于拼接拼图。传统模型强行让同一个“大脑”处理这两种截然不同的信号，往往会导致严重的任务冲突，结果要么是“看得懂但画不出”，要么是“画得好但理解偏”。

Manzano为了解决这一难题，引入了一种创新的三段式架构：

首先，它使用“混合视觉分词器”同时生成连续和离散的视觉表示；

接着，利用大语言模型预测图像的语义内容；

最后，将这些预测结果交给“扩散解码器”进行像素级渲染。

苹果发表 Manzano：近乎无损融合“看图”与“绘图”的多模态 AI 模型

这种设计让Manzano既保留了强大的语义理解能力，又具备了精细的图像生成能力，甚至能够处理深度估计、风格迁移和图像修复等复杂任务。

测试数据显示，Manzano在处理反直觉、违背物理常识的复杂指令时表现惊人。例如，当要求生成“一只鸟在大象下方飞翔”的画面时，Manzano的逻辑准确性与OpenAI的GPT-4o以及谷歌的Nano Banana模型旗鼓相当。

苹果发表 Manzano：近乎无损融合“看图”与“绘图”的多模态 AI 模型

研究团队测试了从30亿到300亿参数的不同版本，证实了该架构在模型规模扩大时依然能保持高效的性能提升。

苹果发表 Manzano：近乎无损融合“看图”与“绘图”的多模态 AI 模型

尽管Manzano目前仍处于研究阶段，尚未直接应用于iPhone或Mac设备，但这表明苹果正在构建更强大的底层AI能力。

该媒体认为，这项技术极有可能会被整合进未来的“图乐园 Image Playground”功能中，为用户带来更智能的修图体验和更具想象力的画面生成能力，进一步巩固苹果在端侧AI领域的竞争力。

附上参考地址

MANZANO: A Simple and Scalable Unified Multimodal Model with a Hybrid Vision Tokenizer

来源：https://www.ithome.com/0/913/332.htm

苹果 AI

上一篇iOS 26.4版Siri升级：新增动手能力，代劳存入备忘录 下一篇苹果DeepMMSearch-R1论文解读：抑制AI幻觉的图像裁剪搜索术

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

iphone · 2026-07-04

iPhone 15 Pro低电量提醒开启方法

利用“快捷指令”App创建自动化任务：设定电池电量降至某阈值时，自动朗读自定义提醒语并同时开启低电量模式。关闭“运行前询问”开关后，该任务可永久后台运行，无需每次手动确认，从而有效延长续航。

iphone · 2026-07-04

iPhone Air砍单近乎停产机构指无需求苹果策略失败

苹果iPhoneAir市场表现远不及预期，产量被大幅削减至近乎停产，多家投行定性为重大挫败。苹果已将战略重心转向iPhone17Pro系列，并上调基础款产量对冲风险。三星也因类似机型前景黯淡取消了相关计划。

iphone · 2026-07-04

iPhone 15 Pro Max最新版如何简单实用一步步完整备份应用程序数据的详细步骤和方法操作指南

iPhone15ProMax备份App数据有两种方式：iCloud备份方便但免费仅5GB，需付费扩容；电脑加密本地备份无容量限制且数据更完整，支持选择性恢复，适合追求全面安全的用户。

iphone · 2026-07-04

苹果iPhone 13 Pro快速导出视频的实用高效方法教程详解

导出iPhone13Pro视频有三种方式：数据线直连电脑最稳定且无需网络，适合批量高清导出；iCloud照片同步省心但需网络和存储空间；爱思助手等第三方工具支持批量导出和格式转换，功能丰富。用户可根据需求选择合适方式。

iphone · 2026-07-04

iPhone14Pro灵动岛启用方法图文详解与操作指南

确认设备为iPhone14Pro或ProMax，系统升至iOS16 1以上。进“设置-显示与亮度”开启灵动岛显示，若无则通过“辅助-触控”开启。为各应用授权实时活动，可调整位置与大小。之后可在锁屏与通知栏看动态，如外卖、音乐，提升体验。需应用支持实时活动。