游乐游手机版
首页/科技数码/文章详情

苹果另辟蹊径:利用“归一化流”技术打造 AI 生图模型

时间:2025-07-15 18:40
感谢网友 对的时间点 提供的线索!6 月 24 日消息,目前业界普遍采用扩散模型或自回归模型来开发 AI 图像生成系统。然而,苹果公司最近发布的一篇论文表明,他们正在探索一条较少被

感谢网友 对的时间点 提供的线索!

6 月 24 日消息,目前业界普遍采用扩散模型或自回归模型来开发 AI 图像生成系统。然而,苹果公司最近发布的一篇论文表明,他们正在探索一条较少被关注的技术路径——归一化流(Normalizing Flows)。

据悉,这种“归一化流”技术是一种通过学习数学变换方法,将现实世界的数据(如图片)转化为结构化噪声,并能够从噪声中还原出图像样本的生成机制。其最大特点是可以准确计算生成图像的概率分布,这是扩散模型所不具备的能力。这一特性使得归一化流在一些对概率精确性要求较高的应用场景中具有显著优势。但此类模型并不常见,主要原因是开发难度较大,且早期使用该技术生成的图像常常显得模糊、缺乏细节。

根据苹果发布的论文《Normalizing Flows are Capable Generative Models》,他们提出了一种新的归一化流模型,命名为 TarFlow(Transformer AutoRegressive Flow)。该模型的核心理念是将待生成的大图划分为多个小区域,然后以这些区域为单位逐个生成像素值。每个区块的生成都依赖于之前已经生成的内容,从而逐步构建出完整的图像。这种方法有效地避免了将图像压缩为固定词汇表时所带来的质量下降和表现力受限的问题。

苹果另辟蹊径:利用“归一化流”技术打造 AI 生图模型

不过,TarFlow 在高分辨率图像生成方面仍存在局限,因此苹果又推出了第二项研究:《STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis》。

在这项研究中,苹果基于 TarFlow 基础上开发了升级版模型:STARFlow(Scalable Transformer AutoRegressive Flow)。

这项改进的最大亮点在于,STARFlow 不再直接在像素级别生成图像,而是转而在“潜空间”(latent space)中操作。它首先生成图像的压缩表示,随后通过解码器将其放大还原。这种方式使模型无需处理数百万个像素点,而是先构建图像的整体结构,再由解码器补充细节内容,从而在保证画质的前提下提升了生成效率。

苹果另辟蹊径:利用“归一化流”技术打造 AI 生图模型

除此之外,STARFlow 还优化了文本提示的处理方式。它不再内置专门的文本编码器,而是支持调用外部语言模型(例如谷歌推出的小型语言模型 Gemma,理论上可在本地设备上运行),用于解析用户的文字指令。这样一来,图像生成模块可以更加专注于图像细节的创作与优化。

来源:https://www.php.cn/faq/1369953.html
上一篇美国众议院禁止工作人员在政府设备上使用 WhatsApp,Meta 强烈反对 下一篇严格识别、限制传播、及时下架,中消协倡议抵制极端吃播
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。