游乐游手机版
首页/科技数码/文章详情

苹果另辟蹊径:利用“归一化流”技术打造 AI 生图模型

时间:2025-07-15 18:40
感谢网友 对的时间点 提供的线索!6 月 24 日消息,目前业界普遍采用扩散模型或自回归模型来开发 AI 图像生成系统。然而,苹果公司最近发布的一篇论文表明,他们正在探索一条较少被

感谢网友 对的时间点 提供的线索!

6 月 24 日消息,目前业界普遍采用扩散模型或自回归模型来开发 AI 图像生成系统。然而,苹果公司最近发布的一篇论文表明,他们正在探索一条较少被关注的技术路径——归一化流(Normalizing Flows)。

据悉,这种“归一化流”技术是一种通过学习数学变换方法,将现实世界的数据(如图片)转化为结构化噪声,并能够从噪声中还原出图像样本的生成机制。其最大特点是可以准确计算生成图像的概率分布,这是扩散模型所不具备的能力。这一特性使得归一化流在一些对概率精确性要求较高的应用场景中具有显著优势。但此类模型并不常见,主要原因是开发难度较大,且早期使用该技术生成的图像常常显得模糊、缺乏细节。

根据苹果发布的论文《Normalizing Flows are Capable Generative Models》,他们提出了一种新的归一化流模型,命名为 TarFlow(Transformer AutoRegressive Flow)。该模型的核心理念是将待生成的大图划分为多个小区域,然后以这些区域为单位逐个生成像素值。每个区块的生成都依赖于之前已经生成的内容,从而逐步构建出完整的图像。这种方法有效地避免了将图像压缩为固定词汇表时所带来的质量下降和表现力受限的问题。

苹果另辟蹊径:利用“归一化流”技术打造 AI 生图模型

不过,TarFlow 在高分辨率图像生成方面仍存在局限,因此苹果又推出了第二项研究:《STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis》。

在这项研究中,苹果基于 TarFlow 基础上开发了升级版模型:STARFlow(Scalable Transformer AutoRegressive Flow)。

这项改进的最大亮点在于,STARFlow 不再直接在像素级别生成图像,而是转而在“潜空间”(latent space)中操作。它首先生成图像的压缩表示,随后通过解码器将其放大还原。这种方式使模型无需处理数百万个像素点,而是先构建图像的整体结构,再由解码器补充细节内容,从而在保证画质的前提下提升了生成效率。

苹果另辟蹊径:利用“归一化流”技术打造 AI 生图模型

除此之外,STARFlow 还优化了文本提示的处理方式。它不再内置专门的文本编码器,而是支持调用外部语言模型(例如谷歌推出的小型语言模型 Gemma,理论上可在本地设备上运行),用于解析用户的文字指令。这样一来,图像生成模块可以更加专注于图像细节的创作与优化。

来源:https://www.php.cn/faq/1369953.html
上一篇美国众议院禁止工作人员在政府设备上使用 WhatsApp,Meta 强烈反对 下一篇严格识别、限制传播、及时下架,中消协倡议抵制极端吃播
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
津产氢能自行车亮相智博会:零排放续航80公里1分钟快速补能
科技数码 · 2026-05-30

津产氢能自行车亮相智博会:零排放续航80公里1分钟快速补能

在正在举行的世界智能产业博览会上,一款墨绿色的氢能源自行车成为了荣程集团展台最吸睛的存在——不少参观者路过时都忍不住停下来,仔细端详,甚至亲自上去试一把。说实话,在满场智能科技产品中,这个既低调又带着未来感的家伙,确实让人眼前一亮。 据现场工作人员介绍,这款氢能自行车一次充能就能跑大约80公里,日常

张维为:Manus并购被叫停 硬核管控守AI根基
科技数码 · 2026-05-30

张维为:Manus并购被叫停 硬核管控守AI根基

我国叫停Meta收购AI企业Manus的交易。张维为指出,该企业依托中国数据、算力成长后迁至新加坡变外企,依据进出口技术管理规定审核是守护核心资产的必要举措,硬核管控守住AI根基。

电投绿能拟投10万千瓦风电项目 合锻智能不涉及AI算力
科技数码 · 2026-05-30

电投绿能拟投10万千瓦风电项目 合锻智能不涉及AI算力

多家上市公司发布公告:利通电子与合锻智能澄清不涉及AI算力业务;电投绿能拟投建两个风电项目;獐子岛拟建设深海筏式养殖项目;精测电子控股子公司签订5 16亿元销售合同;中国建筑联合体中标高速公路项目;万隆光电拟收购中控信息100%股份。

英伟达三个月密集投资光子技术至少65亿美元
科技数码 · 2026-05-30

英伟达三个月密集投资光子技术至少65亿美元

英伟达正斥巨资布局光子技术,力求从底层突破AI大规模部署的能耗瓶颈。自今年3月以来,英伟达已向多家光子技术企业累计承诺投入至少65亿美元,成为这一新兴领域出手最为果断的战略买家之一。光子技术以光信号替代电信号传输数据,被业界视为打破AI基础设施扩张瓶颈的核心路径——这已不再是概念,而是正在落地的现实

2026年3000元预算手机推荐 荣耀600续航影像双突破
科技数码 · 2026-05-30

2026年3000元预算手机推荐 荣耀600续航影像双突破

2026年5月登场,荣耀600直接给3000元预算段的手机市场扔了一颗“重磅冲击波”——8600mAh超大电池、2亿像素全焦段4K Live影像、IP69K全维防护、0 98mm极窄四等边屏幕,四项核心配置几乎都做到了同档位顶格。国补后到手价仅2804元起,这在一众竞品中显得格外扎眼。以往这个价位,