首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
苹果另辟蹊径:利用“归一化流”技术打造 AI 生图模型

苹果另辟蹊径:利用“归一化流”技术打造 AI 生图模型

热心网友
33
转载
2025-07-15

感谢网友 对的时间点 提供的线索!

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

6 月 24 日消息,目前业界普遍采用扩散模型或自回归模型来开发 AI 图像生成系统。然而,苹果公司最近发布的一篇论文表明,他们正在探索一条较少被关注的技术路径——归一化流(Normalizing Flows)。

据悉,这种“归一化流”技术是一种通过学习数学变换方法,将现实世界的数据(如图片)转化为结构化噪声,并能够从噪声中还原出图像样本的生成机制。其最大特点是可以准确计算生成图像的概率分布,这是扩散模型所不具备的能力。这一特性使得归一化流在一些对概率精确性要求较高的应用场景中具有显著优势。但此类模型并不常见,主要原因是开发难度较大,且早期使用该技术生成的图像常常显得模糊、缺乏细节。

根据苹果发布的论文《Normalizing Flows are Capable Generative Models》,他们提出了一种新的归一化流模型,命名为 TarFlow(Transformer AutoRegressive Flow)。该模型的核心理念是将待生成的大图划分为多个小区域,然后以这些区域为单位逐个生成像素值。每个区块的生成都依赖于之前已经生成的内容,从而逐步构建出完整的图像。这种方法有效地避免了将图像压缩为固定词汇表时所带来的质量下降和表现力受限的问题。

苹果另辟蹊径:利用“归一化流”技术打造 AI 生图模型

不过,TarFlow 在高分辨率图像生成方面仍存在局限,因此苹果又推出了第二项研究:《STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis》。

在这项研究中,苹果基于 TarFlow 基础上开发了升级版模型:STARFlow(Scalable Transformer AutoRegressive Flow)。

这项改进的最大亮点在于,STARFlow 不再直接在像素级别生成图像,而是转而在“潜空间”(latent space)中操作。它首先生成图像的压缩表示,随后通过解码器将其放大还原。这种方式使模型无需处理数百万个像素点,而是先构建图像的整体结构,再由解码器补充细节内容,从而在保证画质的前提下提升了生成效率。

苹果另辟蹊径:利用“归一化流”技术打造 AI 生图模型

除此之外,STARFlow 还优化了文本提示的处理方式。它不再内置专门的文本编码器,而是支持调用外部语言模型(例如谷歌推出的小型语言模型 Gemma,理论上可在本地设备上运行),用于解析用户的文字指令。这样一来,图像生成模块可以更加专注于图像细节的创作与优化。

来源:https://www.php.cn/faq/1369953.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

百度飞桨PaddleOCR登GitHub榜首:最受欢迎中文开源OCR工具
业界动态
百度飞桨PaddleOCR登GitHub榜首:最受欢迎中文开源OCR工具

3月31日消息,近日,百度文心衍生模型PaddleOCR在GitHub上的Star数突破73 3K,首次超越谷歌旗下开源OCR标杆产品Tesseract OCR(73 2K),成为全球Star数最高

热心网友
03.31
苹果深夜发布国行AI大乌龙,紧急上线又撤回原因解析
网络安全
苹果深夜发布国行AI大乌龙,紧急上线又撤回原因解析

快科技3月31日消息,今日,大量国行iPhone用户在社交平台发帖称,自己意外收到了苹果Apple Intelligence国行Beta版本推送,引发关注。据用户反馈,只需将系统升级至iOS 26

热心网友
03.31
马拉松比谈哈萨比斯:引领谷歌重返AI王座之路
科技数码
马拉松比谈哈萨比斯:引领谷歌重返AI王座之路

21世纪经济报道记者 董静怡2024年的伦敦,科技史学家、金融史学家塞巴斯蒂安·马拉比找到了德米斯·哈萨比斯。彼时ChatGPT尚未引爆全球,AI远未成为茶余饭后的谈资。但马拉比已经嗅到了风暴的气息

热心网友
03.31
古尔曼:Apple Intelligence意外在中国上线,苹果紧急下架
科技数码
古尔曼:Apple Intelligence意外在中国上线,苹果紧急下架

IT之家 3 月 31 日消息,据彭博社马克 · 古尔曼今日消息,Apple Intelligence 在中国属于意外上线,该功能已准备就绪数月,但苹果尚未获得监管部门批准。目前没有即将发布的计划,

热心网友
03.31
Pixel 10 Pro过热致硬件损坏?用户实测长时间开手电筒风险
网络安全
Pixel 10 Pro过热致硬件损坏?用户实测长时间开手电筒风险

IT之家 3 月 31 日消息,手机手电筒是一项用户常用的功能,无论是在漆黑的衣柜里翻找物品,还是夜间在停车场辨路前行,需要时它总能随时派上用场。但如今,部分 Pixel 10 Pro 用户反馈:如

热心网友
03.31

最新APP

史莱姆农场
史莱姆农场
休闲益智 03-31
凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28

热门推荐

Pixel 10 Pro过热致硬件损坏?用户实测长时间开手电筒风险
网络安全
Pixel 10 Pro过热致硬件损坏?用户实测长时间开手电筒风险

IT之家 3 月 31 日消息,手机手电筒是一项用户常用的功能,无论是在漆黑的衣柜里翻找物品,还是夜间在停车场辨路前行,需要时它总能随时派上用场。但如今,部分 Pixel 10 Pro 用户反馈:如

热心网友
03.31
Numbers判断闰年公式设置方法:详解步骤与实用技巧
电脑教程
Numbers判断闰年公式设置方法:详解步骤与实用技巧

闰年判定有四种Numbers兼容公式:一、MOD嵌套OR+AND逻辑;二、DATE+DAY反推2月最后一天;三、TEXT+ISERROR验证“年份-02-29”有效性;四、YEAR

热心网友
03.31
三星Hearapy应用免费上架:百赫兹音疗缓解晕车症状
科技数码
三星Hearapy应用免费上架:百赫兹音疗缓解晕车症状

IT之家 3 月 31 日消息,对很多人来说,晕车晕船是旅行中最常见的烦心事之一。三星悄然上线了一款名为 Hearapy 的免费应用,来解决这一令人不适的问题。该公司称,这款应用无需药物或物理缓解手

热心网友
03.31
湖南电信与海光信息深化合作,共筑算网融合与AI新生态
科技数码
湖南电信与海光信息深化合作,共筑算网融合与AI新生态

据海光信息(688041 SH)消息,近日,中国电信(601728 SH)湖南分公司2026年数智科技生态大会在长沙召开,中国电信湖南分公司与海光信息全面深化数智生态合作。根据协议,双方将聚焦智能制

热心网友
03.31
高端纯电困局,车企如何破解盈利难题
科技数码
高端纯电困局,车企如何破解盈利难题

30万元以上的高端纯电车,显然成了新能源车市的那块硬骨头。除了有换电加持的蔚来新ES8,大量被车企寄予厚望的高端明星纯电车都难逃疲软命运,典型如理想MEGA和i8,一次起火事故,直接造成销量断崖式下

热心网友
03.31