首页 游戏 软件 资讯 排行榜 专题
首页
AI
PractiLight:扩散模型重塑图像照明,无需大规模微调的奥秘

PractiLight:扩散模型重塑图像照明,无需大规模微调的奥秘

热心网友
64
转载
2026-01-25

这项研究有一个关键洞察:图像中的光照关系,本质上类似于自注意力机制中的标记交互过程,因此它在自注意力层中能够得到最充分的体现。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

论文介绍

对生成式图像进行精细的光线控制,是一项极具挑战性的任务。它不仅涉及全局构图,还深入到频谱层面的细节。现有大多数方法通过在特定领域的大规模数据集上进行训练来解决这一问题,但这往往会限制基础主干网络本身所具备的泛化能力和适应性。而PractiLight则提出了一种实用的新思路,它巧妙地利用了近期对生成模型内部机理的基础理解,来高效地完成这项任务。

研究指出,图像中的光照关系,其本质与自注意力层中不同标记的相互作用高度相似,因此自注意力层自然成为捕捉这种关系的最佳场所。基于这一洞见,并结合关于早期扩散迭代重要性的分析,PractiLight训练了一个轻量级的LoRA回归器,仅需使用一小部分训练图像,即可生成给定图像的直接辐照度图。随后,利用这个回归器,通过分类器引导的方式,将所需的光照效果融入到另一幅图像的生成过程中。这种精巧的设计能够很好地泛化到各种不同的条件与图像领域。该方法在生成质量和控制精度方面都展现了最先进的性能,并且在与现有领先方法的对比中,在多种场景类型上都经过了验证,具备优异的参数和数据效率。这项工作证实,通过利用基础知识,我们可以切实地控制图像的照明,从而实现实用且通用的重新打光。

简述

这项研究的一个主要发现是,大型扩散模型本身就具备对光线传播的深刻理解,无需在数百万张图像上进行微调,即可实现合理的重新照明,从而降低了对大规模泛化数据的需求。为了利用这一先验知识,关键在于仔细考虑在何处(哪个网络层)以及何时(哪个时间步)添加引导信号。这使得我们能够仅在一个小规模的合成数据集上,训练一个微型的回归器来提取直接辐照度图,并利用它来指导生成过程,以非常显著的效果重新照亮图像,同时保持原始图像的辨识度和风格。该方法能够在广泛的图像领域中获得高质量的重新照明结果,只需要很少的额外计算,也无需专门或大规模的数据。

光传输分析

为了研究哪些网络层编码了光传输现象,论文进行了一项特征注入实验:将从重照明图像生成过程中提取的激活信号,注入到原始图像(来自同一场景)的生成过程中。我们发现,光传输效应主要编码在自注意力层中,尤其是在基于UNet的扩散模型(如SD 1.5)的解码器部分。这并不奇怪——我们推测自注意力机制中的多对多交互类似于光传输中的交互,这使得这些层成为编码此类效应的天然场所。从这个意义上说,自注意力可以作为光传输建模的归纳偏置。

验证

我们通过创建一个包含来自不同图像领域的自定义提示图像数据集,来验证我们的方法。将本文的结果与其他最先进的方法进行了比较,并测量了其美观性、控制力、身份一致性以及效率。我们发现我们的方法在所有指标上都极具竞争力。我们进一步进行了一项用户研究,结果表明我们的结果优于其他方法。我们将结果的泛化能力和高质量归功于回归器的小规模训练。

来源:https://www.51cto.com/article/834645.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

人大AI智能体提速:扩散模型实现边思考边搜索
科技数码
人大AI智能体提速:扩散模型实现边思考边搜索

这项由中国人民大学、上海交通大学等机构联合完成的研究发表于2026年,论文编号为arXiv:2602 07035v1,标志着人工智能搜索代理技术的一次重要突破。有兴趣深入了解的读者可以通过该论文编号

热心网友
02.12
PickStyle视频风格适配器:用上下文迁移完成视频风格转换
AI
PickStyle视频风格适配器:用上下文迁移完成视频风格转换

论文提出PickStyle框架,用风格适配器增强预训练网络,靠配对静态图像数据训练,还通过构建合成训练片段弥合差距,引入CS-CFG确保风格迁移与内容保留。实验表明,该方法能实现优质视频转换,优于现

热心网友
02.10
Stable-DiffCoder突破扩散模型,实现代码生成新超越
AI
Stable-DiffCoder突破扩散模型,实现代码生成新超越

机器之心编辑部扩散语言模型(Diffusion Language Models, DLLMs)因其多种潜在的特性而备受关注,如能加速的非自回归并行生成特性,能直接起草编辑的特性,能数据增强的特性。然

热心网友
02.09
扩散模型如何预测?独立研究者揭秘最佳目标策略
科技数码
扩散模型如何预测?独立研究者揭秘最佳目标策略

扩散模型就像是一位神奇的画家,它能从一片混乱的噪点中逐步画出美丽的图像。不过,这位画家在作画时面临一个关键选择:它应该专注于去除画布上的噪点,还是直接描绘最终的图像轮廓?这个看似简单的问题,实际上一

热心网友
02.04
PractiLight:扩散模型重塑图像照明,无需大规模微调的奥秘
AI
PractiLight:扩散模型重塑图像照明,无需大规模微调的奥秘

论文的关键见解是,图像中的光照关系本质上类似于自注意力层中的标记交互,因此在自注意力层中得到了最佳体现。 标题:PractiLight: 使用基础扩散模型进行实用光控制论文:https: arxi

热心网友
01.25

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Incerto Observability
AI
Incerto Observability

Incerto Observability是什么 在监控工具这个领域,我们常常面临一个选择题:是选择功能强大但黑盒化的商业套件,还是拥抱灵活却需要大量自研投入的开源方案?Incerto Observability的出现,似乎提供了一个折中的答案。这款由 Incerto Technologies 开发

热心网友
04.17
灰烬之国手游好玩吗|灰烬之国手游核心玩法、职业选择与新手入门详解
游戏攻略
灰烬之国手游好玩吗|灰烬之国手游核心玩法、职业选择与新手入门详解

《灰烬之国》深度评测:硬核肉鸽与叙事融合,是否值得长期投入? 近期,一款名为《灰烬之国》的 Roguelike 手游在玩家社群中热度显著上升。它尤其吸引了那些钟爱高自由度构筑与强随机性挑战的硬核玩家群体。本作成功地将深度叙事与复杂的玩法系统相结合,那么,它是否值得你投入大量时间进行深入体验?我们来全

热心网友
04.17
insert into select 大数据量插入的性能优化与分批提交方案
数据库
insert into select 大数据量插入的性能优化与分批提交方案

大数据量插入的性能瓶颈分析在数据库操作中,直接使用简单的INSERT语句处理海量数据时,往往会遭遇显著的性能瓶颈。当数据量达到百万甚至千万级别时,单次事务过大、日志写入压力剧增、锁竞争激烈以及网络传输超时等问题会集中爆发,导致插入操作异常缓慢,甚至引发事务回滚或连接中断。其中,数据库的事务日志(如M

热心网友
04.17
《红色沙漠》弓箭爆炸输出流玩法攻略分享
游戏攻略
《红色沙漠》弓箭爆炸输出流玩法攻略分享

《红色沙漠》弓箭爆炸输出流玩法攻略分享 在《红色沙漠》这款游戏中,追求极致伤害与爽快战斗体验的玩家,往往会对弓箭爆炸输出流青睐有加。该流派以其卓越的爆发能力和广泛的适应性,堪称应对各类高难度BOSS与副本的“万金油”选择。其核心魅力在于通过精妙的技能组合,在短时间内倾泻出毁灭性的伤害。如果你渴望掌握

热心网友
04.17
insert into select 入门指南:从基础查询到数据迁移
数据库
insert into select 入门指南:从基础查询到数据迁移

理解 insert into select 的核心概念在数据库操作中,数据的复制与迁移是一项常见任务。insert into select 语句正是为此而生的强大工具。它并非两个独立命令的简单拼接,而是一个将数据查询与数据插入无缝结合的单步操作。其基本语法结构为:INSERT INTO 目标表 (列

热心网友
04.17