Restoring Vision in Adverse Weather Conditions with Patch-Based Denoising Diffusion Models
ÖZDENIZCI O, LEGGENSTEIN R. Restoring vision in adverse weather conditions with patch-based denoising diffusion models[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 45(7): 8202-8215.
DDPM
前向过程
反向过程
损失函数
该损失函数可通过随机梯度下降对随机采样的
该式也可写成如下闭式形式:
其中
此处,式
其分布参数可写作:
为了方便训练目标,我们可以考虑固定的反向过程方差
对于前者,当
该模型可以通过优化重新加权的简化目标来训练以预测噪声向量
在这种设置下,我们优化一个网络,使其能够从
其中
高斯分布采样
从
较大的
方差调度
- 早期:β小,加噪少 → 主要学习"细微去噪"
- 后期:β大,加噪多 → 主要学习"大幅去噪"
朗之万方程
对于一个粒子在势能场
将连续时间方程离散化:
其中
DDIM
DDIM 提出了一种针对预训练扩散模型的的加速确定性采样方法,经验证能够产生一致性更好、质量更高的图像样本。隐式采样利用了广义的非马尔可夫前向过程公式:
其中,将式
且均值用方差表示为:
这是将
确定性隐式采样通过设定
在加速采样过程中,我们只需要完整时间步索引
这使反向采样的最后一步对应
条件扩散模型
条件扩散模型的核心思想是学习一个条件反射过程
在训练过程中,我们从配对数据分布(如一张清晰图像
我们先前通过公式
需要注意的是,让反向过程以
该公式定义了一条从
基于块的扩散式图像恢复
图像修复的基准测试集以及现实世界中的图片,都包含各种尺寸的图像。相反,现有的生成模型架构大多是为固定尺寸的图像处理而定制的。最近有一项扩散模型研究工作探索了尺寸无关的模糊图像恢复。他们的模型使用固定尺寸的图像块进行优化,然后在测试时通过简单地向模型提供任意尺寸的输入来进行去模糊,因此严格依赖于一种修改过的全卷积网络架构。这也导致了高昂的测试时计算需求,以确保整个图像能在内存中处理。与之不同,我们在测试时也将图像分解为重叠的固定尺寸块,并在采样过程中将它们融合。
为什么分块
扩散模型通常要求固定输入尺寸(如256x256)。处理任意大图时,直接缩放会丢失细节,而分块处理可以保持局部细节,并允许在有限显存下处理大图。
基于块的图像修复的总体思路是:对从图像中提取的局部块进行操作,并以最优方式合并结果。这种方法迄今为止的一个重要缺点是,生成的图像可能包含来自独立修复的中间结果的合并伪影,这在传统修复方法中已被广泛研究。我们将通过引导反向采样过程,使相邻块之间趋于平滑,从而解决这个问题,避免出现边缘伪影。
块间不一致
如果每个块独立进行扩散逆过程(从噪声生成清晰块),相邻块的边界处会出现不连续、撕裂或模糊,因为模型不知道块之间的关系。
我们将任意大小的未知真实图像定义为
其中
我们通过从网格状排列的解析方案中提取所有重叠的
当基于相邻的重叠图像块执行条件反向采样时,对于重叠的网格单元将获得不同的修复估计。我们通过在任意给定的去噪时间步
(1)我们使用
(2)将这些重叠的噪声估计累积到与整个图像尺寸相同的矩阵
(3)根据每个像素接收到的估计数量对
(4)使用平滑后的全图噪声估计
算法2 基于块的扩散式图像恢复
输入: 天气退化的图像 ,条件扩散模型 ,隐式采样步骤 , 包含 个重叠图像块位置的字典.
- for
do -
-
if else -
and - for
do -
and -
-
- end for
-
// 表示逐元素除法 -
- end for
- return
我们的方法不同于在采样后平均重叠最终重建结果的简单基线方法。如果在采样后应用,这种方法会破坏局部图像块分布与学习到的后验分布的保真度。然而,与我们的基于重叠图像块的引导采样原理不同但精神相似,最近也有一些成功的图像编辑方法基于在潜在空间中引导反向过程,以从学习到的密度的一个压缩子空间中采样。
需要注意的是,较小的
我们提出的基于块的条件扩散建模方法是与任务无关的,并且当在训练时观察到来自多种天气降质混合的示例图像对时,可以进一步扩展到同时处理多种天气破坏
意义
- 处理任意大小的高分辨率图像。
- 保持全局一致性和局部细节。
- 适用于多种图像修复任务(去雨、去雪、去雾等),且无需在测试时指定任务类型(模型从数据中自动学习混合分布)。