DRN:一种闭环的图像超分辨率模型.
- paper:Closed-loop Matters: Dual Regression Networks for Single Image Super-Resolution
- arXiv:link
- code:github
问题阐述
图像超分辨率(Super Resolution,SR)旨在通过神经网络学习一个从低分辨率(low-resolution,LR)图像到高分辨率(high-resolution。HR)图像的非线性映射。目前的超分辨率方法尚存两个限制:
- 学习非线性映射是一个不适定问题(ill-posed problem),存在许多HR可以下采样到相同的LR;这导致模型的解空间非常大;
- 模型训练往往需要成对的LR-HR图像数据,这在真实世界中是受限的。
模型介绍
作者提出了一种对偶回归方法,在寻找LR到HR映射的同时,建立了从HR到LR重构的路径,形成闭环,通过增加约束减少了解空间的大小;由于闭环的存在,模型训练不必依赖成对的图像数据,可以直接从LR数据中学习。
算法分析
定义$x \in \Bbb{X}$为LR图像,$y \in \Bbb{Y}$为HR图像,则模型任务可拆分成:
- 寻找一个函数映射$P:X→Y$,使得预测结果$P(x)$和HR图像$y$足够接近;
- 寻找一个函数映射$D:Y→X$,使得预测结果$D(y)$和LR图像$x$足够接近。
模型的损失函数定义如下,$λ$控制两个损失的权重:
记有标签的数据为$S_P$(成对的LR-HR),没有标签的数据为$S_U$(仅有LR),训练时:
- 更新原模型$P$时,考虑有标签的数据的HR重构损失和所有数据的LR重构损失;
- 更新对偶模型$D$时,考虑所有数据的LR重构损失。
模型结构
DRN模型包括原网络和对偶网络两部分。原网络结构受U-Net网络的启发,在下采样和上采样部分分别包括$log_2(s)$个基础块,其中$s$是超分辨率倍数。对偶网络结构简单,用卷积实现。
测试实验
作者在DIV2K和Flickr2K数据集上训练,在SET5,SET14,BSDS100,UR-BAN100和MANGA109五个数据集上测试结果。测试指标选择PSNR和SSIM。
消融实验
作者通过消融实验验证了对偶网络的重要性:
作者通过消融实验对损失函数的权重进行选择:
定义$ρ$为训练数据中无标签数据(仅有LR)的比例,以下是不同的$ρ$对应的模型性能: