DBPN:一种反复下采样与上采样的超分辨率模型.
- paper:Deep Back-Projection Networks For Super-Resolution
- arXiv:link
相关工作
作者总结了图像超分辨率的相关工作,并将模型划分为四种:
- Predefined upsampling:首先对图像进行上采样(如Bicubic),再通过卷积网络增加细节,如SRCNN, VDSR, DRRN;
- Single upsampling:先通过卷积网络提取丰富的特征,再通过单次上采样增加分辨率,如FSRCNN, ESPCN, EDSR;
- Progressive upsampling:通过拉普拉斯金字塔网络逐渐增加分辨率,如LapSRN;
- Iterative up and downsampling:循环地进行上采样和下采样,增加丰富的特征信息,如DBPN。
网络结构
1. Projection units
Projection包括Up-Projection和Down-Projection。
(1)Up-Projection
先对L特征进行上采样和下采样,得到残差信号;对残差信号进行上采样,融合之前上采样得到的特征,最终得到上采样的特征。
(2)Down-Projection
先对H特征进行下采样和上采样,得到残差信号;对残差信号进行下采样,融合之前下采样得到的特征,最终得到下采样的特征。
2. Dense projection units
作者引入了DenseNet中的dense connections,即每一层特征均使用之前的所有特征,称为Dense DBPN(D-DBPN)。
作者没有使用原网络中的dropout和batchnorm,并引入了$1×1$卷积进行通道压缩。
3. Network architecture
网络主要由三部分构成:
- Initial feature extraction:对输入图像使用若干$3×3$和$1×1$卷积提取特征;
- Back-projection stages:对特征进行反复下采样和上采样,得到若干重构的特征$H^1,…,H^t$;
- Reconstruction:对所有重构特征$H^1,…,H^t$进行最后的重构,得到输出SR。
实验结果
实验设置:
- 训练集:DIV2K, Flickr, ImageNet
- 训练尺寸:裁剪32×32, batchsize20
作者首先验证了模型深度对结果的影响。具体地,作者设置了$L(t=6)$、$M(t=4)$、$S(t=2)$三个大小的模型:
作者对比了不同模型的参数量和性能指标:
作者可视化了$H^1,…,H^t$每一层学习到的特征:
作者验证了dense connections的有效性:
作者发现,模型尤其在较大倍数(如$×8$)的任务中表现更好: