LAPGAN:使用拉普拉斯金字塔对抗网络生成高分辨率图像.

在原始GAN中,只能生成16×16,32×32这种低像素小尺寸的图片。而LAPGAN首次实现64×64的图像生成。

LAPGAN采用coarse-to-fine的生成思路,与其一下子生成这么大的(包含信息量这么多),不如一步步由小到大,这样每一步生成的时候,可以基于上一步的结果,而且还只需要“填充”和“补全”新图片所需要的那些信息。

1. 拉普拉斯金字塔

拉普拉斯金字塔是一种图像存储方式,它存储不同尺寸的插值图像Li=Girescale(Gi+1);即先通过高斯模糊、下采样操作等构造低分辨率图像Gi+1,然后进行上采样后与上一层的图像Gi作差。

相比于存储原始图像G0,存储插值图像L0,L1,和顶部的高斯图像GN需要更少的内存。这是因为插值图像的数值范围小,因此可以通过更少的比特数来存储像素;而且顶层高斯图像尺寸小。

拉普拉斯金字塔是可逆的,因此可以通过顶层高斯图像和每一层的插值图像无损地恢复原始图像。因此拉普拉斯金字塔是一种无损的图像压缩方法。

2. LAPGAN

LAPGAN的工作过程如下图所示。图中给出了一个三级的图像生成过程,使用了4个生成模型对图像进行三次上采样。从一个噪声样本z3开始,使用生成模型G3生成尺寸为H8×W8的图像I~3,将其经过插值上采样变为尺寸为H4×W4I2;将输入噪声z2和图像I2输入生成模型G2,生成图像I2中缺失的细节h~2 (通常对应图像的高频部分);通过将图像I2和细节h~2相加获得更清晰的图像。以此类推,最终获得完整分辨率的图像。其中首个生成模型G3建模为普通GAN的生成器,其余生成模型G2,,G0建模为条件GAN的生成器。

LAPGAN的损失函数构造过程如下图所示。由于生成模型生成细节图像,因此需要构造真实的细节图像,才能建立对抗函数。对于生成尺寸为H×W的的图像I0,将其通过下采样产生图像I1,然后再通过插值上采样生成图像l0。图像l0相比于图像I0缺失了图像的细节。从原始图像I0中减去图像l0可以得到真实的细节图像h0。另一方面,将随机噪声z0和图像l0通过生成模型G0得到生成的细节图像h~0。判别器D0接收图像l0和细节图像,用于区分细节图像h0h~0

作者通过人类判别是否是自然图像来评估不同方法的性能。结果表明LAPGAN平均有40%的概率生成使人类认为真实的图像。