Random Erasing Data Augmentation - 郑之杰的个人网站

随机擦除数据增强.

本文作者提出了随机擦除(random erasing)数据增强，在训练时随机选择图像的一个矩形区域，并使用随机值填充该区域。随机擦除没有引入额外的学习参数，在实现上是高效的。通过生成随机大小的图像遮挡能够增强模型的泛化能力。一些随机擦除的图像结果展示如下：

指定一张图像$I$应用随机擦除的概率是$p$。若图像$I$的尺寸是$H\times W$，面积是$S=H\times W$，随机生成擦除矩形区域的面积$S_e$，其中$\frac{S_e}{S}$取值范围是$[s_l,s_h]$。

进一步从范围$[r_1,r_2]$中随机采样矩形的长宽比$r_e$。最终随机选择的矩形区域$I_e$具有尺寸$H_e=\sqrt{S_e\times r_e}$和$W_e=\sqrt{\frac{S_e}{r_e}}$。

从图像中随机选择一点$\mathcal{P}=(x_e,y_e)$，如果$x_e+W_e<W$,$y_e+H_e<H$，则选择区域$I_e=(x_e,y_e,x_e+W_e,y_e+H_e)$。如果不满足则重复上述过程，直至选择到满足条件的$I_e$。

对于选择的区域，随机指定其中的每个像素为$[0,255]$中的随机值。整个算法的流程如下:

在实验中上述超参数取值为：$p=0.5$,$s_l=0.02$,$s_h=0.4$,$r_1=1/r_2=0.3$。作者也对这些超参数的不同取值进行了实验:

除了对区域中的像素进行随机填充RE-R，作者也测试了其他几种不同的填充方法。RE-M：取ImageNet 2012数据集的像素平均值。RE-0：填充像素值为$0$。RE-255：填充像素值为$255$。实验证明随机填充效果最好：

对于图像分类和行人重识别任务，由于目标可能出现在图像的任意位置，因此随机擦除应用在整个图像区域中。在这两个任务上的表现如下：

对于目标检测任务，由于图像中的目标位置是已知的，因此随机擦除可以应用以下策略：

随机裁剪是指随机裁剪图像中的某一个区域，并用裁剪图像代替原始图像。随机裁剪使得模型的学习依赖于目标的不同部分，而不是整个目标。而随机擦除能够保留目标的整体结构，目标的不同部分会被随机遮挡。随机擦除和随机裁剪是两个互补的操作，同时应用两种方法能够取得更好的效果。