随机擦除数据增强.

本文作者提出了随机擦除(random erasing)数据增强,在训练时随机选择图像的一个矩形区域,并使用随机值填充该区域。随机擦除没有引入额外的学习参数,在实现上是高效的。通过生成随机大小的图像遮挡能够增强模型的泛化能力。一些随机擦除的图像结果展示如下:

指定一张图像$I$应用随机擦除的概率是$p$。若图像$I$的尺寸是$H\times W$,面积是$S=H\times W$,随机生成擦除矩形区域的面积$S_e$,其中$\frac{S_e}{S}$取值范围是$[s_l,s_h]$。

进一步从范围$[r_1,r_2]$中随机采样矩形的长宽比$r_e$。最终随机选择的矩形区域$I_e$具有尺寸$H_e=\sqrt{S_e\times r_e}$和$W_e=\sqrt{\frac{S_e}{r_e}}$。

从图像中随机选择一点$\mathcal{P}=(x_e,y_e)$,如果$x_e+W_e<W$,$y_e+H_e<H$,则选择区域$I_e=(x_e,y_e,x_e+W_e,y_e+H_e)$。如果不满足则重复上述过程,直至选择到满足条件的$I_e$。

对于选择的区域,随机指定其中的每个像素为$[0,255]$中的随机值。整个算法的流程如下:

在实验中上述超参数取值为:$p=0.5$,$s_l=0.02$,$s_h=0.4$,$r_1=1/r_2=0.3$。作者也对这些超参数的不同取值进行了实验:

除了对区域中的像素进行随机填充RE-R,作者也测试了其他几种不同的填充方法。RE-M:取ImageNet 2012数据集的像素平均值。RE-0:填充像素值为$0$。RE-255:填充像素值为$255$。实验证明随机填充效果最好:

对于图像分类和行人重识别任务,由于目标可能出现在图像的任意位置,因此随机擦除应用在整个图像区域中。在这两个任务上的表现如下:

对于目标检测任务,由于图像中的目标位置是已知的,因此随机擦除可以应用以下策略:

  1. 图像级(image-aware)随机擦除IRE:随机擦除图像中的任意区域;
  2. 目标级(object-aware)随机擦除ORE:随机擦除每个目标边界框内的区域;
  3. 图像级和目标级结合的随机擦除I+ORE:同时应用上面两种增强。

随机裁剪是指随机裁剪图像中的某一个区域,并用裁剪图像代替原始图像。随机裁剪使得模型的学习依赖于目标的不同部分,而不是整个目标。而随机擦除能够保留目标的整体结构,目标的不同部分会被随机遮挡。随机擦除和随机裁剪是两个互补的操作,同时应用两种方法能够取得更好的效果。