KeepAugment:提高保真度的图像增强方法.
- paper:KeepAugment: A Simple Information-Preserving Data Augmentation Approach
- arXiv:link
数据增强能够提高网络的性能。在图像任务中,尽管针对图像的增强方法能够增加有效样本的数量和训练数据的多样性,但不可避免地引入了具有噪声和歧义的样本。当前的图像增强方法可分为两类,区域级图像增强方法(如Coutout、CutMix)通常遮挡或修改图像的随机矩形区域,图像级图像增强方法(如AutoAugment、RandAugment)通过强化学习寻找变换组合(如旋转、改变颜色)的最佳策略。
尽管目前的数据增强方法能够增加有效样本数,但如果增强幅度不合适,可能会引入噪声和歧义导致信息丢失。在CIFAR-10数据集上,分别对Coutout和RandAugment两种方法进行实验,实验结果如下图所示,两种数据增强都提高了模型的泛化能力(表现为原始数据的训练和测试准确率之间的差距)。但当增强程度太大时,模型准确率均下降。
作者提出了一种图像数据增强方法:KeepAugment。首先通过计算saliency map找到图像中对结果影响较大的区域,保留重要性得分较高的矩形区域后应用增强方法。对于Coutout,避免剪切重要的区域;对于RandAugment,将重要区域粘贴到图像上。
KeepAugment对每张输入图像通过反向传播计算saliency map,计算成本较高。在论文中,作者提出两种有效的策略降低计算量,均不会导致性能的下降。
第一种是基于低分辨率的近似方法,即先把输入图像通过下采样生成一个低分辨率的图像,再对该低分辨率图像计算saliency map;将该saliency map上采样恢复到原始分辨率,能够显著降低计算量。
第二种是基于early loss的近似方法,即在浅层网络计算loss,通过该loss反向传播计算saliency map,降低计算量。