Augmentation for small object detection - 郑之杰的个人网站

目标检测中针对小目标的数据增强方法.

paper：Augmentation for small object detection
arXiv：link

目标检测任务中对小目标的检测通常是比较困难的，其主要原因如下：

训练集中含有小目标的样本比例较少。如MSCOCO数据集中，所有目标中有$41.43\%$都是小目标，但只有$51.82\%$的图像中出现了这些小目标。
小目标所占的标注面积较少。如MSCOCO数据集中，只有$1.23\%$的标注像素属于小目标。

目前大多数目标检测方法都采用预设anchor的策略，即将anchor和groud truth匹配，匹配IoU超过一定阈值的anchor被看作正样本。这种匹配方式更倾向于大的目标，造成小目标匹配少、大目标匹配多的不平衡问题。由于小目标匹配较少，在训练阶段对计算损失的贡献较少，导致检测准确率不高。

作者提出过采样(oversampling)和复制粘贴(copy-pasting)两种数据增强方法，以此来提供足够多的小目标进行匹配，提高小目标检测的性能。