通过Exemplar-CNN实现判别无监督特征学习.

对于图像数据集,在图像中增加小的扰动不会改变图像的原始语义信息或几何形式,因此轻微扰动的图像被认为和原始图像是相同的,卷积神经网络应该从中学习到对扰动具有不变性的特征。

本文作者提出了Exemplar-CNN,使用无标签图像中的图像块构造了一个代理训练集,以进行无监督的特征表示学习。

Exemplar-CNN从图像数据集的梯度较大区域(通常覆盖边缘并包含目标的一部分)中采样$32 \times 32$大小的图像块,把这些图像块称作exemplary patch。对每一个图像块应用不同的随机图像增强,同一个图像块的增强样本属于同一个代理类别。自监督学习的前置任务旨在区分不同的代理类别。理论上可以任意创造足够多的代理类别。

作者报告了不同数量的代理类别对下游分类任务的影响:

作者还报告了每个代理类别中增强图像的数量对下游分类任务的影响:

通过Exemplar-CNN还可以分析对不同数据增强程度的不变性,作者展示了在不同增强程度下网络学习到的特征向量与原始特征向量之间的归一化距离(a-c)以及在不同增强程度下分类任务的准确率变化: