GAAL:生成对抗主动学习.
本文提出了使用GAN实现主动学习的方法,旨在通过生成对抗的方式生成新的训练样本,而不是依赖于从未标记样本池中选择样本进行标记。
给定未标记样本池和标注预算,主动学习算法旨在选择一部分样本进行标注,如图a所示;而生成对抗主动学习(Generative Adversarial Active Learning, GAAL)生成新的样本,并由标注者提供标签用于训练模型。
GAAL的做法是首先人工标注少量随机选择的样本,通过训练DCGAN使得判别器能够区分原样本和生成样本,再选择判别器无法确定的生成样本进行人工标注后加入训练集。这些不确定的生成样本通常位于决策边界附近,且具有比未标记池中更多的可用样本。
GAAL的完整流程如下:
实验部分是用SVM做分类器,DCGAN做判别器和生成器在MNIST,USPS和CIFAR上做二分类实验。