CAL:对比主动学习.

对比主动学习(contrastive active learning, CAL)旨在选择具有对比性的样本。如果两个具有不同标签的样本具有相似的特征表示,则把它们看作对比样本。

对于一对对比样本(xi,xj)应满足:

d(Φ(xi),Φ(xj))<ϵandKL[p(y|xi)||p(y|xj)]

对于一个未标注的样本xCAL选择样本的流程如下:

  1. 选择特征空间中与其距离最近的k个标注样本{(xil,yi)}i=1MX
  2. 计算未标注样本x特征与选出的k个标注样本{xl}特征之间的KL散度;
  3. 未标注样本x的对比得分为所有KL散度的平均值:s(x)=1Mi=1MKL[p(y|xil)||p(y|x)]
  4. 选择具有高对比得分的样本进行标注。

作者给出了CAL在不同分类任务上的实验结果: