主动学习中的损失预测.

损失预测(loss prediction)的基本思想是预测给定未标注样本的损失,更高的损失意味着该样本学习更困难、更值得标注。损失预测可以通过一个损失预测模块实现:

损失预测模块采用带dropout的多层感知机实现,选择多个网络隐藏层的特征作为输入,将它们通过全局平均池化后处理并连接起来,再进行损失回归:

为了学习损失,可以在总损失函数中增加一项真实损失$l$和预测损失$\hat{l}$之间的误差项,比如均方误差$(l-\hat{l})^2$。然而在训练过程中损失函数是不断变化的,直接学习较为困难。

作者提出根据样本对之间的预测损失的比较来构造优化目标。步骤如下:

损失预测损失定义如下:

\[\begin{aligned} L_{loss}(\hat{l},l) = &\max(0,-\Bbb{I}(l_i,l_j)\cdot (\hat{l}_i-\hat{l}_j)+\xi) \\ &\text{s.t. } \Bbb{I}(l_i,l_j)=\begin{cases} +1, & \text{if } l_i>l_j \\ -1, &\text{otherwise} \end{cases} \end{aligned}\]

在三种视觉任务上,损失预测方法的表现均超过其他方法: