VAAL: 变分对抗主动学习.

1. VAAL的流程

用$(x_L,y_L)$表示标记样本池$(X_L,Y_L)$中的样本，$x_U$表示未标记样本池$X_U$中的样本。主动学习的目的是训练一个模型循环的从未标记样本池中采样一个budget，即$b$个最有价值的样本($x_U$~$X_U$)，增加到标记样本池中，从而使得模型经过标记样本训练获得更好的表现。VAAL设计了寻找这个budget的过程。

作者使用$\beta$-VAE进行特征的表示学习，编码器把输入样本转换为低维的概率分布，解码器重构输入数据。这一步的目的是把输入样本编码到高斯先验的低维特征空间。$\beta$-VAE的损失函数表示为：

\[\begin{aligned} \mathcal{L}^{trd}_{\text{VAE}}= & \mathbb{E}[\log p_{\theta}(x_L|z_L)] -\beta \text{D}_{\text{KL}}(q_{\phi}(z_L|x_L)||p(z)) \\ &+ \mathbb{E}[\log p_{\theta}(x_U|z_U)] -\beta \text{D}_{\text{KL}}(q_{\phi}(z_U|x_U)||p(z)) \end{aligned}\]

作者进一步使用对抗网络学习区分隐空间中的编码特征，即增加一个判别器区分低维特征来自标注样本池还是未标注样本池。此时$\beta$-VAE试图将有标注和无标注的样本映射到相似的空间，并欺骗判别器将所有输入识别为标注池样本。$\beta$-VAE的对抗损失使用交叉熵损失：

\[\mathcal{L}^{adv}_{\text{VAE}} = -\mathbb{E}[\log (D(q_{\phi}(z_L|x_L)))]-\mathbb{E}[\log (D(q_{\phi}(z_U|x_U)))]\]

而判别器试图有效地区分标记样本和未标记样本的特征：

\[\mathcal{L}_{\text{D}} = -\mathbb{E}[\log (D(q_{\phi}(z_L|x_L)))]-\mathbb{E}[\log (1-D(q_{\phi}(z_U|x_U)))]\]

记最终要实现的任务为$T$，$T$的训练与主动学习的训练可以是独立的。VAAL的完整流程如下：