实践的人体重识别中的深度度量学习.

人体重识别(Person Re-Identification)任务需要判断两幅人体图像是否属于同一对象,关键在于学习到良好的表征和度量来评估样本之间的相似性。本文的主要模型由参数共享的卷积神经网络、基于余弦相似度的连接函数和基于二项式偏差的损失函数三部分组成。

人体重识别网络采用孪生(siamese)神经网络,通过两个子网络来实现“样本对→标签”模式。两个子网络间参数是否共享,将有具体任务所决定:参数不共享,网络能够更自然地处理特定视角的匹配任务;参数共享,则网络更适用于通用任务,如跨数据集的人体重识别。

本文采用参数共享的卷积神经网络,结构如下:

连接函数用来评估两个样本之间的关系(相似度),常见的连接函数有距离函数、相似性函数或其它函数,如欧氏距离、马氏距离、余弦相似度、绝对误差(距离)和向量链接等。其中欧式距离的导数形式简单,但是其输出是无界的,这可能会使训练过程不稳定;绝对距离在某些情况下是不可导的;而余弦相似度有界,具有尺度不变形。本文采用余弦相似度作为连接函数。

本文选择了二项式偏差(Binomial Deviance)作为损失函数,其表达式如下:

\[\Bbb{I}(y_i=y_j) \log(1+\exp(\alpha(D[f_{\theta}(x_i),f_{\theta}(x_j)]-\lambda))) \\ + \Bbb{I}(y_i\neq y_j) \log(1+\exp(\beta(\lambda- D[f_{\theta}(x_i),f_{\theta}(x_j)])))\]