SKNet:卷积核选择网络.

1. 问题阐述

作者指出,在神经科学中,视觉皮层神经元的感受野大小受到刺激的调节,即不同的刺激对应不同的感受野。在构建卷积神经网络时,同一层一般只使用一种卷积核,这限制了网络感受野的大小。

作者提出了一种卷积核大小的动态选择机制,称为Select Kernel(SK)单元。该机制允许每个神经元根据输入信息的不同尺度自适应地调整其感受野(卷积核)的大小。

2. 模型结构

Select Kernel(SK)单元由三种运算构成,分别是:

  1. Split:对输入特征使用不同尺寸的卷积核(如$3×3$、$5×5$),得到不同感受野的输出特征。为进一步提高效率,将常规的$5×5$卷积替换为$5×5$的空洞卷积,即$3×3$,rate = $2$的卷积核。
  2. Fuse:将使用不同卷积核的特征相加得到融合后的特征$U$。使用全局平均池化得到通道统计信息$S$;通过简单的全连接层创建一个紧凑的特征$Z$,使其能够进行精确和自适应的选择特征,同时减少了维度以提高效率。
  3. Select:将特征映射为不同的权重向量,通过softmax转换为权重分布,与原特征相乘进行特征选择,并将特征融合得到最终的特征$V$。

网络结构如下图所示:

3. 实验分析

作者通过消融实验证明在不显著增加模型复杂度的情况下能够提高图像分类的性能: