M-Net:用于三维脑结构分割的二维卷积神经网络.

本文主要解决医学中磁共振成像(MRI)数据的分割问题。由于MRI数据通常是三维数据(如$256 \times 256 \times 256$),二维卷积网络模型如UNet无法直接获得三维信息,而应用三维卷积又会引入较大的计算量。作者提出了一种进行三维脑结构分割的二维卷积神经网络结构M-Net,其思路是首先使用一层三维卷积层将原始数据中的一个切片压缩为二维数据,再使用二维卷积进行处理。通过这种方法减少了运算时间和内存需求,在脑结构分割数据集上取得了较好的效果。

M-Net的结构如上图所示。对于原始三维数据中的某个切片$s$,选取其邻域的一段切片$s-n:s+n$作为输入。首先使用一个尺寸为$7 \times 7 \times (2n+1)$的三维卷积将其压缩为二维特征图$\overline{s}$,之后用二维卷积网络进行处理。该网络除了与UNet中类似的编码层(下采样选用最大池化)和解码层,还引入了left legright leg两个部分。left leg使用最大池化不断下采样数据,right leg则对数据进行上采样并叠加到每一层次的输出后。模型最后输出$L$个通道的预测结果,对应分割类别数。通过对原始数据中的每一个切片进行操作,最终得到三维的分割结果。