商汤科技和香港中文大学开源的基于Pytorch实现的深度学习目标检测工具箱。

MMDetection的特点:

  1. Mudule design
  2. Support of multiple frameworks out of box
  3. High efficiency
  4. State of the art

目录:

  1. Architecture
  2. Hyper-parameters
  3. Supported Frameworks

1. Architecture

(1). Model Representation

目标检测模型通常由不同的组件构成。MMDetection中的基本组件包括:

用基本组件组成的Single-stage和Two-stage的模型框架:

(2). Training Pipeline

训练(training epochs)和验证(validation epochs)时设计了hooking mechanism。训练时的pipeline如下,验证类似。

2. Hyper-parameters

(1). Regression Losses

目标检测的损失包括边界框回归损失和分类损失。可选的回归损失如下:

不同的回归损失和损失系数搜索如下:

(2). Normalization Layers

目标检测训练时batch较小,使用Batch Normalization时设置如下:

可选的Normalization:

不同的Normalization及其应用的位置搜索如下:

(3). Training Scales

目标检测默认的训练scale为1333×800。

MMDetection允许multi-scale训练,即每次训练时选择一个输入image的scale,提供了两种scale选择方法:

不同的training scale搜索如下:

(4). Other Hyper-parameters

其他超参数包括:

这些超参数搜索如下:

3. Supported Frameworks

(1). Single-stage Methods

(2). Two-stage Methods

(3). Multi-stage Methods

(4). General Modules and Methods

一些frameworks的表现如下: