MPDIoU:一种高效且准确的边界框回归损失.

边界框回归(Bounding Box Regression)在目标检测和实例分割中被广泛应用,是定位目标的重要步骤。然而,大多数现有的边界框回归损失函数在预测框与实际标注框具有相同的宽高比但宽度和高度值完全不同的情况下无法进行优化。

为了解决上述问题,作者充分探索了水平矩形的几何特征,提出了一种基于最小点距离(minimum point distance, MPD)的边界框相似度比较度量:MPDIoU,其中包含了现有损失函数中考虑的所有相关因素,例如重叠或非重叠面积、中心点距离以及宽度和高度的偏差,同时简化了计算过程。在此基础上,作者提出了一种基于MPDIoU的边界框回归损失函数,称为MPDIoU Loss

1. MPDIoU

通常情况下,使用左上角和右下角点的坐标来定义一个唯一的矩形。受到边界框几何特性的启发,作者设计了一种新颖的基于交并比的度量标准,名为MPDIoU,直接最小化预测边界框与实际标注边界框之间的左上角和右下角点距离。

\[\text{MPDIoU} = \text{IoU} - \frac{d_1^2}{w^2+h^2}- \frac{d_2^2}{w^2+h^2}\]

MPDIoU简化了两个边界框之间的相似性比较,适用于重叠或非重叠的边界框回归。由于现有损失函数中考虑的因素都可以通过左上角点和右下角点的坐标来确定,例如非重叠面积、中心点距离、宽度和高度的偏差,这意味着MPDIoU不仅考虑全面,还简化了计算过程。

相比于现有的IoU系列指标,MPDIoU在下面这种情况下是最优的:假设对于某个真实框$(w_{gt},h_{gt})$,存在两个中心重合的检测框$(kw_{gt},kh_{gt}),(w_{gt}/k,h_{gt}/k)$:

现有的IoU系列指标对上述两框的评估值是完全相同的;对于MPDIoU,预测边界框位于真实标注边界框内的值低于预测边界框位于真实标注边界框外的情况。这一特性保证了边界框回归的准确性,倾向于提供具有较少冗余的预测边界框。

2. MPDIoU Loss

通过MPDIoU可以定义MPDIoU loss

\[\text{MPDIoU loss} = 1-\text{MPDIoU}\]

MPDIoU loss始终有界,取值范围是$[0, 3)$。当两框不重叠时,MPDIoU loss $=d_1^2/d^2+d_2^2/d^2$,最小化该损失实际是在最小化两框左上角与右下角之间的距离。