跨区域的油棕树检测.
- paper:Cross-Regional Oil Palm Tree Detection
- CVPR2020:link
遥感图像处理中的油棕树检测是指检测出遥感图像中的油棕树,由于其数据的大规模和多样性使得跨区域的检测较为困难。本文提出了一种跨区域的油棕树检测(cross-regional oil palm tree detection, CROPTD)方法。CROPTD包含一个局部域判别器和一个全局域判别器。通过局部注意力机制改进局部域判别器,增强平移不变性。作者在马来西亚半岛的两个大尺度高分辨率卫星图像上评估了该模型。本文的主要贡献如下:
- 提出了一种大规模、实时、跨区域的油棕树检测方法CROPTD;
- 使用一个局部域判别器和一个全局域判别器构造模型,引入局部注意力机制增强对目标的平移不变性;
- 在马来西亚半岛的两个大尺度高分辨率卫星图像上取得最高的检测精度。
CROPTD模型
本文提出的模型如上图所示。输入由标注过的源域(source domain)数据集$D_S$和未标注的目标域(target domain)数据集$D_T$组成。模型采用Faster RCNN结构,总损失函数包括局部迁移损失$L_l$、全局迁移损失$L_g$和目标检测损失$L_{fr}$:
\[Loss=L_{fr}-(\lambda L_l + \gamma L_g)\]局部迁移损失$L_l$是由局部域判别器$D_l$提供的。将卷积网络的浅层特征$M_l$(称之为局部特征)通过域判别器生成尺寸不变的域预测图$G_l$,通过交叉熵损失计算:
\[L_l = \frac{1}{nHW} \sum_{i=1}^{n} \sum_{h=1}^{H} \sum_{w=1}^{W} D_l(G_l(M_l),d_i)\]其中$d_i$表示域的类别,$d_i=0$表示目标域,$d_i=1$表示源域。额外引入局部注意力机制,改善浅层特征表达,使其具有更强的平移不变性。
全局迁移损失$L_g$是由全局域判别器$D_g$提供的。将backbone网络输出的特征$M_g$(称之为全局特征)通过域判别器生成域预测结果$G_g$,通过focal loss忽略容易分类的样本,更关注难以分类的样本,计算损失:
\[L_g = \frac{1}{n} \sum_{i=1}^{n} D_g(G_g(M_g),d_i)\]Experiments
实验采用马来西亚半岛的两个高分辨率卫星图像,图像A和图像B:
实验分为在图像A上训练,在图像B上测试和在图像B上训练,在图像A上测试两种情况,实验结果如下: