Deformable DETR: Deformable Transformers for End-to-End Object Detection
Deformable DETR:使用多尺度可变形的注意力模块进行目标检测.
Deformable DETR:使用多尺度可变形的注意力模块进行目标检测.
ViT:使用图像块序列的Transformer进行图像分类.
iGPT:像素级的图像预训练模型.
Flooding:避免训练损失为0.
REALM:通过检索增强预训练语言模型.
OneNet:无需NMS的One-stage端到端目标检测方法.