iGPT:像素级的图像预训练模型.
Flooding:避免训练损失为0.
REALM:通过检索增强预训练语言模型.
OneNet:无需NMS的One-stage端到端目标检测方法.
隐式梯度正则化.
大批量分布式训练的线性缩放规则和warmup.