郑之杰的个人网站

Generative Pretraining from Pixels

iGPT：像素级的图像预训练模型.

Flooding：避免训练损失为0.

REALM：通过检索增强预训练语言模型.

OneNet：无需NMS的One-stage端到端目标检测方法.

隐式梯度正则化.

大批量分布式训练的线性缩放规则和warmup.