TAPAS: Weakly Supervised Table Parsing via Pre-training

用BERT解决表格问答任务.

Jukebox: A Generative Model for Music

使用VQ-VAE(向量量化的变分自编码器)进行音乐生成.

Do ImageNet Classifiers Generalize to ImageNet?

一篇讨论图像分类模型泛化能力的文章.

Group Normalization

深度学习中的组归一化方法.

Weight Standardization

深度学习中的权重标准化方法.

mixup: Beyond Empirical Risk Minimization

mixup:样本对插值的经验风险最小化.