Training data-efficient image transformers & distillation through attention
DeiT:通过注意力蒸馏训练数据高效的视觉Transformer.
DeiT:通过注意力蒸馏训练数据高效的视觉Transformer.
在ImageNet-1k数据集上更好地训练视觉Transformer.
Vision Transformer.
使用Transformer实现可扩展的扩散模型.
位置预测作为高效的预训练策略.
CatBoost: unbiased boosting with categorical features.