郑之杰的个人网站

Improve Vision Transformers Training by Suppressing Over-smoothing

通过抑制过度平滑改进视觉Transformer.

Twins：重新思考视觉Transformer中的空间注意力设计.

LV-ViT：使用标志标签更好地训练视觉Transformers.

CeiT：将卷积设计整合到视觉Transformers中.

CvT：向视觉Transformer中引入卷积.

MaskFormer：逐像素分类并不是语义分割所必需的.