郑之杰的个人网站

Beyond Self-attention: External Attention using Two Linear Layers for Visual Tasks

External Attention: 使用两个外部记忆单元的注意力机制.

使用Mitchell近似构造加法神经网络.

ResMLP：数据高效训练的全连接图像分类网络.

使用全连接层替换ViT中的自注意力层.

MLP-Mixer：一种全连接层结构的视觉模型.

FlatNCE: 避免浮点数误差的小批量对比学习损失函数.