郑之杰的个人网站

SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers

SegFormer：为语义分割设计的简单高效的Transformer模型.

TransUNet：用Transformer为医学图像分割构造强力编码器.

用Transformer从序列到序列的角度重新思考语义分割.

CrossViT：图像分类的交叉注意力多尺度视觉Transformer.

视觉Transformer真的需要显式位置编码吗？

VT：基于Token的图像表示和处理.