郑之杰的个人网站

Per-Pixel Classification is Not All You Need for Semantic Segmentation

MaskFormer：逐像素分类并不是语义分割所必需的.

PVT：一种无卷积密集预测的通用骨干.

Segmenter：为语义分割设计的视觉Transformer.

PiT：重新思考视觉Transformer的空间维度.

SegFormer：为语义分割设计的简单高效的Transformer模型.

TransUNet：用Transformer为医学图像分割构造强力编码器.