Per-Pixel Classification is Not All You Need for Semantic Segmentation
MaskFormer:逐像素分类并不是语义分割所必需的.
MaskFormer:逐像素分类并不是语义分割所必需的.
PVT:一种无卷积密集预测的通用骨干.
Segmenter:为语义分割设计的视觉Transformer.
PiT:重新思考视觉Transformer的空间维度.
SegFormer:为语义分割设计的简单高效的Transformer模型.
TransUNet:用Transformer为医学图像分割构造强力编码器.