郑之杰的个人网站

BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models

BLIP-2：使用冻结图像编码器和大语言模型的引导式语言-图像预训练.

BLIP：引导式语言-图像预训练实现统一的视觉-语言理解和生成.

GLIPv2：统一定位和视觉语言理解.

(Hebei Chapter) Baoding: Openning the Door to Capital.

Semiautomatic Image Annotation with Grounding DINO and Label Studio.

CoCa：对比描述器是图像文本基础模型.