郑之杰的个人网站

Transformers without Normalization

无归一化的Transformer.

大规模卷积多混合语言模型的系统与算法.

SigLIP 2：使用改进的语义理解、定位和密集特征的多模态视觉语言编码器.

大语言模型中的深度诅咒.

Unleash your imagination! Light circling the Earth.

GAN 已死；GAN 万岁！现代 GAN 基线.