ViLBERT: Pretraining Task-Agnostic Visiolinguistic Representations for Vision-and-Language Tasks
ViLBERT:用于视觉和语言任务的无任务特定的视觉语言表示的预训练.
ViLBERT:用于视觉和语言任务的无任务特定的视觉语言表示的预训练.
VisualBERT:一个简单有效的视觉语言基线.
LXMERT:学习Transformer中的跨模态编码表示.
Vision-Language Pretraining.
分析和改进扩散模型的训练动力学.
(Heilongjiang Chapter) Harbin: Ice and Snow World.