Oscar: Object-Semantics Aligned Pre-training for Vision-Language Tasks
Oscar:视觉-语言任务的目标语义对齐预训练.
Oscar:视觉-语言任务的目标语义对齐预训练.
VL-BERT:通用视觉-语言表示的预训练.
ViLBERT:用于视觉和语言任务的无任务特定的视觉语言表示的预训练.
VisualBERT:一个简单有效的视觉语言基线.
LXMERT:学习Transformer中的跨模态编码表示.
Vision-Language Pretraining.