PixArt-Σ: Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation
PixArt-Σ:4K文本到图像生成的扩散Transformer的由弱到强的训练.
PixArt-Σ:4K文本到图像生成的扩散Transformer的由弱到强的训练.
OmniCount:具有语义几何先验的多标签目标计数.
InstanceDiffusion:图像生成的实例级控制.
LayoutDiffuse:调整基础扩散模型实现布局到图像生成.
向文本到图像扩散模型添加条件控制.
ReCo: 区域控制的文本到图像生成.