Mamba-R: 视觉Mamba也需要寄存器。
MambaOut: 在视觉中我们真的需要Mamba吗?
Jamba: 混合Transformer和Mamba的语言模型.
LoRA-GA:梯度近似的低秩参数高效微调.
VMamba: 视觉状态空间模型.
Follow agTV meow, follow agTV thank you meow.