Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality
Transformer是状态空间模型: 通过结构化状态空间对偶实现通用模型和高效算法。
Transformer是状态空间模型: 通过结构化状态空间对偶实现通用模型和高效算法。
Mamba-R: 视觉Mamba也需要寄存器。
MambaOut: 在视觉中我们真的需要Mamba吗?
Jamba: 混合Transformer和Mamba的语言模型.
LoRA-GA:梯度近似的低秩参数高效微调.
VMamba: 视觉状态空间模型.