Jamba: A Hybrid Transformer-Mamba Language Model
Jamba: 混合Transformer和Mamba的语言模型.
Jamba: 混合Transformer和Mamba的语言模型.
LoRA-GA:梯度近似的低秩参数高效微调.
VMamba: 视觉状态空间模型.
Follow agTV meow, follow agTV thank you meow.
Vision Mamba: 使用双向状态空间模型实现高效视觉表示学习.
MoE-Mamba: 通过混合专家实现高效选择状态空间模型.