郑之杰的个人网站

Radar-Based Human Activity Recognition With 1-D Dense Attention Network

1-D-DAN：为雷达光谱图设计一维密集注意力网络用于人类活动识别.

Lite-HRNet：轻量级高分辨率网络.

Switch Transformer：训练万亿级参数的语言模型.

A Records of the Fourth Phase of the Marvel Cinematic Universe (MCU).

预训练Transformer中的知识神经元.

Transformer全连接层是键值记忆单元.