Human motion recognition exploiting radar with stacked recurrent neural network

使用堆叠的循环神经网络进行雷达人体运动识别.

paper：Human motion recognition exploiting radar with stacked recurrent neural network
Digital Signal Processing：link

作者提出了一种使用雷达采集的人类运动时间序列进行人体运动识别的方法。该方法采用LSTM构成的stacked RNN提取序列特征，并进行自动运动分类。利用原始雷达数据的光谱图作为网络输入，利用时变多普勒(time-varying Doppler)信号和微多普勒(micro-Doppler)信号进行人体运动识别。雷达感知人体运动时的多普勒信号和微多普勒信号，多普勒信号是由人体躯干(torso)运动导致的频率改变产生的；微多普勒信号是由人体四肢产生的。

本文提出的模型如上图所示。网络由两层LSTM层叠加组成，网络的输入是雷达光谱图。由于光谱图的动态范围较高，预处理时进行了对数运算和归一化。网络使用具有多个LSTM层的堆叠RNN结构提取动态运动信号，输出层输出了每个运动类别的概率。

雷达选用Ancortek Software Defined Radio (SDR) 2500B kit，传输具有$25GHz$载波频率的连续波正弦信号，用于感知人类运动。数据集采集了六种人类运动：拳击、拍手、挥手、原地踏步、慢跑和步行。共采集$1200$个样本，每个样本包含$225$个时间帧，预处理光谱图的尺寸为$225×214$。

下图展示了六种运动对应的LSTM层输出和分类层输出的结果。第一层LSTM层输出显示网络提取的特征具有序列性，不同的运动具有不同的序列特征。第二层LSTM层输出结构更加清晰，并表现出时间不变性。LSTM的功能类似于编码器，能够将不同运动对应的输入信号编码为不同的特征，每种特征表示一个运动类型。而输出分类层的功能类似于解码器，将编码特征解释为运动类别。由于最初网络没有先前的运动信息，因此预测是错误的；在之后的时间帧网络便能做出正确的预测。

作者将LSTM网络的结果与深度卷积神经网络DCNN的结果进行比较，实验结果如下图。通过实验结果可以得出，DCNN的预测准确率更低，且对不同运动转换的响应时间更长，需要更多的内存。