mm-Pose:用毫米波雷达进行实时人体姿态估计.

作者提出了mm-Pose,一套利用77GHz毫米波雷达实时检测和跟踪人体姿态骨骼的系统。

1. 毫米波雷达信号的表示

雷达本质上是一种飞行时间传感器(time-of-flight sensor),它发射射频信号(RF signal),根据接收到的反射信号的相位计算时延(time delay),并估计反射点的距离。

作者使用77GHz毫米波雷达,带宽为$3-4GHz$,能够对人体进行高分辨率成像,获得深度(depth)、方位(azimuth)和高度(elevation)的三维数据立方体。这个立方体的维度比较大,直接处理会引入较大的计算量。假设对一个$5m \times 5m \times 5m$的空间成像,成像分辨率为$5cm$,则共有$100 \times 100 \times 100$个像素点。

作者并有直接使用三维数据立方体,而是构造了新的信号表示。假设雷达具有$256$个反射点,将这些反射点投影到深度-方位平面和深度-高度平面,并将两个坐标值和归一化的反射功率作为通道信息,构造两个维度为$16 \times 16 \times 3$的向量。如果雷达的反射点不足$256$个,则剩余像素赋值为$(0,0,0)$。通过这种数据表示大大减少了卷积神经网络的运算量和复杂度。

2. 卷积神经网络结构

作者提出了具有两个分支的卷积神经网络,分别接收之前提到的两个方向的投影数据。网络输出$25$个空间坐标,对应人体的$25$个关节点。

作者使用Texas Instruments AWR 1642雷达采集射频信号,使用Microsoft Kinect收集人体的三维坐标信息作为标签。