RAD:把数据增广方法应用到强化学习.

本文在进行借助视觉的强化学习时,引入了数据增广的方法,每次训练从replay buffer中抽取若干连续帧,对其应用10种数据增强方法:

作者通过实验发现,在DMControl500k for Walker任务控制小人行走时,crop操作对其提高最大:

通过绘制注意力图,crop主要关注小人的身体,希望它是竖直的。

本文所提出的方法是强化学习中的一般性方法,优点如下: