RAD:把数据增广方法应用到强化学习.
- TAPAS: Reinforcement Learning with Augmented Data
- arXiv:link
本文在进行借助视觉的强化学习时,引入了数据增广的方法,每次训练从replay buffer中抽取若干连续帧,对其应用10种数据增强方法:
作者通过实验发现,在DMControl500k for Walker任务控制小人行走时,crop操作对其提高最大:
通过绘制注意力图,crop主要关注小人的身体,希望它是竖直的。
本文所提出的方法是强化学习中的一般性方法,优点如下:
- improve the data-efficiency of RL methods
- improve the generalization of RL methods