Radam:修正Adam算法中自适应学习率的早期方差.
Nadam:将Nesterov动量引入Adam算法.
Hook mechanism in Pytorch.
AMSGrad:改进Adam算法的收敛性.
Adam:自适应矩估计.
Nesterov Momentum:一种动量梯度更新方法.