小批量梯度下降算法

小批量梯度下降算法

动量法

利用累加历史梯度信息更新梯度
动量法

自适应梯度法

自适应梯度法通过减小震荡方向步长,增大平坦方向步长来减小震荡,加速通往谷底方向。

如何区分震荡方向与平坦方向?
回答:梯度幅度的平方较大的方向是震荡方向;

RMSProp算法

Adam算法

同时使用动量与自适应梯度思想
Adam

[注]参考于北京邮电大学计算机学院 鲁鹏老师