总结深度学习中主要的优化方法。
深度学习中优化方法
1. 梯度下降法
1.1 梯度下降算法变种
- Batch gradient descent BGD
- Stochastic gradient descent SGD
- Mini-batch gradient descent MBGD
1.2 梯度下降优化算法
- 指数加权平均(Exponentially weighted average)
- Momentum
- Nesterov Momentum
- Adagrad
-
RMSprop 未统一单位
-
Adadelta 统一单位
-
Adam
参考文献
- https://blog.csdn.net/u012328159/article/details/80311892
- https://blog.csdn.net/shuzfan/article/details/75675568
- https://zhuanlan.zhihu.com/p/31630368
- http://www.lunarnai.cn/2017/05/14/gradient-descent/