学习率与动量的关系:此涨彼消,以达到动态平衡

核能气质少年 提交于 2020-01-09 23:04:43

选择适当大小的学习率和动量,太大会使loss振荡,太小不足以使loss达到最优值。

1、train_gluon_ch7(‘sgd’, {‘learning_rate’: 0.004, ‘momentum’: 0.99}, features, labels)
loss: 0.301315, 0.176527 sec per epoch
在这里插入图片描述
2、train_gluon_ch7(‘sgd’, {‘learning_rate’: 0.004, ‘momentum’: 0.95}, features, labels)
loss: 0.256159, 0.194480 sec per epoch
在这里插入图片描述
3、train_gluon_ch7(‘sgd’, {‘learning_rate’: 0.004, ‘momentum’: 0.9}, features, labels)
loss: 0.243600, 0.181515 sec per epoch
在这里插入图片描述
4、train_gluon_ch7(‘sgd’, {‘learning_rate’: 0.004, ‘momentum’: 0.8}, features, labels)
loss: 0.244236, 0.172539 sec per epoch
在这里插入图片描述
5、train_gluon_ch7(‘sgd’, {‘learning_rate’: 0.004, ‘momentum’: 0.5}, features, labels)
loss: 0.255883, 0.189493 sec per epoch
在这里插入图片描述
6、train_gluon_ch7(‘sgd’, {‘learning_rate’: 0.02, ‘momentum’: 0.8}, features, labels)
loss: 0.243856, 0.181516 sec per epoch
在这里插入图片描述
7、train_gluon_ch7(‘sgd’, {‘learning_rate’: 0.02, ‘momentum’: 0.5}, features, labels)
loss: 0.244130, 0.182513 sec per epoch
在这里插入图片描述
8、train_gluon_ch7(‘sgd’, {‘learning_rate’: 0.02, ‘momentum’: 0.45}, features, labels)
loss: 0.243134, 0.210438 sec per epoch
在这里插入图片描述
9、train_gluon_ch7(‘sgd’, {‘learning_rate’: 0.02, ‘momentum’: 0.4}, features, labels)
loss: 0.245365, 0.199467 sec per epoch
在这里插入图片描述
10、train_gluon_ch7(‘sgd’, {‘learning_rate’: 0.02, ‘momentum’: 0.2}, features, labels)
loss: 0.244297, 0.187498 sec per epoch
在这里插入图片描述
11、train_gluon_ch7(‘sgd’, {‘learning_rate’: 0.02, ‘momentum’: 0.1}, features, labels)
loss: 0.243998, 0.174533 sec per epoch
在这里插入图片描述

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!