深度学习100问之提高深度学习模型训练效果(调参经验)
声明 1)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应。如果某部分不小心侵犯了大家的利益,还望海涵,并联系博主删除。 2)博主才疏学浅,文中如有不当之处,请各位指出,共同进步,谢谢。 3)此属于第一版本,若有错误,还需继续修正与增删。还望大家多多指点。大家都共享一点点,一起为祖国科研的推进添砖加瓦。 文章目录 声明 :zap: 0、前言 :art: 1、网络结构 :card_file_box: 2、数据 :rocket: 3、学习率 :wrench: 4、优化器 :tada: 5、初始化 :pencil: 6、训练轮数 :chart_with_upwards_trend: 7、dropout :heavy_plus_sign: 8、正则化 :goal_net: 9、预训练 :boom: 10、激活函数 :bento: 11、特征抽取 :recycle: 12、置乱训练数据 :dizzy: 13、批大小 :sparkles: 14、显卡 :rocket: 15、总结 ⚡️ 0、前言 最近在 炼丹 的时候验证病查找了一些提高深度学习网络模型训练效果的方法,和大家分享一下。 🎨 1、网络结构 首先我觉得最重要的就是确定你的大体网络结构,因为除了 CV 、 NLP 等主流方向,其他方向都是刚开始结合深度学习, 说好听点是创新点,说难听就是注水 。。