过拟合:常见原因是特征维度过多 解决方法:减少特征维度,比如通过正则化,达到降低参数值的目的,等价于降维 L1正则化比L2正则化更容易产生稀疏参数值 L1的罚项为1次函数,其偏导是常数,所以梯度下降时是稳定靠近最优值 L2的罚项为2次函数,其偏导在最优值附近越来越小,所以梯度下降时越靠近最优值,收敛得越慢 相比之下L1更容易稀疏 来源:CSDN作者:厉害了我的汤链接:https://blog.csdn.net/YD_2016/article/details/104036810 标签 正则化