逻辑回归分类算法
逻辑回归由于其简单、高效、可解释性强的特点,在实际用途中十分的广泛:从购物预测到用户营销响应,从流失分析到信用评价,都能看到其活跃的身影。可以说逻辑回归占据了分类算法中非常重要的地位。 逻辑回归:logistic regression,LR。模型公式是Logistic函数,也叫Sigmoid函数。 图像形如S型曲线。它可以将实数映射到[0,1]区间用来做二分类。 一般选择0.5作为阀值,大于阀值的归为类1,小于阀值的归为类0。 公式(Y为决策值,x为特征值,e为自然对数): 如果希望对正例样本有更高的准确率,则可以把阈值适当地调高,例如调高到0.6。 如果希望对正例样本有更高的召回率,则可以把阈值适当地降低,例如降低到0.4。 用python拟合了不同的自变量取值下,与因变量的成像。结果都是S型曲线,取值集中在0和1上。 1.自变量是线性连续值: x = np.arange(-20, 20, 0.1) y =1/( 1+math.e**(-x)) plt.scatter(x, y, c = 'r', marker = 'o') 2.自变量是一元三次方程式的取值: z = np.arange(-20, 20, 0.1) x = 2*z**3+4*z**2+3*z+10 y =1/( 1+math.e**(-x)) plt.scatter(x, y, c = 'r', marker =