模型评估指标
0. 前言 模型的评价指标和评价体系是建模过程中的一个重要环节,针对不同类型的项目和模型,要合理选择不同的评价指标和体系。下面先给出二分类模型中预测值和实际值的混淆矩阵(confusion matrix)和定义,然后介绍几种评价指标。 二分类模型的预测值与实际值的结果 TP(True Positive):模型预测为正例(1),实际为正例(1)的观察对象的数量。 TN(True Negative):模型预测为负例(0),实际为负例(0)的观察对象的数量。 FP(False Positive):模型预测为正例(1),实际为负例(0)的观察对象的数量。 FN(False Negative):模型预测为负例(0),实际为正例(1)的观察对象的数量。 1. 正确率(Accuracy) $$ accuracy = \frac{TP + TN}{TP + FN + TN + FP} $$ 正确率和错误率是相对的两个概念,通常我们把分类错误的样本数占样本总数的比例称为错误率(error rate)。 2. 敏感度(Sensitivity)和 特异度(Specificity) $$ Sensitivity = \frac{TP}{TP + FN} $$ $$ Specificity = \frac{TN}{TN + FP} $$ 3. 查全率(Recall)、查准率(Precision)与F1