监督学习
1 监督学习 利用一组带标签的数据, 学习 从输入到输出的映射 , 然后将这种映射关系应用到未知数据, 达到 分类 或者 回归 的目的 (1) 分类: 当输出是离散的, 学习任务为分类任务 输入: 一组有标签的训练数据(也叫观察和评估), 标签 表明了这些数据(观察)的所属类别, 图中"猫"和"狗"就是标签 输出: 分类模型根据这些训练数据, 训练自己的模型参数, 学习出一个适合这组数据的分类器, 当有新数据(非训练数据)需要进行类别判断, 就可以将这组数据作为输入送给学习好的 分类器 进行判断(得到标签) 训练集: 训练模型已经标注的数据, 用来建立模型发现规律 测试集: 已标注的数据, 只不过把标注隐藏了, 再送给训练好的模型, 比对结果与原来的标注, 评判该模型的学习能力 一般来说, 获得了一组标注好的数据, 70%当做训练集, 30%当做测试集 , 另外还有交叉验证法, 自助法来评估学习模型 评价标准 1) 准确率 所有预测对的 把正类预测成正类(TP) 把负类预测成负类(TN) 准确率 = (TP+TN)/总数量 2) 精确率 以二分类为例 预测为正的样本是真的正样本