监督学习 | 易学教程

监督学习算法模型评估实例(sklearn版)

阅读更多关于监督学习算法模型评估实例(sklearn版)

sklearn机器学习包中的模型评估指标都在包 sklearn.metrics 下；链接地址：https://scikit-learn.org/stable/modules/classes.html?highlight=metrics#module-sklearn.metrics 这里我们选择几个常用的指标进行展示，sklearn的版本为0.22.1。混淆矩阵（confusion_matrix）函数原型为： sklearn . metrics . confusion_matrix ( y_true , y_pred , labels = None , sample_weight = None , normalize = None ) 详情链接：https://scikit-learn.org/stable/modules/generated/sklearn.metrics.confusion_matrix.html#sklearn.metrics.confusion_matrix Examples >> > from sklearn . metrics import confusion_matrix >> > y_true = [ 2 , 0 , 2 , 2 , 0 , 1 ] >> > y_pred = [ 0 , 0 , 2 , 2 , 0 , 2 ] >> >

Python3玩转儿机器学习（3）

阅读更多关于 Python3玩转儿机器学习（3）

机器学习算法可以分为：监督学习非监督学习半监督学习增强学习监督学习：给机器的训练数据拥有“标记”或者“答案”，例如：我们需要告诉机器左边的画面是一只狗，而右边的照片是一只猫。同理对于MNIST数据集，给机器图像信息后还应该附上标记信息，如图所示：运用监督学习的场景举例：图像已经拥有了标定信息银行已经积累了一定的客户信息和他们信用卡的实用信息医院已经积累了一定的病人信息和他们最终确诊是否患病的情况市场积累了房屋的基本信息和最终成交的金额 ...... 此课程中学习的大部分算法属于监督学习算法 K近邻线性回归和多项式回归逻辑回归 SVM 决策树和随机森林非监督学习：给机器训练数据没有任何“标记”或者“答案” 聚类分析：对没有“标记”的数据进行分类非监督学习一个非常重要的作用就是对数据进行降维处理。特征提取：信用卡的信用评级和人的胖瘦无关？无关的特征丢掉特征压缩：PCA 降维处理的意义：方便可视化非监督学习还可以进行异常检测如图所示：图中两个红点明显与其他点脱离，如果它们同属与一种数据，我们可以将这两个点归类为异常，将其去除。当突然图中为二维点，在高维中我们会使用相应的算法剔除异常数据。半监督学习：一部分数据有“标记”或者“答案”，另一部分没有相对监督学习，更常见的是各种原因产生的标记缺失的半监督学习。

【华为云技术分享】【Python算法】分类与预测——决策树

阅读更多关于【华为云技术分享】【Python算法】分类与预测——决策树

1.决策树定义决策树方法在分类、预测、规则提取等领域有着广泛的应用。20 世纪 70 年代后期和 80 年代初期，机器学习研究者 J.Ross Quinlan 提出了 ID3 算法以后，决策树就在机器学习与数据挖掘领域取得了巨大的发展。Quinlan 后来又提出了 C4.5，这成为了新的监督学习算法。1984年，几位统计学专家提出了 CART 分类算法。ID3 和 CART 算法几乎同时被提出，但都是采用的类似的方法从训练样本中学习决策树。决策树是一种树状结构，它的每个叶节点对应一个分类，非叶节点对应着在某个属性上的划分，根据样本在该属性上的不同值将其划分成若干个子集，而对于非纯的叶节点，多数类的标号给出到达这个节点的样本所属的类。构造决策树的核心的问题是在每一步中如何选择适当的属性对样本进行拆分。对一个分类问题，从已知类标记的训练样本中学习并构造出决策树其实是一个自上而下，分而治之的过程。 2.常用决策树算法常用的决策树算法有三种，分别是 ID3 算法、C4.5 算法、CART 算法三种。　　(1) ID3 算法：此算法的核心在于决策树的各级节点上，使用信息增益方法作为属性的选择标准，来帮助确定生成每个节点时所应采取的合适属性；　　(2) C4.5 算法：此决策树生成算法相对于 ID3 算法的重要改进是使用信息增益率来选择节点属性，此算法可以克服ID3算法的不足

马里奥AI实现方式探索 ——神经网络+增强学习

阅读更多关于马里奥AI实现方式探索 ——神经网络+增强学习

目录马里奥AI实现方式探索 ——神经网络+增强学习神经网络 M-P模型早期神经网络深度神经网络总结增强学习马尔可夫决策过程（MDP）基于NEAT算法的马里奥AI实现基于Deep Reinforcement Learning的马里奥AI实现总结马里奥AI实现方式探索 ——神经网络+增强学习儿时我们都曾有过一个经典游戏的体验，就是马里奥（顶蘑菇^v^），这次里约奥运会闭幕式，日本作为2020年东京奥运会的东道主，安倍最后也已经典的马里奥形象出现。平时我们都是人来玩马里奥游戏，能否可以让马里奥智能的自己闯关个呢？OK，利用人工智能的相关算法来进行自动化通关一直是一个热门的话题，最近最火的相关东东就是传说中的alphaGo啦。而在游戏的自动化测试当中，这种算法也是非常实用的，可以大量的减少测试人力成本。首先，对于实现马里奥AI当中涉及到的神经网络和增强学习的相关概念进行整理，之后对智能通关的两种方式进行阐述。（本人才疏学浅，在神经网络和增强学习方面基本门外汉，如有任何纰漏，还请大神指出，我会第一时间改正。）神经网络像飞机的灵感来源于鸟类，雷达的灵感来源于蝙蝠，红外线的灵盖来源于蛇，而本文要讨论的神经网络灵感来源于我们自己，人类大脑的神经元结构。从神经元结构被提出，到时下火热的无以复加的深度神经网络，发展过程也可为一波三折。我们按照时间的顺序

深度学习应用开发5.1监督学习的基本术语

阅读更多关于深度学习应用开发5.1监督学习的基本术语

文章目录 1样本特征 2训练与损失 3模型训练降低损失 3.1模型训练的迭代损失 3.2计算损失函数 4梯度下降法 5学习率和超参数 5.1学习率 5.2超参数 1样本特征简单线性回归案例 y=w*x+b 2训练与损失损失可以发现左边损失大，右边小，右侧模型比较好右边的比较大 3模型训练降低损失 3.1模型训练的迭代损失初始值取多少意义不大的，就像图像识别初始矩阵都取很小的值 3.2计算损失函数 4梯度下降法一般来说w会随机取一个，这需要一个方法就是梯度下降法。以一个最快的方向下山，在这里取梯度梯度的概念是一个向量，表示某一函数该点处的方向导数沿着该方向取最大值，即函数在该点处沿着该方向（此梯度方向）变化最快变化率最高。下一个权重值通过负梯度进行下一步搜索 5学习率和超参数 5.1学习率 5.2超参数来源： CSDN 作者： #楚歌链接： https://blog.csdn.net/weixin_39289876/article/details/104534890

5.1_非监督学习之sckit-learn

阅读更多关于 5.1_非监督学习之sckit-learn

非监督学习之k-means K-means通常被称为劳埃德算法，这在数据聚类中是最经典的，也是相对容易理解的模型。算法执行的过程分为4个阶段。 1.首先，随机设K个特征空间内的点作为初始的聚类中心。 2.然后，对于根据每个数据的特征向量，从K个聚类中心中寻找距离最近的一个，并且把该数据标记为这个聚类中心。 3.接着，在所有的数据都被标记过聚类中心之后，根据这些数据新分配的类簇，通过取分配给每个先前质心的所有样本的平均值来创建新的质心重,新对K个聚类中心做计算。 4.最后，计算旧和新质心之间的差异,如果所有的数据点从属的聚类中心与上一次的分配的类簇没有变化，那么迭代就可以停止，否则回到步骤2继续循环。 K均值等于具有小的全对称协方差矩阵的期望最大化算法 sklearn.cluster.KMeans class sklearn.cluster.KMeans(n_clusters=8, init='k-means++', n_init=10, max_iter=300, tol=0.0001, precompute_distances='auto', verbose=0, random_state=None, copy_x=True, n_jobs=1, algorithm='auto') """ :param n_clusters:要形成的聚类数以及生成的质心数 :param init

非监督学习

阅读更多关于非监督学习

非监督学习从本节开始，将正式进入到无监督学习（Unsupervised Learning）部分。无监督学习，顾名思义，就是不受监督的学习，一种自由的学习方式。该学习方式不需要先验知识进行指导，而是不断地自我认知，自我巩固，最后进行自我归纳，在机器学习中，无监督学习可以被简单理解为不为训练集提供对应的类别标识（label），其与有监督学习的对比如下：有监督学习（Supervised Learning）下的训练集： (x(1),y(1)),(x(2),y2)(x(1),y(1)),(x(2),y2) 无监督学习（Unsupervised Learning）下的训练集： (x(1)),(x(2)),(x(3))(x(1)),(x(2)),(x(3)) 在有监督学习中，我们把对样本进行分类的过程称之为分类（Classification），而在无监督学习中，我们将物体被划分到不同集合的过程称之为聚类（Clustering）来源： https://www.cnblogs.com/alexzhang92/p/10070279.html

机器学习概览

阅读更多关于机器学习概览

什么是机器学习？广义概念：机器学习是让计算机具有学习的能力，无需明确的编程 —— 亚瑟·萨缪尔，1959 工程概念：计算机程序利用经验 E 学习任务 T，性能是 P，如果针对任务 T 的性能 P 随着经验 E 不断增长，则称为机器学习。 —— 汤姆·米切尔，1997 机器学习系统的类型机器学习有多种类型，可以根据以下规则进行分类：是否在人类监督下进行训练（监督、非监督、半监督和强化学习）是否可以动态渐进学习（在线学习和批量学习）它们是否只是简单的通过比较新的数据点和已知的数据点，还是在训练数据中进行模式识别，以建立一个预测模型，就像科学家所做的那样（基于实力学习和基于模型学习）监督/非监督学习机器学习可以根据训练时监督的量和类型进行分类。主要有四类：监督、非监督、半监督和强化学习监督学习在监督学习中，用来训练算法的训练数据包含了答案，称为标签。图 1 用于监督学习（比如垃圾邮件分类）的加了标签的训练集一个典型的监督学习就是分类，垃圾邮件过滤器就是一个很好的例子：用很多带有归类（垃圾邮件和普通邮件）的邮件样本进行训练，过滤器还能用新邮件进行分类。另一个典型数值是预测目标数值，例如给出一些特征（里程数、车程、品牌等等）称为预测值，来预测一辆汽车的价格。这类任务称为回归，要训练在这个系统，你需要给出大量汽车样本，包括它们的预测值和标签（即它们的价格）图2

机器学习（六）监督学习简介

阅读更多关于机器学习（六）监督学习简介

一.监督学习利用一组带有标签的数据，学习从输入到输出的映射，然后将这种映射关系应用到未知数据上，达到分类或回归的目的。分类：当输出是离散的，学习任务为分类任务。回归：当输出是连续的，学习任务为回归任务。二.分类学习输入：一组有标签的训练数据(也称观察和评估)，标签表明了这些数据（观察）的所署类别。输出：分类模型根据这些训练数据，训练自己的模型参数，学习出一个适合这组数据的分类器，当有新数据（非训练数据）需要进行类别判断，就可以将这组新数据作为输入送给学好的分类器进行判断。（1）分类学习--评价 • 训练集(training set):顾名思义用来训练模型的已标注数据，用来建立模型，发现规律。 • 测试集(testing set):也是已标注数据，通常做法是将标注隐藏，输送给训练好的模型，通过结果与真实标注进行对比，评估模型的学习能力。训练集/测试集的划分方法：根据已有标注数据，随机选出一部分数据（70%）数据作为训练数据，余下的作为测试数据，此外还有交叉验证法，自助法用来评估分类模型。（2）分类学习的评价标准精确率：精确率是针对我们预测结果而言的，（以二分类为例）它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了，一种就是把正类预测为正类(TP)，另一种就是把负类预测为正类(FP)，也就是召回率：是针对我们原来的样本而言的

Unsupervised Cross-Dataset Person Re-Identification by Transfer Learning of Spatial-Temporal Pattern

阅读更多关于 Unsupervised Cross-Dataset Person Re-Identification by Transfer Learning of Spatial-Temporal Pattern

Unsupervised Cross-Dataset Person Re-Identification by Transfer Learning of Spatial-Temporal Patterns （2018）阅读笔记对于无监督学习，华南大学吕建明、杨灿等人提出了基于时空模型无监督迁移学习的行人重识别，解决的目标是跨数据集的Person Reid。方法是多模态数据融合+迁移学习（CVPR 2018） Introduce 多数所提出的人员重新识别算法都对单标签数据集进行了有监督的训练和测试，因此，将这些训练后的模型直接部署到大规模的现实世界相机网络可能会因拟合不足而导致性能不佳。通过使用从目标域收集的大量未标记数据来逐步优化模型具有挑战性。为了解决这一挑战，文章提出了一种无监督的增量学习算法TFusion，该方法通过目标域内行人时空模式的迁移学习来实现。 Contribution 1.提出了一种新颖的方法，通过迁移源数据集中的视觉分类器来学习未标记目标数据集中行人的时空格局。该算法不需要有关相机空间分布的任何先验知识，也不需要有关人们在目标环境中如何移动的任何假设。 2.提出一种贝叶斯融合模型，该模型将学习的时空模式和视觉特征相结合，以在未标记的目标数据集中实现高性能的行人Re-ID。 3.提出了一种基于学习排名的相互促进程序

订阅监督学习