监督学习
如果以一把枪来比喻,监督学习就是半自动步枪,从字面意义上我们就不难看出,它是需要人类去教机器怎么做事情。
定义:根据已有的数据集,知道输入和输出结果之间的关系。根据这种已知的关系,训练得到一个最优的模型。
也就是说,在监督学习中训练数据既有特征又有标签,通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签。
说简单一点就是我们赋予机器一个逻辑,并且对于标签和特征进行函数或者代码关联,比如我们家的橘猫代表肥胖,橘色性状与肥胖相关联,我们赋予他们特征和标签,标签就是橘色,特征是肥胖。那么双方挂钩,知道肥胖,就会想到橘猫,也就是知道特征就会牵扯到标签。
监督学习中的回归
从数学上分析,回归的进程是连续不断的变量,我认为这是里面最有意思的一点
回归最简单的例子就是把所有涵盖的标签通过函数找到最好的途径展现在我们面前,经济增长就是最简单的例子,我画了一张图,以理解回归的含义。
下图(图为手画请见谅)是小明在四个月内的开支,他的开支数据是通过标签或者说点的方式表现,而回归则是将这些点以直线或者曲线数学模型来呈现出来,就是普通的二阶函数或者数据集画线。
监督学习中的分类
分类不难理解,分类就是在特征和标签的基础上进行归类,一类一类将其特征和标签分组以待后面进行计算,因为机器都是二进制,比如公猫和母猫,1代表公猫,0代表母猫,一共有十只猫,那么我们就可以赋予机器算法,公猫有6只,母猫有4只,并产生以下模型。
这就是分类
非(无)监督学习
这个我们依旧拿枪械进行比喻,这就是全自动步枪,还有不成熟的表现存在。
定义: 我们不知道数据集中数据、特征之间的关系,而是要根据聚类或一定的模型得到数据之间的关系。
换句话说比起监督学习,无监督学习更像是自学,让机器学会自己做事情,是没有标签,监督和非监督,无非都在标签上做文章、
就像考试,监督学习是你已经知道答案的,就是一些已经制定好的逻辑,所有工作都是按照已经制定好的逻辑来走,而非监督学习没有答案,随机应变,就像在做情景判断题,让你通过已知的标签来推断未知的事物,不管对不对,我都可以很好的知道其联系所在,并分类,最简单的例子就是聚类算法,物以类聚,人以群分。
聚类算法就是将事物通过类似特征统一为同一个标签,我们将大自然的其他生命通过特征和特定的基因组进行归类,并给他们起了自己的组名。
比如,猫和大象之间,我们如何分类为这两个标签,通过特征,猫和大象在识别中通过体型,颜色,外观等等,我们很容易分类出来两个标签,聚类算法就是机器自动进行识别特征并分类的算法,也就是非(无)监督学习的一部分,也是重要特征。
来源:https://www.cnblogs.com/tgr12345/p/12040878.html