机器学习的四个分支

此生再无相见时 提交于 2019-12-19 15:04:09

机器学习是非常宽泛的领域,其子领域的划分非常复杂。机器学习算法大致可分为四大类:

1)监督学习

2)无监督学习

3)自监督学习

4)强化学习

一、监督学习

       监督学习是最常见的机器学习类型。给定一组样本(通常由人工标注),它可以学会将输入数据映射到已知目标【也叫作标注(annotation)】。

       近年来广受关注的深度学习几乎都属于监督学习,如,光学字符识别,语音识别、图像分类和语言翻译。

       监督学习主要包括分类和回归,还有很多奇特的辩题,主要包括如下几种:

1)序列生成(sequence generation)。给定一张图像,预测描述图像的文字。序列生成又是可以被重新表示为一些列分类问题,比如反复预测序列中的单词或标记。

2)语法树预测(syntax tree prediction)。给定一个橘子,预测其分解生成的语法树。

3)目标检测(object detection)。给定一个张图片,在图中特定目标的周围画一个边界框。这个问题也可以表示为分类问题(给定多个候选边界框,对每个框内的目标进行分类)或分类与回归联合问题(用向量回归来预测边界框的坐标)。

4)图像分割(image segmentation)。给定一张图像,在特定物体上画一个像素级的掩模(mask).

二、无监督学习

        无监督是指在没有目标的情况下寻找输入数据的有趣变换,其目的在于数据可视化、数据压缩、数据去噪或更好的理解数据中的相关性。无监督学习是数据分析的必备技能,在解决监督学习问题之前,为了更好地了解数据集,它通常是一个必要步骤。降维(dimensionality reduction)聚类(clusting)都是众所周知的无监督学习方法。

三、自监督学习

        自监督学习是监督学习的一个特例,但它与众不同,值得单独归为一类。自监督学习是没有人工标注的标签的监督学习,可以看做没有人类参与的监督学习。标签仍然存在,但是它们是从数据中生成的,通常是使用启发式算法生成的

         例如,

1)自编码器(autoencoder)就是自监督学习。其生成的目标就是未经修改的输入。

2)给定视频中过去的帧来预测下一帧

3)给定文本中前面的词来预测下一个词

PS:例2、例3也属于时序监督学习(temporally supervised learning),即用未来的输入数据作为监督。

注意:监督学习、无监督学习和自监督学习之间的区别有时很模糊。

四、强化学习

        在强化学习中,智能体(agent)接受有关环境的信息,并学会选择使某种奖励最大化的行动。

        例如,神经网络会“观察”视频游戏的屏幕并输出游戏操作,目的是尽可能的高分,这种神经网络可以通过强化学习来训练。

        目前,强化学习主要集中在研究领域,出游戏外还没有取得实践上重大成功。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!