基本概念:
只关注类别这个变量,把一条条数据划分为不同的类
目标:根据已知类别的数据集,经过训练得到一个分类模型,再用模型对类别未知的数据进行分类。
过程思路:
1、准备数据集
- Iris植物分类数据集(scikit-learn库里内置的该数据集,可直接导入)
- 四个特征:sepal length、sepal width、petal length、petal width
- 三种类别:Iris Setosa、Iris Versicolour、Iris Virginica
- 这里分类的目的是根据植物的特征推测它的种类