机器学习——PCA练习

隐身守侯 提交于 2019-11-26 17:17:00

数据集

这里用到的数据集是鸢尾花数据集

题目要求

1. 导入必要的库
2. 加载sklearn库自带的鸢尾花数据集
3. 将数据集划分为样本特征和样本类型
4. 构建PCA实例,其中n_components设置为2
5. 传入数据给模型
6. 打印输出所保留的n个成分各自的方差百分比
7. 对花的颜色进行特征分组,分为:[‘navy’, ‘turquoise’, ‘darkorange’]
8. 循环打印输出结

代码如下

import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.decomposition import PCA

# 读取数据
data = load_iris()

# 分为X Y
X = data.data
Y = data.target

# 构建PCA类的实例
pca = PCA(n_components=2)
# 训练模型
model = pca.fit_transform(X)

# 打印输出所保留的n个成分各自的方差百分比
print(pca.explained_variance_ratio_)
# 画图
colors = ['navy', 'turquoise', 'darkorange']

plt.scatter(model[:, 0], model[:, 1], c=[colors[i] for i in Y])
plt.show()

效果展示

[ 0.92461621  0.05301557]

在这里插入图片描述

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!