iris

sklearn数据获取与预处理

牧云@^-^@ 提交于 2019-11-28 13:01:41
sklearn Key_Word sklearn, datasets , DataFrame, load_* preprocessing , MinMaxScaler , scaler, fit , transform , data, target sklearn数据获取 # In[1]: import sklearn # In[2]: sklearn.__version__ # In[6]: import numpy as np import pandas as pd import matplotlib.pyplot as plt get_ipython().run_line_magic('matplotlib', 'inline') #在jupyter中可视化的展示图形 from sklearn import datasets #从sklearn导入数据集 iris = datasets.load_iris() # In[10]: iris iris.data iris['target'] # In[17]: # 利用dataframe做简单的可视化分析 df = pd.DataFrame(iris.data, columns = iris.feature_names) # 是一个表格 df['target'] = iris.target # 表头字段就是key df.plot

决策树python sklearn 示例

本小妞迷上赌 提交于 2019-11-28 11:30:28
本文主要是使用python sklearn,完成决策树的demo,以及可视化,最终生成的决策树结果。 from sklearn.datasets import load_iris from sklearn import tree from sklearn.tree import export_graphviz import subprocess def visualize_tree (tree, feature_name, dot_file) : """Create tree png using graphviz. tree -- scikit-learn DecsisionTree. feature_names -- list of feature names. dot_file -- dot file name and path """ with open( "tree.dot" , 'w' ) as f: export_graphviz(tree, out_file=f, feature_names=feature_name) dt_png = "dt.png" command = [ "dot" , "-Tpng" , dot_file, "-o" , dt_png] try : subprocess.check_call(command) except Exception

sklearn朴素贝叶斯分类

倖福魔咒の 提交于 2019-11-28 09:18:24
from sklearn import datasets from sklearn.naive_bayes import GaussianNB #导入数据集中的鸢尾花数据(每项有4个特征数据值,1个目标类别值) iris=datasets.load_iris() #X为特征数据 y是类别值 X=iris.data y=iris.target #总数据条数 遍历显示 icount=X.shape[0] for i in range(icount-1): print(X[i],"--->",y[i]) #调用高斯朴素贝叶斯分类器 gnb=GaussianNB() #填入数据进行训练 gnb.fit(X,y) #训练完后预测(此处用的测试数据是训练数据同一份,实际可以用新输入数据) test_data=iris.data y_predicted=gnb.predict(test_data) #显示预测结果 print("\n预测结果:\n",y_predicted) #显示预测错误率 print("\n总数据%d条 预测失误%d条"%(iris.data.shape[0],(iris.target!=y_predicted).sum())) 来源: CSDN 作者: 一粒马豆 链接: https://blog.csdn.net/MAILLIBIN/article/details

sklearn之朴素贝叶斯实战

喜夏-厌秋 提交于 2019-11-28 09:17:25
朴素贝叶斯之多项式模型 MultinomialNB 实现了数据服从多项式分布时的贝叶斯算法。 import numpy as np #随机产生0-4之间的整数,产六组,一组100个 x = np .random .randint ( 5 , size=( 6 , 10 )) y = np .array ([ 1 , 2 , 3 , 4 , 5 , 6 ]) from sklearn .naive _bayes import MultinomialNB mnb = MultinomialNB() ; mub_model = mnb .fit ( x , y ) print(mub_model .predict ( x [ 2 : 3 ])) 结果: [ 3 ] 朴素贝叶斯之高斯模型 GaussianNB 实现了朴素贝叶斯的高斯模型( Gaussian Naive Bayes )的分类算法。 from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB () gnb_model = gnb.fit(iris. data , iris.target) y_pred = gnb_model.predict(iris.

学习sklearn朴素贝叶斯

爷,独闯天下 提交于 2019-11-28 09:09:33
不同的贝叶斯假设数据的分布不同。 暂时全部使用默认参数 高斯朴素贝叶斯 """ 多项式朴素贝叶斯分类器适用于具有离散特征的分类(例如,用于文本分类的字数)。 多项分布通常需要整数特征计数。然而,在实践中,诸如tf-idf的分数计数也可以起作用。 """ from sklearn import datasets iris = datasets . load_iris ( ) from sklearn . naive_bayes import GaussianNB gnb = GaussianNB ( ) gnb . fit ( iris . data , iris . target ) y_pred = gnb . predict ( iris . data ) print ( 'number of mislabeled points out of a total %d points : %d' % ( iris . data . shape [ 0 ] , ( iris . target != y_pred ) . sum ( ) ) ) gnb . score ( iris . data , iris . target ) gnb . get_params ( ) number of mislabeled points out of a total 150 points : 6

Windows 好用的护眼软件

一世执手 提交于 2019-11-28 08:28:26
1. 按 win10自带的有一个夜灯模式,效果还可以接受,但有一款更加专业的软件 Iris ,这里分享给大家的是 Iris Pro v1.1.9 绿色破解版 2. Iris Pro接受 Iris Pro 是一款专业的防蓝光护眼软件,通过调整屏幕蓝光辐射量来减少蓝光对您眼睛的伤害,例如:白天您可以把蓝光减到70,晚上减到50。当然,这些数值是可以自行调节的,每个人能接收的范围也不一样。而且软件无广告,无流氓行为,简单、小巧、清爽,即便您使用的是护眼显示器也同样需要它。日常工作生活中由于我们长时间的使用电脑偶尔会出现眼酸、眼涩、发红发胀……等症状,甚至会导致视网膜的损伤,造成无法修复的严重后果,所以使用电脑或长时间看屏幕的朋友一定要注意保护眼睛哦!嗯嗯~~那就试试这款专业的防蓝光护眼神器 —— Iris Pro 吧! 官方网站: iristech.co 使用电脑,免不了要受到蓝光等对眼睛的伤害,如何尽可能地降低蓝光带来的危害,保护用眼视力就成了我们需要考虑的问题。Iris Pro 能够帮您降低蓝光对眼睛刺激造成的疲劳和伤害,并改善您的睡眠,经常使用电脑的您可以试试。 2.1. 保护用眼,改善睡眠 Iris Pro 能够通过控制屏幕的显示亮度,并根据场景为您选择合适的屏幕色彩进行显示,降低您在长期使用电脑时会造成的疲劳感,减少眼部疼痛。通过调节蓝光在白天和晚间的不同显示,Iris Pro

sklearn简单knn运用

孤街浪徒 提交于 2019-11-28 06:21:24
Sklearn 本身就有很多数据库,可以用来练习。 以 Iris 的数据为例,这种花有四个属性,花瓣的长宽,茎的长宽,根据这些属性把花分为三类。 我们要用 分类器 去把四种类型的花分开。 今天用 KNN classifier,就是选择几个临近点,综合它们做个平均来作为预测值。 (1) 导入模块 from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier (2) 创建数据 加载 iris 的数据,把属性存在 X,类别标签存在 y: iris = datasets.load_iris() iris_X = iris.data iris_y = iris.target 观察一下数据集,X 有四个属性,y 有 0,1,2 三类: print(iris_X[:2, :]) print(iris_y) """ [[ 5.1 3.5 1.4 0.2] [ 4.9 3. 1.4 0.2]] [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1

13,SKlearn实现KNN算法,约会网站与鸢尾花数据集

℡╲_俬逩灬. 提交于 2019-11-28 06:19:42
import numpy as np import matplotlib.pyplot as plt #约会网站测试数据的分别表示1.每年飞行的里程数,2.玩游戏和看视频占的时间的比,3.每周消费冰淇淋的公升数 raw_data_X=[[54483,6.317292,0.018209], [18475,12.664194,0.595653], [33926,2.906644,0.581657], [43865,2.388241,0.913938], [26547,6.024471,0.486215], [44404,7.226764,1.255329], [16674,4.183997,1.275290], [8123,11.850211,1.096981], [42747,11.661797,1.167935]] #样本标签中1表示不喜欢,2表示魅力一般,3表示极具魅力 raw_data_y=[1,3,1,1,3,3,2,3,3] X_train=np.array(raw_data_X) y_train=np.array(raw_data_y) x=np.array([56054,3.574967,0.494666]) from sklearn.neighbors import KNeighborsClassifier #导入sklearn的相应的模块 kNN

基于sklearn实现kNN

落爺英雄遲暮 提交于 2019-11-28 06:16:47
春节前的一篇文章给大家介绍了kNN算法,算法有助于大家理解运行机制,方便对参数调优。成熟的算法,自然已经有现成的模块可以使用。 scikit-learn包是Python的一个机器学习组件,其中实现了kNN,支持向量机,k均值聚类等一系列机器学习算法。 安装scikit-learn包需要下面三个命令: pip/pip3 install numpy pip/pip3 install scipy pip/pip3 install sklearn 本篇文章看看如何使用scikit-learn包实现kNN。scikit-learn本身自带了很多经典的数据集,如分类中经常使用的鸢尾花数据集。 数据集的准备 >>> from sklearn import datasets >>> import numpy as np >>> iris=datasets.load_iris() >>> iris_x=iris.data >>> iris_y=iris.target 上面的代码,首先导入了鸢尾花数据集,然后分离了鸢尾花数据集的特征数据和标签。我们可以先观察一下数据。 >>> np.shape(iris_x) (150, 4) >>> np.shape(iris_y) (150,) 数据总共有150条,有四个特征,如果了解鸢尾花数据集,应该知道,这四个特征是花萼长度,花萼宽度,花瓣长度,花瓣宽度。 >

JAVA 调用 R 语言

心已入冬 提交于 2019-11-28 01:38:51
1 简介 R是统计计算的强大工具,而JAVA是做应用系统的主流语言,两者天然具有整合的需要。关于整合,一方面,R中可以创建JAVA对象调用JAVA方法,另一方面,JAVA中可以转换R的数据类型调用R的函数,互相取长补短。现在也有一个项目JGR,用JAVA做R的图形界面,可以实现高亮显示自动补全等,还能让JAVA和R互相调用。 关于R中调用JAVA,我想主要是为了利用其面向对象的特性,毕竟R语言近来很致力于向面向对象发展,有个很好的项目rJava可以实现,在www.rforge.net/rJava上。R中调JAVA对我似乎意义不大,本文主要介绍JAVA中调用R。  JAVA很适合开发应用系统,但是数学建模和计算能力非其所长,如果该系统需要进行大量的统计或者优化的计算,调用R是一种很好的方式。JAVA负责系统的构建,R用来做运算引擎,从而实现应用型和分析性相结合的系统。 目前网上有两种方式使用java调用R。 2 Rserve的方式 2.1 介绍 首先要介绍的是Rserve的方式,这是一个基于TCP/IP的服务器,通过二进制协议传输数据,可以提供远程连接,使得客户端语言能够调用R。目前Rserve作为一个package发布在CRAN上,可以直接使用install.packages("Rserve")进行安装。需要使用时在R控制台下加载该包,然后输入命令Rserve(),开启服务器