seaborn

Python: NumPy, Pandas学习资料

随声附和 提交于 2020-05-06 10:44:39
NumPy 学习资料 书籍 NumPy Cookbook_[Idris2012] NumPy Beginner's Guide,3rd_[Idris2015] Python数据分析基础教程:NumPy学习指南(第2版) 网络资料 100 Numpy Exercises Pandas Exercises accompany "Pandas for Everyone" 菜鸟教程:NumPy教程 NumPy Documentation NumPy 中文文档 Pandas 学习资料 书籍 Pandas for Everyone: Python Data Analysis_[Chen2018] Pandas Cookbook: Recipes for Scientific Computing, Time Series Analysis and Data Visualization using Python_[Petrou2017] pandas: powerful Python data analysis toolkit Mastering Pandas for Finance_[Heydt2015] Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython,2nd_[Mckinney2017]

吴裕雄 数据挖掘与分析案例实战(6)——线性回归预测模型

做~自己de王妃 提交于 2020-05-05 15:44:35
# 工作年限与收入之间的散点图 # 导入第三方模块 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt # 导入数据集 income = pd.read_csv(r'F:\\python_Data_analysis_and_mining\\07\\Salary_Data.csv') print(income.shape) print(income.head()) # 绘制散点图 sns.lmplot(x = 'YearsExperience', y = 'Salary', data = income, ci = None) # 显示图形 plt.show() # 简单线性回归模型的参数求解 # 样本量 n = income.shape[0] # 计算自变量、因变量、自变量平方、自变量与因变量乘积的和 sum_x = income.YearsExperience.sum() sum_y = income.Salary.sum() sum_x2 = income.YearsExperience.pow(2).sum() xy = income.YearsExperience * income.Salary sum_xy = xy.sum() # 根据公式计算回归模型的参数 b = (sum

python单样本假设检验实例

筅森魡賤 提交于 2020-05-01 09:32:35
假设检验可以建立批判思维,切忌盲目追寻他人的观点。在各个领域都应用广泛,例如犯罪学,科学研究中都会假设某个推理,然后通过一系列结论去证明这个推断是否成立,如果成立则接受假设,若不成立则接受反面推断。 假设检验的四个步骤 一、问题是什么 1.明确问题是什么,根据问题假定两个假设:零假设和备选假设,两个假设是对立的。零假设总是表述为研究没有改变,没有效果,不起作用 2.判断检验类型 单样本检验检验=》检验单个样本的平均值是否等于目标值 相关配对检验=》检验相关或配对观测之差的平均值是否等于目标值 独立双样本检验=》检验两个独立样本的平均值之差是否等于目标值 3.确定抽样分布类型 当样本数量大于30时,符合中心极限定理,抽样分布呈正态分布 样本数量小于30时,抽样分布符合t分布或其他分布 4.确定检验方向 单尾检验     左尾:若备选假设包含有<,则选左尾检验     右尾:若备选假设包含有>,则选右尾检验 双尾检验     将判断标准一分为二位于抽样分布的两侧,左右侧各占一半判断标准,若假设中包含不等号,则属于双尾检验。 二、做出结论标准是什么(证据是什么) 在假设零假设成立时,计算样本平均值的概率: p值 当样本分布符合t分布是 计算p值得方法如下 : 根据t值,查找t表格,得到p值 三、判断标准是什么 设定 显著水平α 四、做出结论 当p<=α时,拒绝零假设,接受备选假设 p

干货 | 使用pyecharts绘制交互式动态地图

て烟熏妆下的殇ゞ 提交于 2020-04-25 18:23:51
说到pyecharts,相信很多人不会陌生,一个优秀的python可视化包。<br> pyecharts是中国人开发的,相比较matplotlib、seaborn等老牌可视化库,pyecharts是十分符合国内用户习惯的,尤其在地理空间图表方面。<br> 本文是想试探一下pyecharts在绘制地理图表方面的功底如何,那就开始吧! 安装pyecharts pyecharts支持pip、conda安装,快捷方便,推荐在jupyter notebook环境下愉快的玩耍。 pip install pyecharts 本文python版本为3.6,演示环境为jupyter notebook。 pyecharts地理图表可视化 1、导入相关模块 pyecharts库中负责地理坐标系的模块是 Geo ,负责地图的模块是 Map ,负责百度地图的模块是 BMap ,负责图表配置的模块是 options 。在 pyecharts 中,图表的一切皆通过 options来修饰调整。<br> 另提一句,因为需要用到案例数据,这里还需要导入样本库-sample from example.commons import Faker from pyecharts import options as opts from pyecharts.charts import Geo from pyecharts

《Python程序设计与应用》在线课程使用说明

╄→尐↘猪︶ㄣ 提交于 2020-04-25 02:19:01
《Python程序设计与应用》在线课程使用说明 网页版链接 20200223 更新 一、简介 本课程内容包括Python基础语法与Python应用(数据处理、可视化等)。 具体章节:Python基础、内置基本数据类型、程序结构、函数、异常处理、集合与字典类型、文件操作、Python应用(科学计算numpy、pandas、matplotlib、seaborn、网络信息安全基础)。 主要资源: 超星MOOC平台:视频、章节测验、作业及考试(陆续增加中)。 PTA编程题集:Python MOOC题集(覆盖主要章节)。 PPT课件:请选课的老师联系课程负责人。 课程链接: https://mooc1-1.chaoxing.com/course/204546236.html 课程负责人 :集美大学计算机工程学院 郭老师 QQ:34729742 教师交流群 :Java&Python MOOC 教师讨论群 群号:938999254 课程相关博客: https://www.cnblogs.com/zhrb/tag/python3/ **课程相关工具:**IDLE、Jupyter Notebook 二、快速加入课程 加入步骤: 将教师超星平台账号(姓名,在超星上 注册过的 手机号或邮箱)、学校、班级等信息发给负责人用来建立班级。 建立班级后,教师通过自己学校所在超星平台导入班级。也可通过将

pip 国内源安装科学计算包

旧巷老猫 提交于 2020-04-20 14:07:19
python -m pip install --upgrade pip pip install --user numpy scipy matplotlib jupyter pandas sympy nose pip install matplotlib -i http://pypi.douban.com/simple --trusted-host pypi.douban.com pip install numpy -i http://pypi.douban.com/simple --trusted-host pypi.douban.com pip install pandas -i http://pypi.douban.com/simple --trusted-host pypi.douban.com pip install seaborn scipy -i http://pypi.douban.com/simple --trusted-host pypi.douban.com 来源: oschina 链接: https://my.oschina.net/readerror/blog/3276031

今天整理了几个在使用python进行数据分析的常用小技巧、命令。

六眼飞鱼酱① 提交于 2020-04-18 12:07:11
提高Python数据分析速度的八个小技巧 01 使用Pandas Profiling预览数据 这个神器我们在之前的文章中就详细讲过,使用Pandas Profiling可以在进行数据分析之前对数据进行快速预览,拿我们使用过很多次的NBA数据集来说,导入数据集之后 一行代码就生成丰富的交互式数据EDA报告 可以看到,除了之前我们需要的一些描述性统计数据,该报告还包含以下信息: 类型推断:检测数据帧中列的数据类型。 要点:类型,唯一值,缺失值 分位数统计信息,例如最小值,Q1,中位数,Q3,最大值,范围,四分位数范围 描述性统计数据,例如均值,众数,标准偏差,总和,中位数绝对偏差,变异系数,峰度,偏度 最常使用的值 直方图 相关性矩阵 缺失值矩阵,计数,热图和缺失值树状图 文本分析:了解文本数据的类别(大写,空格),脚本(拉丁,西里尔字母)和块(ASCII) 02 使用cufflinks绘制图表 上一个神器Pandas Profiling可以快速帮助我们预览数据,那么这个神器cufflinks可以帮我们直接使用DataFrame快速绘制交互式图表。就像seaborn封装了matplotlib一样,cufflinks在plotly的基础上做了一进一步的包装,方法统一,参数配置简单。 对pandas熟悉的同学可能知道pandas可以直接调用.plot()绘图,我们来看看 df.plot()

Single variable category scatter plot pandas

寵の児 提交于 2020-04-17 00:55:13
问题 Is It possible to plot single value as scatter plot? I can very well plot it in line by getting the ccdfs with markers but I want to know if any alternative is available? Input: Input 1 tweetcricscore 51 high active Input 2 tweetcricscore 46 event based tweetcricscore 12 event based tweetcricscore 46 event based Input 3 tweetcricscore 1 viewers tweetcricscore 178 viewers Input 4 tweetcricscore 46 situational tweetcricscore 23 situational tweetcricscore 1 situational tweetcricscore 8

Single variable category scatter plot pandas

纵然是瞬间 提交于 2020-04-17 00:54:48
问题 Is It possible to plot single value as scatter plot? I can very well plot it in line by getting the ccdfs with markers but I want to know if any alternative is available? Input: Input 1 tweetcricscore 51 high active Input 2 tweetcricscore 46 event based tweetcricscore 12 event based tweetcricscore 46 event based Input 3 tweetcricscore 1 viewers tweetcricscore 178 viewers Input 4 tweetcricscore 46 situational tweetcricscore 23 situational tweetcricscore 1 situational tweetcricscore 8