Pydata

小白学 Python 数据分析(12):Pandas (十一)数据透视表(pivot_table)

泄露秘密 提交于 2020-04-18 06:36:18
人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础 小白学 Python 数据分析(2):Pandas (一)概述 小白学 Python 数据分析(3):Pandas (二)数据结构 Series 小白学 Python 数据分析(4):Pandas (三)数据结构 DataFrame 小白学 Python 数据分析(5):Pandas (四)基础操作(1)查看数据 小白学 Python 数据分析(6):Pandas (五)基础操作(2)数据选择 小白学 Python 数据分析(7):Pandas (六)数据导入 小白学 Python 数据分析(8):Pandas (七)数据预处理 小白学 Python 数据分析(9):Pandas (八)数据预处理(2) 小白学 Python 数据分析(10):Pandas (九)数据运算 小白学 Python 数据分析(11):Pandas (十)数据分组 引言 前文我们介绍了数据分组,今天我们接着介绍一个和数据分组很相似的内容,是数据透视表,从名字上来看是不是感觉没半毛钱关系,实际不然,数据分组是从一维(行)的角度上对数据进行了拆分,如果我们想从二维的角度上(行和列)同时对数据进行拆分呢? 这就需要用到我们今天的主角,数据透视表了。 数据透视表 什么是数据透视表?小编的灵魂画手上线: 图画的不好

pandas入门04---数据读取

自作多情 提交于 2020-04-11 17:25:10
01 文本格式数据读写 01-01 带表头文件 一些数据载入函数,如pandas.read_csv会进行类型推断,因为列的数据类型并不是数据格式的一部分。这意味着你不必指定哪一列是数值、整数、布尔值或字符串。 例如:我们可以使用read_csv将一个以 , 分割的文件读入DataFrame。 df = pd.read_csv(r'C:\Users\Administrator\Downloads\pydata-book-2nd-edition\examples\ex1.csv') print(df) 结果如下: 也可以使用read_table,并指定分隔符。 df2 = pd.read_table(r'C:\Users\Administrator\Downloads\pydata-book-2nd-edition\examples\ex1.csv', sep=',') print(df2) 结果如下: 01-02 不带表头文件 有的文件不带表头,要读取该文件,需考虑一些选项。可以允许pandas自动分配默认列名,也可以自己指定列名。 data = pd.read_csv(r'C:\Users\Administrator\Downloads\pydata-book-2nd-edition\examples\ex2.csv',header=None) print(data) data1

《Python数据分析与机器学习实战-唐宇迪》读书笔记第9章--随机森林项目实战——气温预测(2/2)

岁酱吖の 提交于 2020-04-10 15:13:09
python数据分析个人学习读书笔记-目录索引 第9章--随机森林项目实战——气温预测(2/2)   第8章已经讲解过随机森林的基本原理,本章将从实战的角度出发,借助Python工具包完成气温预测任务,其中涉及多个模块,主要包含随机森林建模、特征选择、效率对比、参数调优等。这个例子实在太长了,分为3篇介绍。这是第2篇。 9.2数据与特征对结果影响分析   带着上节提出的问题,重新读取规模更大的数据,任务还是保持不变,需要分别观察数据量和特征的选择对结果的影响。 1 # 导入工具包 2 import pandas as pd 3 4 # 读取数据 5 features = pd.read_csv( ' data/temps_extended.csv ' ) 6 features.head(5 ) 7 8 print( ' 数据规模 ',features.shape)   数据规模 (2191, 12)   在新的数据中,数据规模发生了变化,数据量扩充到2191条,并且加入了以下3个新的天气特征。 ws_1:前一天的风速。 prcp_1:前一天的降水。 snwd_1:前一天的积雪深度。   既然有了新的特征,就可绘图进行可视化展示。 1 # 设置整体布局 2 fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(nrows=2, ncols=2,

Python学习开发微信公众号系列-第3章Miniconda安装

社会主义新天地 提交于 2020-03-05 21:47:37
对于网络购买的云主机,空间即为金贵,使用Anaconda会安装很多其他使用不到的库。本节介绍使用Miniconda 1.Conda简介 Conda 是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。 Conda是为Python程序创建的,适用于Linux,OS X 和Windows,也可以打包和分发其他软件。 Conda是一个包管理器;Anaconda才是一个Python发行版。虽然Conda是用Anaconda打包的, 但是它们两个的目标是完全不同的。 软件发行版是在系统上提前编译和配置好的软件包集合, 装好了后就可以直接用。包管理器是自动化软件安装,更新,卸载的一种工具。Conda,有命令”conda install”, “conda update”, “conda remove”, 所以很明显, conda是包管理器。 Anaconda 和 Miniconda。Anaconda发行版会预装很多pydata生态圈里的软件,而Miniconda是最小的conda安装环境, 一个干净的conda环境。但是,conda和Anaconda没有必然关系, 你可以不安装Anaconda的同时, 使用conda安装和管理软件。 2.Conda安装 Conda分为Anaconda和Miniconda。Anaconda是包含一些常用包的版本

用python中的Pandas库实现一个商品期货网格策略

荒凉一梦 提交于 2020-02-26 02:06:37
Pandas是基于NumPy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。 Pandas数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。panel data是经济学中关于**数据集的一个术语,在Pandas中也提供了panel的数据类型。 关于pandas的安装方法,这里不在赘述,在python环境下,一个简单的pip命令即可搞定,文档方面,请参阅它的官方网站: https://pandas.pydata.org Pandas的数据结构 Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series如今能保存不同种数据类型

pandas入门04---数据读取

对着背影说爱祢 提交于 2019-11-29 09:33:40
01 文本格式数据读写 01-01 带表头文件 一些数据载入函数,如pandas.read_csv会进行类型推断,因为列的数据类型并不是数据格式的一部分。这意味着你不必指定哪一列是数值、整数、布尔值或字符串。 例如:我们可以使用read_csv将一个以 , 分割的文件读入DataFrame。 df = pd.read_csv(r'C:\Users\Administrator\Downloads\pydata-book-2nd-edition\examples\ex1.csv') print(df) 结果如下: 也可以使用read_table,并指定分隔符。 df2 = pd.read_table(r'C:\Users\Administrator\Downloads\pydata-book-2nd-edition\examples\ex1.csv', sep=',') print(df2) 结果如下: 01-02 不带表头文件 有的文件不带表头,要读取该文件,需考虑一些选项。可以允许pandas自动分配默认列名,也可以自己指定列名。 data = pd.read_csv(r'C:\Users\Administrator\Downloads\pydata-book-2nd-edition\examples\ex2.csv',header=None) print(data) data1