Pandas基础

自作多情 提交于 2020-03-22 18:46:28

3 月,跳不动了?>>>

Pandas简介

Pandas 是python的一个数据分析包,pandas是一款数据处理工具,集成了numpy以及matplotlib,拥有便捷的数据处理以及文件读取能力

Pandas 提供了三种数据对象,分别是 Series、 DataFrame 和 Panel。 其中 , Series 用于保存 一维类的数据, DataFrame 用于保存二维类的数据, Panel 用于保存三维类或者可变维度的数据。 在通常的数据分析中,我们经常使用 Series 和 DataFrame 这两种类型的数据,所以这两种类型 要重点介绍。

数据结构

系列(Series) 具有均匀数据的一维数组结构

一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近,其区别是:List中的元素可以是不同的数据类型,而Array和Series中则只允许存储相同的数据类型,这样可以更有效的使用内存,提高运算效率。

Time- Series:以时间为索引的Series。

数据帧(DataFrame)是一个具有异构数据的二维数组

DataFrame:DataFrame是⼀个二维的表格型数据结构,它含有⼀组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有⾏索引也有列索引,它可以被看做由Series组成的字典(共⽤同⼀个索引)。DataFrame中的数据是以⼀个或多个⼆维块存放的(⽽不是列表、字典或别的⼀维数据结构)。

面板(Panel) 具有异构数据的三维数据结构,可以说明为DataFrame的容器

Panel :三维的数组,可以理解为DataFrame的容器。

Pandas 有两种自己独有的基本数据结构。读者应该注意的是,它固然有着两种数据结构,因为它依然是 Python 的一个库,所以,Python 中有的数据类型在这里依然适用,也同样还可以使用类自己定义数据类型。只不过,Pandas 里面又定义了两种数据类型:Series 和 DataFrame,它们让数据操作更简单了。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!