Pandas常用数据结构

為{幸葍}努か 提交于 2019-12-03 11:52:55

Pandas概述

  Pandas(Python Data Analysis Library )是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。它是使Python成为强大而高效的数据分析环境的重要因素之一。

  Pandas专用于数据预处理和数据分析的Python第三方库,最适合处理大型结构化表格数据

  •   Pandas是2008年Wes McKinney于AQR资本做量化分析师时创建
  •   Pandas借鉴了R的数据结构
  •   Pandas基于Numpy搭建,支持Numpy中定义的大部分计算
  •   Pandas含有使数据分析工作更简单高效的高级数据结构和操作工具
  •   Pandas底层用Cython和C做了速度优化,极大提高了执行效率

  Pandas 常用的数据结构有两种:Series 和 DataFrame

Series简介

  Series 是一个带有 名称 和索引的一维数组,在 Series 中包含的数据类型可以是整数、浮点、字符串、Python对象等。

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!