python 数据分析之pandas

匿名 (未验证) 提交于 2019-12-02 22:51:30

DataFrame(一般读取后的数据都是df)

数据读取:pd.read_csv('d:/a.csv',dtype=objec,encoding='utf-8')

     pd.read_csv('d:/a.txt',dtype=objec,encoding='utf-8') 

数据输出:pd.to_excel(path)

一次写入多张表:利用ExcelWriter()方法

  df2.to_excel(writer,sheet_name='sheet2')

数据统计

pandas 做数据统计的时候有两种聚合方式:

1,groupby()分组

2,pivot_table()透视表

pandas 分析实例

注意需要加两个中括号

  同一列的多重筛选方法:df.分公司.isin(['....','....'])

一个特别实用的技巧

字符串文本提取

python提取文本非常方便――利用切片如:

怎样将整列数据应用文本提取

  就是前面讲过的 apply() 方法

分类统计

常见的统计函数有:count(),sum(),mean()等

df.loc['....']实现 loc 是pandas中对行进行操作

利用透视表pivot_table()进行分类统计

  pd.pivot_table(df,index=' ',columns=' ',values=' ',aggfunc=' ',margins= ,margins_name=' ',fill_value=)

筛选方法和上面讲的一样

暂停一下,改天继续。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!