DataFrame(一般读取后的数据都是df)
数据读取:pd.read_csv('d:/a.csv',dtype=objec,encoding='utf-8')
pd.read_csv('d:/a.txt',dtype=objec,encoding='utf-8')
数据输出:pd.to_excel(path)
一次写入多张表:利用ExcelWriter()方法
df2.to_excel(writer,sheet_name='sheet2')
数据统计:
pandas 做数据统计的时候有两种聚合方式:
1,groupby()分组
2,pivot_table()透视表
pandas 分析实例:
注意需要加两个中括号
同一列的多重筛选方法:df.分公司.isin(['....','....'])
一个特别实用的技巧
字符串文本提取:
python提取文本非常方便――利用切片如:
怎样将整列数据应用文本提取?
就是前面讲过的 apply() 方法
分类统计:
常见的统计函数有:count(),sum(),mean()等
df.loc['....']实现 loc 是pandas中对行进行操作
利用透视表pivot_table()进行分类统计:
pd.pivot_table(df,index=' ',columns=' ',values=' ',aggfunc=' ',margins= ,margins_name=' ',fill_value=)
筛选方法和上面讲的一样
暂停一下,改天继续。
来源:博客园
作者:数据--熊
链接:https://www.cnblogs.com/dataxiong/p/11543627.html