python小白的入门(二):pandas常用函数
读取 df = pd.read_csv(‘文件名’,encoding = ‘utf’/‘gbk’/,sep=’\t’) 查看基本信息 df.info() df.head() df.describe() df.列名.value_counts() 更改某一列的数据类型(series下) df.列名.astype(‘str’/‘int’) 排序 df.sort_values(by = 列名/列表,ascending=True/False) df.sort_index()索引排序 排序赋值(series下) df[‘rank’]= df.列名.rank(method='average/‘max’/‘min’/‘first’,ascending=False) 分组统计(pandas下) df[‘bins’] = pd.cut(df.列名,bins=5/[0,5,10,15,20,100],labels=[‘0-5’,‘5-10’,‘10-15’,‘15-20’,‘20-100’]) 多重索引 用groupby建多重索引: df.groupby(分组列表).聚合函数为DataFrame类型,之后可用.loc[一级标签,二级标签]取值 df.groupby(分组列表).聚合函数.列名为Series类型,之后可用[一级标签][二级标签]取值 用set_index建多重索引: df.sort