Pandas排序(主要研究对DataFrame的排序):
.sort_index(axis,ascending)方法对指定轴的索引进行排序;
未给定参数的情况下,默认对0轴进行升序操作。左侧列为0轴,上行排为1轴。
.sort_values(by,axis=0,ascending=True)方法对值进行排序;
by是给定的一个索引。
这里需要注意的是,若排序方向为axis=0,axis参数可以缺省;排序方向为axis=1,axis参数不能缺省。
NaN统一放在排序的末尾。
基本统计分析函数:
适用于DataFrame,Series类型:
.sum() .count() .mean() .median() .var() .std().min() .max()其中DataFrame返回为Series类型,Series返回为零维。
仅适用于Series类型:
.argmin() .argmax()返回自动索引位置
.idxmin() .idxmax()返回自定义索引位置
.describe()方法:
Series返回一个Series类型:
因此可以索引:Se.describe()[‘count’]获得count
DataFrame返回一个DataFrame类型:
默认按照0轴进行统计,需要获得某一个统计值,可以使用loa=c.discribe().iloc(‘max’)即可。
复习:对DataFrame进行索引
想要获得max一行:maxline=c.describe().iloc[‘max’]
想要获得0一列:line0=c.describe()[0]
而若还想获得按照1轴的统计,则可以使用DataFrame中的transpose()方法获得DtaFrame的转置。
累计统计分析函数:适用于Series DataFrame
.cumsum() .cumprod() .cummax() .cummin()
沿着列方向的累加值。
其他函数同理滚动计算函数:
计算窗口内相应的统计值.rolling(w).sum() .rolling(w).mean() .rolling(w).var(),std,min,max
NaN与任何数运算仍然为NaN
计算二者的相关性:
.corr()可以计算两个Series的相关性a.corr(b)返回二者的相关系数。
来源:CSDN
作者:forth touch
链接:https://blog.csdn.net/weixin_44322824/article/details/104213306