Pandas基础4(变换与排序)

Pandas排序(主要研究对DataFrame的排序):

.sort_index(axis,ascending)方法对指定轴的索引进行排序;
未给定参数的情况下,默认对0轴进行升序操作。左侧列为0轴,上行排为1轴。
Pandas基础4(变换与排序)_第1张图片
.sort_values(by,axis=0,ascending=True)方法对值进行排序;
by是给定的一个索引。
Pandas基础4(变换与排序)_第2张图片
这里需要注意的是,若排序方向为axis=0,axis参数可以缺省;排序方向为axis=1,axis参数不能缺省。
NaN统一放在排序的末尾。

基本统计分析函数:

适用于DataFrame,Series类型
.sum() .count() .mean() .median() .var() .std().min() .max()其中DataFrame返回为Series类型,Series返回为零维。
仅适用于Series类型
.argmin() .argmax()返回自动索引位置
.idxmin() .idxmax()返回自定义索引位置

.describe()方法:

Series返回一个Series类型:
因此可以索引:Se.describe()[‘count’]获得count
Pandas基础4(变换与排序)_第3张图片
DataFrame返回一个DataFrame类型:

Pandas基础4(变换与排序)_第4张图片
默认按照0轴进行统计,需要获得某一个统计值,可以使用loa=c.discribe().iloc(‘max’)即可。
复习:对DataFrame进行索引
想要获得max一行:maxline=c.describe().iloc[‘max’]
想要获得0一列:line0=c.describe()[0]
而若还想获得按照1轴的统计,则可以使用DataFrame中的transpose()方法获得DtaFrame的转置。

累计统计分析函数:适用于Series DataFrame

.cumsum() .cumprod() .cummax() .cummin()
Pandas基础4(变换与排序)_第5张图片
沿着列方向的累加值。
其他函数同理滚动计算函数:
计算窗口内相应的统计值.rolling(w).sum() .rolling(w).mean() .rolling(w).var(),std,min,max

Pandas基础4(变换与排序)_第6张图片
NaN与任何数运算仍然为NaN

计算二者的相关性:

.corr()可以计算两个Series的相关性a.corr(b)返回二者的相关系数。

Pandas基础4(变换与排序)_第7张图片

你可能感兴趣的:(Numpy,Pandas,Matlibplot基础,python)