Pandas 里的那些常用参数

这里是一份持续更新的常用参数使用文档
inplace, axis...

import pandas as pd
import tushare as ts

inplace
简单易懂的参数,表示初始的数据是否发生变化。当我们对数据进行再加工,可以先inplace=False来观察生成的效果,得到理想中的数据之后再inplace=True

movies = ts.month_boxoffice()
movies.head()
Pandas 里的那些常用参数_第1张图片
image.png

假设我们希望电影按照口碑来进行排序

movies.sort_values('WomIndex', ascending=False).head()
Pandas 里的那些常用参数_第2张图片
image.png
movies.head()
Pandas 里的那些常用参数_第3张图片
image.png

可以看出movie是没有发生变化的,因为sort_values中的inplace默认参数是False,下面用inplace=True来改变movie数据本身。

(shift + tab juypter 操作)

Pandas 里的那些常用参数_第4张图片
image.png

movies.sort_values('WomIndex', ascending=False, inplace=True)
movies.head()
Pandas 里的那些常用参数_第5张图片
image.png

axis
axis轴线,其实表示的是你希望对数据操作的方向。axis=0,表示水平方向(rows)。axis=1,表示垂直方向(columns)。
比如上例中axis=0,就表示我们按照每个row的womIndex来进行排序。这个时候使用axis=1,会直接报错。
还是使用movies,来看一下axis=1的效果。

movies.avgboxoffice = movies.avgboxoffice.astype(float)
movies.avgshowcount = movies.avgshowcount.astype(float)

loc操作

movies.loc[:, ['avgboxoffice', 'avgshowcount']].sum(axis=0)
avgboxoffice    364.0
avgshowcount    219.0
dtype: float64
movies.loc[:, ['avgboxoffice', 'avgshowcount']].sum(axis=1)
6     48.0
0     75.0
7     50.0
8     46.0
2     52.0
3     54.0
4     53.0
1     59.0
5     52.0
9     49.0
10    45.0
dtype: float64

当axis=0的时候,计算列avgboxoffice,avgshowcount每行的加总
当axis=1的时候,计算每行avgboxoffice,avgshowcount列的加总

你可能感兴趣的:(Pandas 里的那些常用参数)