pandas小技巧

1、更改列的数据类型

①一列:

pd.to_numeric(s)

②多列:

df[['a','b']] = df[['a','b']].apply(pd.to_numeric)

 

2、将DataFrame中数据进行标签编码,实现与sklearn.processing.LabelEncoder相同的效果

In[3]: pd.Categorical(['a', 'c', 'b', 'a', 'd'])
Out[3]: 
[a, c, b, a, d]
Categories (4, object): [a, b, c, d]
In[4]: pd.Categorical(['a', 'c', 'b', 'a', 'd']).codes
Out[4]: array([0, 2, 1, 0, 3], dtype=int8)

查看0,1,2,3对应的编码前的数据:

In[6]:pd.Categorical(['a', 'c', 'b', 'a', 'd']).categories
Out[6]: Index(['a', 'b', 'c', 'd'], dtype='object')

3、选择DataFrame里面某一列等于某个值的所有行

df.loc[df['columnName']=='the value']

4、对某列进行排序

df.sort_values(by="sales" , ascending=False)

对df的'sales'列由大到小排列

你可能感兴趣的:(python)