1、更改列的数据类型
①一列:
pd.to_numeric(s)
②多列:
df[['a','b']] = df[['a','b']].apply(pd.to_numeric)
2、将DataFrame中数据进行标签编码,实现与sklearn.processing.LabelEncoder相同的效果
In[3]: pd.Categorical(['a', 'c', 'b', 'a', 'd'])
Out[3]:
[a, c, b, a, d]
Categories (4, object): [a, b, c, d]
In[4]: pd.Categorical(['a', 'c', 'b', 'a', 'd']).codes
Out[4]: array([0, 2, 1, 0, 3], dtype=int8)
查看0,1,2,3对应的编码前的数据:
In[6]:pd.Categorical(['a', 'c', 'b', 'a', 'd']).categories
Out[6]: Index(['a', 'b', 'c', 'd'], dtype='object')
3、选择DataFrame里面某一列等于某个值的所有行
df.loc[df['columnName']=='the value']
4、对某列进行排序
df.sort_values(by="sales" , ascending=False)
对df的'sales'列由大到小排列