平时在用DataFrame时候,删除操作用的不太多。原数据包含的信息过多,或者生成了新的无用信息行/列,需要从DataFrame中筛选数据,组成一个新的DataFrame再继续操作。
官方文档写的很清楚:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop.html
输入:
# df
id name math english
1 Alice 90 89
2 Bob 89 94
3 Cindy 99 80
4 Eric 78 94
5 Helen 97 94
6 Grace 93 90
输出(删除第一列id):
name math english
Alice 90 89
Bob 89 94
Cindy 99 80
Eric 78 94
Helen 97 94
Grace 93 90
Python代码实现:
# 方法1:
dfDropCol = df.drop(['id'], axis=1)
# 方法2:
dfDropCol = df.drop(columns=['id'])
输出(删除第一、第二列):
id name math english
3 Cindy 99 80
4 Eric 78 94
5 Helen 97 94
6 Grace 93 90
Python代码实现:
dfDropRow = df.drop([0, 1])