example:
df2 = df.loc[~df[col].isin(list)]
“~”符号在这里是取反的意思,表示对 df[col].isin(list) 这句返回的值取反,主要用于数据的 slicing。比如 df 是如下的格式:
我们希望从 df 中删去 list = ['H', 'I', 'J', 'K', 'L', 'M', 'N'] 中的列,但是注意到
['H', 'I', 'J', 'K', 'L', 'M', 'N']
df 中只有 'H', 'I', 'J' 是在 list 里面的,我们需要把 'K', 'L', 'M', 'N' 的列都去掉,从而得到以下的df2:
我们用 boolean 的操作进行 slicing。
1. 用isin(list) 判断每个 column 是否在 list里面,如果在就返回 True,否则返回 False。
2. 用 df[col] 对每个列都进行判断,由 df[col].isin(list) 返回针对每个列的 True/False 值,也就是 [False, False, False, False, False, False, False, True, True, True]。
3. 用 ~ 对 True/False 值列表进行取反,得到 [True, True, True, True, True, True, True, False, False, False]
4. 用 df.loc 选择出 boolean 值为 True 的前6列,得到 df2: