Pandas实现in与not in筛选数据

Pandas实现in与not in筛选数据

通过df.isin()来判断DataFrame中每个元素是否存在

DataFrame.isin()官方文档

import pandas as pd

# 示例数据
df = pd.DataFrame({
     'user_id' : [1, 2, 3, 4, 5, 6], 'score' : [66, 67, 80, 71, 69, 57]})
# 需被清理的user_id
drop_user = [2, 4, 6]

按照python的思维,最简单的做法是:

df = df[df.user_id not in drop_user]

但这样做往往会报错

# 正确解法
df = df[df.user_id.isin(drop_user)]

# isin逆运算
df = df[~df.user_id.isin(drop_user)]

这样就完成了的user_id的清理

你可能感兴趣的:(数据分析,python,数据分析,numpy)