Pandas---条件筛选与组合筛选

Pandas—条件筛选与组合筛选

在使用pandas进行数据分析时,经常需要根据逻辑条件来筛选数据。
如果使用 for循环语句 遍历的方式来查找,将十分耗时。
推荐使用pandas自身的功能函数进行筛选,效率更高。
以下列出笔者常用的筛选方法。

条件筛选

根据具体值筛选

df[df['Num'] == 10]
df[df['Name'] == 'Tom']

找出df中值在具体列表中的数据

val_list = [100, 200, 300]
df[df['Num'].isin(val_list)]

筛选某列值长度为固定值的数据

df[df['content'].str.len() == 10]

筛选某列是否为空的数据

# 找出content列为空的数据
df[df['content'].isna()]

# 找出content不为空的数据
df[~df['content'].isna()]

组合筛选

多条件同时满足

# 找出df中A列值为100B列值为‘a’的所有数据
df[(df['A']==100)&(df['B']=='a')]

多条件满足其一即可

# 找出df中A列值为100B列值为‘b’的所有数据
df[(df['A']==100)|(df['B']=='b')]

注:筛选后所得数据的索引一般是乱的,可使用 df = df.reset_index(drop=True) 的方式重置索引。

你可能感兴趣的:(Pandas,python)