Dataframe多条件索引

多条件索引

错误的写法:

info[(info["lon"]==-1) and (info["lat"]==-1)].shape

报错:
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

应该这么写:

info[(info["lon"]==-1) & (info["lat"]==-1)].shape

并且注意info["lon"]==-1info["lat"]==-1两边的括号不能掉了

空值索引

X[X["job"].isna()]
X[X["job"].isnull()]
X[X["job"].notna()]
X[X["job"].notnull()]

in

错误的写法:

X[X['day'] in [1,2,3,4]]

正确的写法:

X[X['day'].isin([1,2,3,4])]

notin

X[~X['day'].isin([1,2,3,4])]

注意pandas索引都不会返回新df,一定要赋值

你可能感兴趣的:(python,数据分析,python,数据分析)