判断dataframe中是否有重复行,去除重复行

是否有重复行

any(df.duplicated())

查看重复的行

df[df.duplicated()]

去除重复行

df.drop_duplicats(subset = ['price','cnt'],keep='last',inplace=True)

drop_duplicats参数说明:

subset subset用来指定特定的列,默认所有列

keep keep可以为first和last,表示是选择最前一项还是最后一项保留,默认first

inplace inplace是直接在原来数据上修改还是保留一个副本,默认为False

你可能感兴趣的:(数据分析,python)