pandas怎么去除去除重复行?drop_duplicates去除DataFrame表结构重复行。

微信:wusheng9922

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset : column label or sequence of labels, optional
用来指定特定的列,默认所有列
keep : {‘first’, ‘last’, False}, 默认 ‘first’
删除重复项并保留第一次出现的项
inplace :
布尔值,默认为False,是否直接在原数据上删除重复项或删除重复项后返回副本。(inplace=True表示直接在原来的DataFrame上删除重复项,而默认值False表示生成一个副本。)

df.drop_duplicates(inplace=True)

**这样操作,默认情况下就是,值得指出的是,全部重复(指的是一张表中的某一行 这行上的所有列 都相同。)都删除了,然后保留的是 重复行中的 第一次出现的行。

你可能感兴趣的:(python)