微信:wusheng9922
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)
subset : column label or sequence of labels, optional
用来指定特定的列,默认所有列
keep : {‘first’, ‘last’, False}, 默认 ‘first’
删除重复项并保留第一次出现的项
inplace :
布尔值,默认为False,是否直接在原数据上删除重复项或删除重复项后返回副本。(inplace=True表示直接在原来的DataFrame上删除重复项,而默认值False表示生成一个副本。)
df.drop_duplicates(inplace=True)
**这样操作,默认情况下就是,值得指出的是,全部重复(指的是一张表中的某一行 这行上的所有列 都相同。)都删除了,然后保留的是 重复行中的 第一次出现的行。