pands 数据去重

print(data.drop_duplicates())

删除重复行数据

data=pd.DataFrame({'a':[1,3,3,4],
              'b':[1,3,3,5]})
print(data)

结果为:


image
print(data.duplicated())

结果为:


image

可以看出第三行是重复第二行的数据所以,显示结果为True
另外用drop_duplicates方法可以去除重复行

print(data.drop_duplicates())

结果为:


image

你可能感兴趣的:(pands 数据去重)