转载请声明出处:https://blog.csdn.net/cyzhah/article/details/81219501
以上两个截图是对下面两个运行结果:
# data = DataFrame([1,1,2,2])#列表型
#data = DataFrame({'k':[1,1,2,2]})#字典型
DataFrame的duplicated方法返回一个布尔型Series,表示各行是否重复行。
而 drop_duplicates方法,它用于返回一个移除了重复行的DataFrame
这两个方法会判断全部列,你也可以指定部分列进行重复项判段。
例如,希望对名字为k2的列进行去重,
data.drop_duplicates(['k2'])