2020-02-24 pandas DataFrame去重

实例

import pandas as pd
data=pd.DataFrame({'a':['A','A','A','A'],'b':[50,50,30,30]})

去重

data.drop_duplicates()    # 去除重复数据
data.drop_duplicates().reset_index(drop=True)  # 去除重复数据,并重新设置索引,舍弃原来的索引
data.drop_duplicates()#data中一行元素全部相同时才去除
data.drop_duplicates(['a','b'])#data根据’a','b'组合列删除重复项,默认保留第一个出现的值组合。传入参数keep='last'则保留最后一个

你可能感兴趣的:(2020-02-24 pandas DataFrame去重)