pandas重复行处理

1、检测重复行

import pandas as pd
dframe = pd.DataFrame({'color':['white', 'white', 'red','red', 'white'],'value':[2,1,3,3,2]})
#检测重复行
dframe.duplicated()

2、删除重复行

#删除重复行,该函数返回的是删除重复行后的DataFrame对象
dframe.drop_duplicates()

3、根据某个字段去重

#根据某个字段去重
dframe.drop_duplicates('color')
pandas重复行处理_第1张图片


你可能感兴趣的:(python,pandas)