8.pandas 剔除重复

生成数据

import pandas as pd
import numpy as np
df = pd.DataFrame(data=np.random.randint(0,3,20).reshape((10,2)),columns=['a','b'])
模拟数据

去重操作

#--方法1
print df[~df.duplicated()]
#--方法2
print df.drop_duplicates()
去重后数据

重复数据

print df[df.duplicated()]

你可能感兴趣的:(8.pandas 剔除重复)