用Python处理Excel中的重复行--菜鸟入门

用Python处理Excel中的重复行--菜鸟入门_第1张图片

从Excel表中可以看到有两条重复记录

# 导入pandas包并重命名为pd
import pandas as pd

# 读取Excel中Sheet1中的数据
data = pd.DataFrame(pd.read_excel('test.xlsx', 'Sheet1'))

# 查看读取数据内容
print(data)

# 查看是否有重复行
re_row = data.duplicated()
print(re_row)

# 查看去除重复行的数据
no_re_row = data.drop_duplicates()
print(no_re_row)

# 查看基于[物品]列去除重复行的数据
wp = data.drop_duplicates(['物品'])
print(wp)

# 将去除重复行的数据输出到excel表中
no_re_row.to_excel("过滤重复行.xlsx")

输出结果
用Python处理Excel中的重复行--菜鸟入门_第2张图片

你可能感兴趣的:(Python,Python,excel,重复行)