初学python系列: pandas操作excel

媳妇工作中经常用到excel处理,想用python处理excel更高效,所以自学了python,觉得python比Java还是简单多了,没有变量类型声明,比Java也就多了元组,各种库很丰富。

需求是: 汇总两个excel中 列,放到一个新的excel中,不允许有重复的列内容

代码编辑器:pycharm社区版本(根本不需要专业版,专业版很多功能用不到)

环境:conda(直接下载python也行,只不过需要pip下载很多库,这个conda默认包含很多库,只是减少了下载的麻烦)

初学python系列: pandas操作excel_第1张图片

为了演示方便,两个excel文件跟python脚本放到一起,两个excel内容都是产品、数量列,其中2.xlsx包含了1.xlsx中的内容

初学python系列: pandas操作excel_第2张图片

代码中引入pandas处理框架,读取2个excel的产品列内容,然后把内容放到一个列表里面,然后把列表赋值给一个新的excel,利用to_excel自动生成新的文档

import pandas as pd

df1 = pd.read_excel('1.xlsx')
df2 = pd.read_excel('2.xlsx')
result2=df2["产品"]
result1= df1["产品"]

my_list = []
for i in result1.values:
    if i not in my_list:
      my_list.append(i)
for i in result2.values:
    if i not in my_list:
      my_list.append(i)

data1={'产品':my_list}
df = pd.DataFrame(data1)
df.to_excel('zss2024.xlsx')

调试代码如下

初学python系列: pandas操作excel_第3张图片

生成的新excel也会是在同级目录下

初学python系列: pandas操作excel_第4张图片

你可能感兴趣的:(python,python)