Python高效办公|批量替换错误值

01 前言

这是「罗罗攀」的又一个新系列文章,依照惯例,还是说明下开启这个新系列文章的初衷和原因吧。

在我的工作中,虽然大分部情况可以不通过编程来完成,但是有些重复或者烦琐的问题,通过编程可以很快速的完成,提高工作效率。这个系列可能包括的有Python+文件批量处理,Python+office高效办公,Python+ArcGIS专业等。

由于自己也在不断学习和探索中,可能有些代码并不是最优化的,也不一定是最实用的。但希望通过这个系列,不断记录自己的学习过程,同时给各位读者提供一些新思路。

02 问题描述

这来源于一个同事问的问题,他有两个表格,第一个表格是总表,但是有一列数据部分内容是写错了的。正确的内容写在了另外一个表格中。

03 解决代码

虽然可以用Excel解决,但是Python代码很快就能搞定,解决步骤如下。

① 读入数据

old_df = pd.read_excel('批量替换缺失值.xlsx',sheetname='1')
new_df = pd.read_excel('批量替换缺失值.xlsx',sheetname='2')

② 合并两个表格数据

df = pd.merge(old_df,new_df,on='姓名',how='outer')
df

③ 填充缺失值

df['爱好_y'].fillna(df['爱好_x'],inplace=True)

④ 最后保留爱好_y这一列数据就行了,导出数据就完成了

总结

这就是巧用数据合并来解决问题的方法和思路,大家有什么更好的方法可以留言告诉我哦~

你可能感兴趣的:(Python高效办公|批量替换错误值)