Pandas中,read_excel()函数的坑

Pandas中,read_excel()函数的坑

问题描述

今天在处理国家数据的时候,莫名其妙多出来很多国家为空值的数据,不知道哪来的。
在一步步print筛查后,终于发现是read_excel()函数的问题。如图所示:
Pandas中,read_excel()函数的坑_第1张图片

查资料

我查了查官方文档
Pandas中,read_excel()函数的坑_第2张图片

是read_excel()函数,把国家代码NA(纳米比亚)自动转义成pd.nan了。

解决办法

根据官方文档,加上参数keep_default_na问题暂时解决。

pd.read_excel(xlsx_path, keep_default_na=False)

但所有的空值形式都不会被转义了,有引发其他问题的可能性。

总结

其他读取文件的函数也可能有类似的坑,所以能不偷懒还是老老实实把数据放在数据库比较靠谱。

你可能感兴趣的:(Python,pandas)