通常在使用Excel进行数据处理前,总会遇到前几行是标题信息(导出时间呀,行数呀,或者一些简单的概括信息)而这些信息影响pandas 读入识别到正确的列标,单个文件或不常用还可以手动删除,如果是多个Excel文件或者一个很大的Excel我们从系统导出的时候就会被分割成若干个子Excel,有的系统在导出Excel后会给每个表添加标题信息等;给我们数据处理带来了一定的困扰。本文旨在于解决导入Excel时无需人工干预即可直接跳过那些没用的行。
在pandas.ExcelFile对象读入Excel表格后
我们用.parse()预加载,也就是先不管跳过几行,加载一次。
然后用下面的函数计算一下需要跳过几行;再进行一次加载,
这次加载就要加上参数skiprows的具体值。
def skprows(dfp,r=10,cols=7