Pandas基本操作总结 excel读取和数据清洗

#1 读取表格

df = pd.read_excel("目标文件路径", skiprows=要跳过的行数)
                                   ┗━━━━━━━┳━━━━━━━┛
                            指定读取表格时要跳过前面空行的行数


#2 筛选某列不是空值的所有行
df.loc[ df["某列"].notnull(),        :         ]
         ┗━━━━━━━┳━━━━━━━┛           ↓ 
      筛选某列不为空值的所有行    筛选行后选取所有列


#3 删掉整个的空行或空列
df.dropna(axis = 0, how='all', inplace=True)
           ┗━━┳━━┛    
删除空行用axis=1或"columns",删除空列用axis=1或"columns"


#4 用0填充空值
df.fillna({"某列名":0})     #采用字典方式 用0填充某列的空值

或用.loc选取填充,与之等效:
df.loc[:, "B列"] = df["B列"].fillna(0)


#5 用前值或后值填充当前空值
df.loc[:, "B列"] = df["B列"].fillna(method="ffill")   #"ffill":非空前值,"bfill":非空后值


#6 保存处理后的数据
df.to_excel("路径文件.xls", index=False)

 

你可能感兴趣的:(python,pandas,python)