pandas解析库数据缺失值处理




1
import pandas as pd 2 import numpy as np 3 dates = pd.date_range('20130101',periods=6)#先指定索引 4 df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD'))#创建一个数据框 5 df1 = df.reindex(index=dates[0:4],columns=list(df.columns)+['E']) 6 df1.loc[dates[0]:dates[1],'E']=1 7 df1.to_csv('ABCD表单1.csv') 8 df2=df1.dropna(how='any')#删掉包含缺失行 9 df2.to_csv('ABCD表单2.csv') 10 df3=df1.fillna(value=5)#对缺失行进行填充 11 df3.to_csv('ABCD表单3.csv') 12 df4=df1.fillna(df['A'].mean())#以A变量的均值进行填充 13 df4.to_csv('ABCD表单4.csv')

运行结果对比:

pandas解析库数据缺失值处理_第1张图片

 

你可能感兴趣的:(pandas解析库数据缺失值处理)