python丢失指导入导出数据

14课时 Pandas 如何处理丢失数据。

很多消失数据。用np.nan。

.dropna(axis=0,how=‘any’) #how={‘any’,‘all’} axis=0是丢掉行。How =any是只要有任何一个为nan就丢掉整行了。后面的all 是整个行的所有列都为nan才丢失这个行,默认是how=any。 Axis=1是丢掉列。.dropna(axis=0,how=‘all’)

注:.dropna 这里没有n。

并且最后要打印 print(-.dropna函数)

Print(np.any(df.isnull()==True)#就可以很快的查看是否丢失了数据,最后会返回时否为true,会。

                    15课时 Pandas导入导出数据

1 如何调用已经存储好的数据表格类

2 excel一般用csv

python丢失指导入导出数据_第1张图片

3 data=pd.read_csv(‘名.csv’)

Print(data)             #默认加行索引,今后可以用这个索引和column来调用数据 要用data=来命

data.to_pickle(‘studen.picklet’) #存储  运行此行命令即可。


python丢失指导入导出数据_第2张图片

4 jupyter 工作路径的查看

在cmd中,​输入“ipython notebook”或“jupyter notebook”打开notebook,此时cmd的当前路径即为notebook的工作路径。

另外,可通过设置config文件的方法来设置固定的工作路径

16课时 Pandasconcat 合并

合并多个dataframe 可以横向纵行,即可columns的命不一样

用pandas 和numpy

#concatenating

df1=pd.DataFrame(np.ones((3,4))*0,columns=['a','b','c','d'])

df2=pd.DataFrame(np.ones((3,4))*1,columns=['a','b','c','d'])

df3=pd.DataFrame(np.ones((3,4))*2,columns=['a','b','c','d'])

print(df1)

print(df2)

print(df3)


python丢失指导入导出数据_第3张图片

res=pd.concat([df1,df2,df3],axis=0,ignore_index=True)  #pd中 记住 axis的代表,合并函数,axis=0 代表行都合并成多行,在行上进行合并,axis=1代表在列上面进行合并, ignore 可以让前面的index重新顺序,而非之前的index。

print(res)

python丢失指导入导出数据_第4张图片

# join,[‘inner’,’outer’]

默认是outer 就是说列上面没有的写为空

而inner是合并的时候,只合并列里面都有列,行保持不变累加。

df1=pd.DataFrame(np.ones((3,4))*0,columns=['a','b','c','d'])

df2=pd.DataFrame(np.ones((3,4))*1,columns=['e','b','c','d'])

res=pd.concat([df1,df2],join='inner',ignore_index=True)

print(res)

python丢失指导入导出数据_第5张图片

#join_axes

df1=pd.DataFrame(np.ones((3,4))*0,columns=['a','b','c','d'],index=[1,2,3])

df2=pd.DataFrame(np.ones((3,4))*1,columns=['b','c','d','e'],index=[2,3,4])

res=pd.concat([df1,df2],axis=1,join_axes=[df1.index])

print(res)

你可能感兴趣的:(python丢失指导入导出数据)