2019-04-01基于python使用pandas、numpy进行数据分析、处理等经验总结

背景:老田自己的毕设有很多数据处理不了,需要爸爸帮忙


知识点总结:

1.    numpy中对数据分割:

 list1=np.split(arr,len(arr[0][0])/24, axis=2)

np.split(numpy数组,要分成的份数,轴)

2.python读取和保存mat文件:

       data = scio.loadmat(“/User/juzheng/1.mat”)  # 读取mat文件
        #print(data.keys())   # 查看mat文件中的所有变量
         scio.savemat("新文件路径", 变量名:要存的数据})

3.numpy算平均值:

np.mean(数组, axis=2)

np.mean(a, axis=0) #数组,轴

4.把数组竖着输出直接一个一个遍历就好了

5.numpy下的轴交换transpose和 swapaxes的解读:

https://blog.csdn.net/sinat_36306474/article/details/80745490

6.java读取mat:https://www.cnblogs.com/lz3018/p/5067111.html


场景1:

使用python读取mat文件,里面时34*36*8784 (闰年为366*24=8784 非闰年为365*24)

这样一个三维数组,可以理解为一个34*36的平面的数据叠加了8784层土壤水含量。

需要保持维度不变,将8784那组每24个数据算一次平均值处理后数据格式应该是34*36*366(365)

然后按照精度,纬度,土壤水含量(365列)


场景2:
有一列数据1716960行,想办法每隔672行成新的一列输出,最终形成255列,672行。
          

 

 

你可能感兴趣的:(2019-04-01基于python使用pandas、numpy进行数据分析、处理等经验总结)