pandas数据分析进阶笔记(二):Numpy

np.array() 最常见的创建数组的方法。

一些小tricks,np.zeros(),np.ones(),np.empty(),eye()(创建单位矩阵),np.arange()(range函数数组版)。
ndarray.astype() 用来转换数组的类型,如array.astype(np.int32),将array的dtype类型转换为int32.

切片索引,布尔型索引,花式索引(利用整数数组进行索引,将数据复制到新数组中,而前面两种索引只是在视图中进行操作)。

数组的切片转置等操作不会改变原数组,若要对原数组进行改变,则需重新赋值,如a=a.T。

一元ufunc(如abs,sign等),二元ufunc(如add,multiply,power等)

meshgrid函数建立网格,不好理解。

np.where(condition,x,y) 数组的三元表达式,相当于x if condition else y,挺有意思的一个函数。

一些数组统计方法,如:
mean,max,min, sum, cumsum, cumprod, argmin,argmax(返回第一个最小/最大元素的索引值),any,all。

sort函数会在原地改变数组,即改变原数组,与列表一致。

numpy 提供unique方法返回去重排序好的数组,相当于列表sort(set(list)).

数组的一些集合运算:
intersect1d(x, y) 返回交集
union1d(x, y) 并集
in1d(x, y) 根据x是否包含于y返回一个布尔型数组
setdiff1d(x, y) 集合差,在x中不在y中
setxor1d(x, y) 并集减去交集

np保存,读取数据:
保存一般用np.save(), np.savez()支持以压缩格式一次保存多个数组。
读取一般用np.load(),也有np.loadtxt()和np.genfromtxt()

矩阵乘法,np.dot(x,y)
np.linag中有一组标准的矩阵分解及求逆等运算的接口。

随机漫步。。。

你可能感兴趣的:(pandas数据分析进阶笔记(二):Numpy)