利用Python进行数据分析随笔记 四 (1)


tags:

  • 第四章 NumPy基础:数组和矢量计算
  • NumPy的ndarray:一种多维数组对象

NumPy的ndarray:一种多维数组对象

创建ndarray

1.使用array函数。它接受一切序列型的对象(包括其他数组),然后产生一个新的含有掺入数据的NumPy数组。以一个列表的转换为例:

1.png

2.嵌套序列,比如一组等长列表组成的列表,将会被转换成为一个多维数组:
ndarray.ndim
数组维数。
ndarray.shape
Tuple of array dimensions.
2.png

3.除了显示说明,np.arry会尝试为新建的这个数组推断出一个较为合适的数据类型。数据类型保存在dtype对象中。


3.png

4.除np.array外,可以新建数组的函数:
*zeros:创建指定长度或形状(shape)的全0数组
*ones:创建指定长度或形状的全1数组
*empty:创建一个没有任何具体值得数组(应该除了随机值需求不是很好用)
xxx((a,b,c,d,^,z))字母表示任意数字,最后一个值(z)是最内层元素个数(长度),倒数第n个值表示前一个子单位的个数

4.png

5.arrange是Python内置函数range的数组版
5.png

函数 说明
array 1.将输入数据转换为ndarray;2.指定dtype或默认推断出一个合适的dtype;3.默认直接复制输入数据
asarray 1.将输入数据转换为ndarray;2.如果输入本身就是ndarray不进行复制
arange 类似于内置的range,但返回的是一个ndarray对象而不是列表
ones_like/zeros_like/empty_like 以另一个数组为参数,并根据其形状和dtype创建一个全1/全0/全随机的数组
eye/identity 创建正方形对角线为1,其他全0的矩阵,eye一些属性可以改变这条对角线
ndarray的数据类型

1.通过'ndarray.astype'的方法显示转换数据类型(detype);
注意*浮点数转整数会失效
从NumPy 1.9开始,astype方法现在返回一个错误,如果要转换为的字符串dtype在“安全”转换模式下不够长,以保持正在转换的整数/浮点数组的最大值。以前,即使结果被截断,也允许进行转换。
*可以转换成其他变量的dtype


6.png

调用astype无论如何都会创建出一个新数组,即使dtype和老数据相同也是。


7.png
数组和标量之间的运算

NumPy中的数组可以不用编写循环即可以对数据执行执行批量运算。这通常就叫做矢量化。


8.png
基本的索引和切片

*一维数组和Python列表功能类似。但是。
不同1:当你给一个标量赋值给一个切片是(arr[5:8]=12),该值会自动传播(广播)到整个选区


9.png
9-1.png

python中不允许这样赋值


9-2.png

不同2:跟列表最重要的区别在于,数组切片是原始数组的视图。这意味着数据不会被赋值,视图上的任何修改都会直接反映到源数组上:
!!!完全是不一样的逻辑,有一种嫁鸡随鸡嫁狗随狗一辈子相依为命的感觉。


10.png

虽然惊讶,但是这是由于NumPyde 的设计目的是处理大数据,如果NumPy坚持要将数据复制来复制去会产生很大的性能和内存问题。(arr[5:8].copy可以解决如果不想要这种随之改变的效果,这里即arr_slice=arr[5:8].copy())

*之后感受一下二维数组的操作:


11.png

arr2d[0,2] 用法等价于 arr2d[0][2],但是前者更简单

*多维数组,如果省略了后面的索引,则返回对象会是一个维度第一点(低一个维度)的ndarray。返回的低维数组含有原始高维数组某条轴上的所有数据。(括号外面的“维度”是一维、二维、三维、四维之类的意思,二括号面的应该理解为“轴”)


12.png
12-1.png
切片索引

ndarray的切片语法和Python列表这样的以为对象差不多。
高纬度更多花样,可以在一个或多个轴上进行切片,也可以跟帧数索引混合使用。


13.png

** 布尔型索引**


14.png

这里可以看出目前版本负号的用法已经不可以了,另外这里&、|之类的布尔运算都有效,但是Python关键字and和or是在布尔类型数组中是无效的。


15.png
16.png

花式索引
花式索引是一个NumPy术语,它指的是利用整数数组进行索引。

18.png

numpy.reshape(a, newshape, order='C')[source]¶
Gives a new shape to an array without changing its data.

arr=np.arange(32).reshape((8,4))

arr
Out[2]: 
array([[ 0,  1,  2,  3],#0
       [ 4,  5,  6,  7],#1
       [ 8,  9, 10, 11],#2
       [12, 13, 14, 15],#3
       [16, 17, 18, 19],#4
       [20, 21, 22, 23],#5
       [24, 25, 26, 27],#6
       [28, 29, 30, 31]])#7

arr[[1,5,7,2],[0,3,1,2]]
Out[6]: array([ 4, 23, 29, 10])#即最终选出了(1,0)、(5,3)、(7,1)、(2,2)

想要得到矩阵的子集也是一个矩形区域,可以:


19.png

**花式索引和切片不同,它总是将数据复制到新数组中

数组专职和轴对换

array.T:转置(轴对换)
np.dot(a,b):array 'a'、'b'的矩阵内积
ndarray.transpose*轴)¶

返回轴转置的数组视图。

对于1-D阵列,这没有任何影响。(要在列向量和行向量之间切换,首先将1-D数组转换为矩阵对象。)对于2-D数组,这是通常的矩阵转置。对于nD阵列,如果给出轴,则它们的顺序表示轴的置换方式(参见示例)。如果没有提供轴 ,那么。
a.shape = (i[0], i[1], ... i[n-2], i[n-1]) a.transpose().shape = (i[n-1], i[n-2], ... i[1], i[0])
| 参数: |
axis:无,int的元组或n int

  • 无参数或无参数:反转轴的顺序。
  • 整数的元组:Ĵ在元组第地方意味着一个个轴变为a.transpose()Ĵ个轴。
  • n int:与相同整数的n元组相同(此形式仅作为元组形式的“便利”替代)
    所以arr.transpose((1,0,2))等于只是0,1轴置换
In [59]: arr1 = np.arange(12).reshape(2,2,3)

In [60]: arr1
Out[60]:
array([[[ 0,  1,  2],
        [ 3,  4,  5]],

       [[ 6,  7,  8],
        [ 9, 10, 11]]])

In [61]: arr1.shape #看形状
Out[61]: (2, 2, 3) #说明这是一个2*2*3的数组(矩阵),返回的是一个元组,可以对元组进行索引,也就是0,1,2
In [62]: arr1.transpose((1,0,2))
Out[62]:
array([[[ 0,  1,  2],
        [ 6,  7,  8]],

       [[ 3,  4,  5],
        [ 9, 10, 11]]])

ndarray.swapaxes(axis1, axis2
Return a view of the array with axis1 and axis2 interchanged.

20.png

你可能感兴趣的:(利用Python进行数据分析随笔记 四 (1))