Numpy高级索引

Numpy比Python提供更多的索引方式,有助于我们提取数据,这里说一下整数数组索引,布尔索引和花式索引。

整数数组索引:
例1:
import numpy as np
x = np.array([[1,  2],  [3,  4],  [5,  6]]) 
y = x[[0,1,2],  [0,1,0]]
print (y)

读一下代码,然后我们看输出结果:取得的是(0,0),(1,1)和(2,0)的位置的元素。

x[[0,1,2],[0.1.0]]获取方式是:第一个列表[0,1,2]表示行索引,第二个列表[0,1,0]表示列索引。

所以选取的第一个元素是(0,0)位置处的元素,第二元素是(1,1)位置处的元素,第三个元素是(2,0)位置处的元素。

运行结果:

[1  4  5]
例2:
import numpy as np

x = np.array([[  0,  1,  2],[  3,  4,  5],[  6,  7,  8],[  9,  10,  11]])
print ('我们的数组是:' )
print (x)
print ('\n')
rows = np.array([[0,0],[3,3]]) #这里是希望获取的数据生成二维数组
cols = np.array([[0,2],[0,2]])
y = x[rows,cols]
print  ('这个数组的四个角元素是:')
print (y)

这里是一个4*3的二维数组,行索引是[0,0]和[3,3],列索引是[0,2]和[0,2]

这里将行索引和列索引分开是为了使输出的结果也是多维的,因为要输出四个角的元素,所以这里生成二维数组。

如果写成 rows = np.array([0,0,3,3]) cols = np.array([0,2,0,2])获得的数组是一维的。

运行结果:

我们的数组是:
[[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]


这个数组的四个角元素是:
[[ 0  2]
 [ 9 11]]
例3:
import numpy as np

a = np.array([[1,2,3], [4,5,6],[7,8,9]])
b = a[1:3, 1:3]
c = a[1:3,[1,2]]
d = a[:,1:]
print(b)
print(c)
print(d)

这里是将切片与索引结合,这里注意:切片包含开始不包含结尾!!!!

运行结果:

[[5 6]
 [8 9]]
[[4 6]
 [7 9]]
[[2 3]
 [5 6]
 [8 9]]
布尔索引:
例1:
import numpy as np

x = np.array([[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 10, 11]])
print('我们的数组是:')
print(x)
print('\n')
# 现在我们会打印出大于 5 的元素
b = x>5
print("布尔数组为:\n",b)
print('大于 5 的元素是:')
print(x[b])

运行结果:

我们的数组是:
[[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]
布尔数组为:
 [[False False False]
 [False False False]
 [ True  True  True]
 [ True  True  True]]
大于 5 的元素是:
[ 6  7  8  9 10 11]

这里我们通过布尔运算(如比较运算符)生成一个布尔数组,然后选取符合条件的元素。

布尔数组和原素组元素一一对应,true就会显示,false不会显示。

例2:
import numpy as np

a = np.array([np.nan,  1,2,np.nan,3,4,5])
print (a)
print (a[~np.isnan(a)])

输出结果:

[nan  1.  2. nan  3.  4.  5.]
[1. 2. 3. 4. 5.]

这里我们可以看出在数组中有NaN,这里我们用到了~(取补运算符)过滤NaN。先判断是否是NaN,返回布尔类型,再取补。

例3:
import numpy as np

a = np.array([1,  2+6j,  5,  3.5+5j])
print(a[np.iscomplex(a)])
print(a[~np.iscomplex(a)])

运行结果:

[2. +6.j 3.5+5.j]
[1.+0.j 5.+0.j]

这里我们将数组中的非负数过滤掉,同样如果要过滤复数需要使用取补运算符,但是这里也会吧实数变成带虚部的形式。

花式索引

花式索引指的是利用整数数组进行索引。

花式索引根据索引数组的值作为目标数组的某个轴的下标来取值。对于使用一维整型数组作为索引,如果目标是一维数组,那么索引的结果就是对应位置的元素;如果目标是二维数组,那么就是对应下标的行。

花式索引跟切片不一样,它总是将数据复制到新数组中。

例1:
import numpy as np

x=np.arange(32).reshape((8,4))
print (x)
print (x[[4,2,1,7]])

同样这里是先行索引,再列索引,这里只有一个列表,所以表示的是行索引。选取数组的角标为4,2,1,7的整行元素。

运行结果:

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]
 [16 17 18 19]
 [20 21 22 23]
 [24 25 26 27]
 [28 29 30 31]]

[[16 17 18 19]
 [ 8  9 10 11]
 [ 4  5  6  7]
 [28 29 30 31]]

同时这里也可以使用倒序索引数组。注意的是倒序索引时倒数“-1”表示倒数第一行而不是“0”!

import numpy as np

x=np.arange(32).reshape((8,4))
print (x)
print (x[[-4,-2,-1,-7]])

运行结果:

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]
 [16 17 18 19]
 [20 21 22 23]
 [24 25 26 27]
 [28 29 30 31]]
[[16 17 18 19]
 [24 25 26 27]
 [28 29 30 31]
 [ 4  5  6  7]]

例2:

当我们需要取得具体一个或者几个元素时我们可以使用np.ix_

import numpy as np

x=np.arange(32).reshape((8,4))
print (x)
print (x[np.ix_([1,5,7,2],[0,3,1,2])])

这里行索引的每一个元素和列索引的每一个元素都要匹配一次,如行索引第一个元素“1”分别对应列索引的每一个元素,索引取得的数组为[[1,0],[1,3],[1,1],[1,2]]这样的顺序。

同时如果要取某一个特定的元素也可以这样获取。

运行结果:

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]
 [16 17 18 19]
 [20 21 22 23]
 [24 25 26 27]
 [28 29 30 31]]
[[ 4  7  5  6]
 [20 23 21 22]
 [28 31 29 30]
 [ 8 11  9 10]]

你可能感兴趣的:(Numpy,#随笔)