上一篇博客介绍了numpy的几种初始化方式和numpy的数据类型(dtype)和shape的相关知识,这篇介绍numpy矩阵的索引与切片
numpy数组有一个很好的特性就是支持vectorization,大小相同的数组做任何操作将在元素级别进行运算,这意味着我们可以像使用matlab那样对数据进行操作
In [46]: a = np.array([[1,2,4],[3,5,6]])
In [47]: b = np.array([[2,3,7],[4,5,7]])
In [48]: a+b
Out[48]:
array([[ 3, 5, 11], [ 7, 10, 13]])
In [49]: a*b
Out[49]:
array([[ 2, 6, 28], [12, 25, 42]])
In [50]: a * a
Out[50]:
array([[ 1, 4, 16], [ 9, 25, 36]])
In [51]:
numpy还有一个很好的特性就是支持broadcasting,数组与标量的运算也将映射到元素级
In [51]: 1 + a
Out[51]:
array([[2, 3, 5], [4, 6, 7]])
In [52]: 2 * a + 3 *b
Out[52]:
array([[ 8, 13, 29], [18, 25, 33]])
In [53]:
(1)一维数组
很简单,就和普通的数组几乎一样
In [55]: c
Out[55]: array([1, 4, 5, 2, 6, 7])
In [56]: c[3] # 下标访问
Out[56]: 2
In [57]: c[2:4] # 切片也是个数组
Out[57]: array([5, 2])
In [58]: c[2:4] = 8 # 连续赋值支持broadcasting
In [59]: c
Out[59]: array([1, 4, 8, 8, 6, 7])
In [60]:
(2)多维数组
多维数组可做的事情很多,索引下标是维度较低的数组,我们以三维数组为例说明
<1> 基本的索引
In [60]: d = np.ones((3,4,4), dtype=np.int16)
In [61]: d
Out[61]:
array([[[1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1]],
[[1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1]],
[[1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1]]], dtype=int16)
In [62]: d += 4
In [63]: d
Out[63]:
array([[[5, 5, 5, 5], [5, 5, 5, 5], [5, 5, 5, 5], [5, 5, 5, 5]],
[[5, 5, 5, 5], [5, 5, 5, 5], [5, 5, 5, 5], [5, 5, 5, 5]],
[[5, 5, 5, 5], [5, 5, 5, 5], [5, 5, 5, 5], [5, 5, 5, 5]]], dtype=int16)
In [64]: d.shape
Out[64]: (3, 4, 4) # d是一个三维数组(3*4*4)
###########因为数组的维度为三,所以对其索引下标可以为标量或者是2维数组
In [65]: d[0]
Out[65]:
array([[5, 5, 5, 5], [5, 5, 5, 5], [5, 5, 5, 5], [5, 5, 5, 5]], dtype=int16)
In [66]: d[0].shape # d[0]也是个数组,维度为2,大小为4*4
Out[66]: (4, 4)
In [67]: d[1][1] # d[1][1]也是个数组,维度为1,大小是4
Out[67]: array([5, 5, 5, 5], dtype=int16)
In [68]: d[1,1] # 也可以采用此种索引方法
Out[68]: array([5, 5, 5, 5], dtype=int16)
In [69]: d[1,1] = 4 # broadcasting式的赋值
In [70]: d
Out[70]:
array([[[5, 5, 5, 5], [5, 5, 5, 5], [5, 5, 5, 5], [5, 5, 5, 5]],
[[5, 5, 5, 5], [4, 4, 4, 4], [5, 5, 5, 5], [5, 5, 5, 5]],
[[5, 5, 5, 5], [5, 5, 5, 5], [5, 5, 5, 5], [5, 5, 5, 5]]], dtype=int16)
In [71]: d[1,1] = np.array([7,8,9,10]) # 可以相同大小的数组进行赋值
In [72]: d
Out[72]:
array([[[ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5]],
[[ 5, 5, 5, 5], [ 7, 8, 9, 10], [ 5, 5, 5, 5], [ 5, 5, 5, 5]],
[[ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5]]], dtype=int16)
In [73]:
<2> 切片索引
In [73]: d
Out[73]:
array([[[ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5]],
[[ 5, 5, 5, 5], [ 7, 8, 9, 10], [ 5, 5, 5, 5], [ 5, 5, 5, 5]],
[[ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5]]], dtype=int16)
In [74]: d[:2] # 冒号前不写表示为0,冒号后不写表示到最后
Out[74]:
array([[[ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5]],
[[ 5, 5, 5, 5], [ 7, 8, 9, 10], [ 5, 5, 5, 5], [ 5, 5, 5, 5]]], dtype=int16)
In [75]: d[1:2, 1:2]
Out[75]: array([[[ 7, 8, 9, 10]]], dtype=int16)
In [76]: d[1:2, 1:2].shape
Out[76]: (1, 1, 4)
In [77]: d[1:2, 1:2] = 12 # 同样的赋值也是broadcasting式的
In [78]: d
Out[78]:
array([[[ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5]],
[[ 5, 5, 5, 5], [12, 12, 12, 12], [ 5, 5, 5, 5], [ 5, 5, 5, 5]],
[[ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5], [ 5, 5, 5, 5]]], dtype=int16)
<3> 布尔型索引
numpy数组还支持布尔型索引
In [80]: f = np.array([[1,3,5],[2,4,6]])
In [81]: f
Out[81]:
array([[1, 3, 5], [2, 4, 6]])
In [82]: f == 4 # 进行元素级别的比较,产生bool数组
Out[82]:
array([[False, False, False], [False, True, False]], dtype=bool)
In [83]: f[f==4] # 选取f中元素数值等于4的
Out[83]: array([4])
##############如果有多个选取条件,可以使用&\|这样的表达
In [84]: mask = (f == 4) | (f == 6)
In [85]: f[mask]
Out[85]: array([4, 6])
此篇就讲到这,下篇博客继续说