NDArray指南

在MXNET中最主要的一个对象就是由mxnet.ndarray或者mxnet.nd(缩写)包提供的多维数组。如果你熟悉python的科学计算包Numpy,那么你会发现mxnet.ndarray和numpy.ndarry在很多方面都很相似。

基础
一个多维数组是一个具有相同类型的数表。举个例子,3维空间中的一个点的坐标[1,2,3]是一个长度为3的一维数组。下图展示了一个二维数组。第一维的长度是2,第二维的长度是3

[[0, 1, 2]
 [3, 4, 5]]

这个数组的类型就叫做NDArray。一个NDArray对象的重要属性:

  • ndarray.shape 数组的维度。它是一个整数组成的tuple,表示各维度的长度。对于一个n行m列的矩阵,它的shape就是(n,m)。
  • ndarry.dtype 一个用来描述元素类型的numpy对象。
  • ndarray.size 数组中数字的总数,也就是shape中的元素的乘积
  • ndarray.context 存储数组的设备。可以使cpu也可是i-th gpu

创建数组
创建数组可以有很多方式。举个例子,我们可以通过使用array函数,利用python中常规的list或者tuple中创建数组

import mxnet as mx
# create a 1-dimensional array with a python list
a = mx.nd.array([1,2,3])
# create 2-dimensional array with a nested python list
b = mx.nd.array([[1,2,3],[2,3,4]])
{'a.shape':a.shape,'b.shape':b.shape}
{'a.shape': (3L,), 'b.shape': (2L, 3L)}

也可以使用使用 numpy.ndarray对象

import numpy as np
import math
c = np.arrange(15).reshape(3,5)
# create a 2-dimensional array from a numpy.ndarray object
a = mx.nd.array(c)
{'a.shape':a.shape}
{'a.shape':(3L,5L)}

我们可以使用可选参数dtype来指定元素类型,它接受numpy类型。默认使用float32。

# float32 is used in default
a = mx.nd.array([1,2,3])
# create an int32 array
b = mx.nd.array([1,2,3],dtype=np.int32)
# create a 16-bit float array
c = mx.nd.array([1.2,2.3],dtype=np.float16)
(a.dtype,b.dtype,c.dtype)
(numpy.float32, numpy.int32, numpy.float16)

如果我们只知道大小而不知道元素的值,有几个函数可以创建并初始化占位符内容

# create a 2-dimensional array full of zeros with shape(2,3)
a = mx.nd.zeros((2,3))
# create a same shape array full of ones
b = mx.nd.ones((2,3))
# create a same shape array with all elements set to 7
c = mx. nd.full((2,3),7)
# create a same shape whose initial content is random and
# depends on the state of the memory
d = mx.nd.empty((2,3))

打印数组
为了能够打印,我们一般会使用asnumpy函数把NDArray转换成numpy.ndarray。Numpy使用下面的布局设计:

  • 从左到右打印最后一个维度
  • 从上到下打印倒数第二个维度
  • 剩下的也是从上到下打印,每片由一个空行隔开
b = mx.nd.ones((2,3))
b.asnumpy()
array([[1.,1.,1.],
          [1.,1.,1.]],dtype=float32)

基本操作
在数组上使用算术运算符进行按元素操作。就会创建一个新的数组,并填充结果。

a = mx.nd.ones((2,3))
b = mx.nd.ones((2,3))
# elementwise plus 按元素加
c = a+b
# elementwise minus 按元素减
d = - c
# elementwise pow and sin,and then transpose 按元素平方,在求sin,最后进行转置
e = mx.nd.sin(c**2).T
# elementwise max 按元素求最大
f = mx.nd.maximum(a,c)
f.asnumpy()
array([[ 2.,  2.,  2.],
       [ 2.,  2.,  2.]], dtype=float32)

和Numpy相似,*被用来做按元素乘积,而矩阵和矩阵的乘积使用dot

a = mx.nd.ones((2,2))
b = a * a
c = mx.nd.dot(a,a)
{'b':b.asnumpy(),'c':c.asnumpy()}
{'b': array([[ 1.,  1.],
        [ 1.,  1.]], dtype=float32), 'c': array([[ 2.,  2.],
        [ 2.,  2.]], dtype=float32)}

像 += 和 *= 这样的赋值运算符,用来修改已经存在的数组而不是创建新的

a = mx.nd.ones((2,2))
b = mx.nd.ones(a.shape)
b += a
b.asnumpy()

索引和切片
切片操作符[]作用在第一个维上

a = mx.nd.array(np.arange(6).reshape(3,2))
a[1:2] = 1 # 第2行开始,不取到第3行(我觉得意思是把第二行都改成1)
#a[0:2] 第1行开始,不取到第3行
a[:].asnumpy()
array([[ 0.,  1.],
       [ 1.,  1.],
       [ 4.,  5.]], dtype=float32)

我们也用slice_axis方法来切取一个特定的维度

d = mx.nd.slice_axis(a,axis=1,begin=1,end=2) #切取第二维的数据,从第2列开始,不取到第3列(我觉得意思是只取第二列的数据)
d.asnumpy()
array([[ 1.],
       [ 1.],
       [ 5.]], dtype=float32)

shape操作
只要大小保持不变,数组的形状就可以改变

a = mx.nd.array(np.arange(24))
b = a.reshape((2,3,4))
b.asnumpy()
array([[[  0.,   1.,   2.,   3.],
        [  4.,   5.,   6.,   7.],
        [  8.,   9.,  10.,  11.]],

       [[ 12.,  13.,  14.,  15.],
        [ 16.,  17.,  18.,  19.],
        [ 20.,  21.,  22.,  23.]]], dtype=float32)

方法concatenate沿着第一个维度堆叠多个数组。 (他们的形状必须相同)。

a = mx.nd.ones((2,3))
b = mx.nd.ones((2,3))*2
c.asnumpy()
array([[ 1.,  1.,  1.],
       [ 1.,  1.,  1.],
       [ 2.,  2.,  2.],
       [ 2.,  2.,  2.]], dtype=float32)

降维
我们可以将数组降成一个标量

a = mx.nd.ones((2,3))
b = mx.nd.sum(a)
b.asnumpy()
array([ 6.], dtype=float32)

或者沿着特定的一个维度

c = mx.nd.sum_axis(a,axis=1)#沿着第二维相加 即列相加
c.asnumpy()
array([ 3.,  3.], dtype=float32)

广播
我们可以通过复制来传播数组。下面的代码沿着第二维度传播:

a  = mx.nd.array(np.arange(6).reshape(6,1))
b = a.broadcast_to((6,2))
b.asnumpy()
array([[ 0.,  0.],
       [ 1.,  1.],
       [ 2.,  2.],
       [ 3.,  3.],
       [ 4.,  4.],
       [ 5.,  5.]], dtype=float32)

你可能感兴趣的:(NDArray指南)