可使用类似标量的操作语法在整个数据块上进行计算。
In [1]: import numpy as np
In [2]: data = np.random.randn(2, 3)
In [3]: data
Out[3]:
array([[-1.33289607, 0.65042734, 0.50607835],
[-2.24144872, 0.46766847, -0.46282393]])
In [4]: data * 10
Out[4]:
array([[-13.32896071, 6.50427341, 5.06078345],
[-22.41448722, 4.67668469, -4.62823931]])
In [5]: data + data
Out[5]:
array([[-2.66579214, 1.30085468, 1.01215669],
[-4.48289744, 0.93533694, -0.92564786]])
一个ndarray是一个通用的多维同类数据容器。每一个数组都有一个shape属性,表征数组每一维度的数量;还有一个dtype属性,描述数组的数据类型。
In [6]: data.shape
Out[6]: (2, 3)
In [7]: data.dtype
Out[7]: dtype('float64')
生成 ndarray
使用 array 函数
In [8]: data1 = [6, 7.5, 8, 0, 1]
In [9]: arr1 = np.array(data1)
In [10]: arr1
Out[10]: array([6. , 7.5, 8. , 0. , 1. ])
In [11]:
In [11]: data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
In [12]: data2
Out[12]: [[1, 2, 3, 4], [5, 6, 7, 8]]
In [13]: arr2 = np.array(data2)
In [14]: arr2
Out[14]:
array([[1, 2, 3, 4],
[5, 6, 7, 8]])
In [15]: arr2.ndim
Out[15]: 2
In [16]: arr2.shape
Out[16]: (2, 4)
In [17]: arr1.dtype
Out[17]: dtype('float64')
In [18]: arr2.dtype
Out[18]: dtype('int32')
除了 np.array,还有其它函数创建数组。
In [19]: np.zeros(10)
Out[19]: array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
In [20]: np.zeros((3, 6))
Out[20]:
array([[0., 0., 0., 0., 0., 0.],
[0., 0., 0., 0., 0., 0.],
[0., 0., 0., 0., 0., 0.]])
In [21]: np.ones((2, 2))
Out[21]:
array([[1., 1.],
[1., 1.]])
In [22]: np.empty((2, 3, 2))
Out[22]:
array([[[2.87e-322, 0.00e+000],
[0.00e+000, 0.00e+000],
[0.00e+000, 0.00e+000]],
[[0.00e+000, 0.00e+000],
[0.00e+000, 0.00e+000],
[0.00e+000, 0.00e+000]]])
可见,用np.empty生成全0的数组并不可靠,因为可能会返回未初始化的垃圾值。
arange 是Python内建函数 range 数组版。
In [23]: np.arange(15)
Out[23]: array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14])