学习地址:http://old.sebug.net/paper/books/scipydoc/numpy_intro.html
import numpy as np
1. 创建
np.array([[1,2,3],[4,5,6]])
np.arange(1,10,1) #使用开始值、终值和步长来创建一维数组,注意数组不包括终值
np.linspace(1,10,8) #开始值、终值和步长来创建一维数组,包括终值
np.logspace(0,2,20) #等比数列
2. 存取
- 通过下标范围获取的新的数组是原始数组的一个视图。它与原始数组共享同一块数据空间
\>>>b = a[3:7] # 通过下标范围产生一个新的数组b,b和a共享同一块数据空间
\>>>b
array([101, 4, 5, 6])
\>>>b[2] = -10 # 将b的第2个元素修改为-10
\>>>b
array([101, 4, -10, 6])
\>>>a # a的第5个元素也被修改为10
array([ 0, 1, 100, 101, 4, -10, 6, 7, 8, 9])
- 使用整数序列作为下标获得的数组不和原始数组共享数据空间
\>>> x = np.arange(10,1,-1)
\>>> x
array([10, 9, 8, 7, 6, 5, 4, 3, 2])
\>>> x[[3, 3, 1, 8]] # 获取x中的下标为3, 3, 1, 8的4个元素,组成一个新的数组
array([7, 7, 9, 2])
\>>> b = x[np.array([3,3,-3,8])] #下标可以是负数
\>>> b[2] = 100
\>>> b
array([7, 7, 100, 2])
\>>> x # 由于b和x不共享数据空间,因此x中的值并没有改变
array([10, 9, 8, 7, 6, 5, 4, 3, 2])
\>>> x[[3,5,1]] = -1, -2, -3 # 整数序列下标也可以用来修改元素的值
\>>> x
array([10, -3, 8, -1, 6, -2, 4, 3, 2])
- 使用布尔数组作为下标获得的数组不和原始数组共享数据空间,注意这种方式只对应于布尔数组,不能使用布尔列表。
\>>> x = np.random.rand(10) # 产生一个长度为10,元素值为0-1的随机数的数组
\>>> x
array([ 0.72223939, 0.921226 , 0.7770805 , 0.2055047 , 0.17567449,0.95799412, 0.12015178, 0.7627083 , 0.43260184, 0.91379859])
\>>> x>0.5
\>>> # 数组x中的每个元素和0.5进行大小比较,得到一个布尔数组,True表示x中对应的值大于0.5
array([ True, True, True, False, False, True, False, True, False, True], dtype=bool)
\>>> x[x>0.5]
\>>> # 使用x>0.5返回的布尔数组收集x中的元素,因此得到的结果是x中所有大于0.5的元素的数组
array([ 0.72223939, 0.921226 , 0.7770805 , 0.95799412, 0.7627083 , 0.91379859])
3.结构
假设我们需要定义一个结构数组,它的每个元素都有name, age和weight字段。在NumPy中可以如下定义:
import numpy as np
persontype = np.dtype({
'names':['name', 'age', 'weight'],
'formats':['S32','i', 'f']})
a = np.array([("Zhang",32,75.5),("Wang",24,65.2)],
dtype=persontype)
我们先创建一个dtype对象persontype,通过其字典参数描述结构类型的各个字段。字典有两个关键字:names,formats。每个关键字对应的值都是一个列表。
names定义结构中的每个字段名,而formats则定义每个字段的类型
S32 : 32个字节的字符串类型,由于结构中的每个元素的大小必须固定,因此需要指定字符串的长度:
i : 32bit的整数类型,相当于np.int32
f : 32bit的单精度浮点数类型,相当于np.float32
然后我们调用array函数创建数组,通过关键字参数 dtype=persontype, 指定所创建的数组的元素类型为结构persontype。运行上面程序之后,我们可以在IPython中执行如下的语句查看数组a的元素类型.
>>> a.dtype
dtype([('name', '|S32'), ('age', '
这里我们看到了另外一种描述结构类型的方法: 一个包含多个组元的列表,其中形如 (字段名, 类型描述) 的组元描述了结构中的每个字段。类型描述前面为我们添加了 '|', '<' 等字符,这些字符用来描述字段值的字节顺序:
| : 忽视字节顺序 < : 低位字节在前
> : 高位字节在前