NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。随着大数据技术不断发展,numpy在数据处理中的作用越来越重要。
Numpy中最重要的数据结构是ndarray,下面我们将从多种方式来创建ndarray。
#一维数组
a = np.array([0, 1, 2, 3, 4])
print(a, type(a))
# [0 1 2 3 4]
#二维数组
c = np.array([[1, 2, 3],
[6, 7, 8],
[3, 4, 5]])
#三维数组
d = np.array([[(8, 2, 3), (4, 5, 6)],
[(3, 2, 1), (4, 5, 6)]])
array()和asarray()的区别如下:
当数据源是ndarray 时,array()仍然会 copy 出一个副本,占用新的内存;
当数据源是ndarray并且不改变 dtype 时,asarray()不会占用新内存,但改变dtype时,asarray()会占用新内存。
占用新内存意味着新创建的ndarray数据不随原array()数据改变而改变。
import numpy as np
x = np.array([[1, 1, 1], [1, 1, 1], [1, 1, 1]], dtype=np.int)
y = np.array(x)
z = np.asarray(x)
w = np.asarray(x, dtype=np.float) # 改变dtype类型
# 改变x中某个值
x[1][2] = 2
print(x,type(x),x.dtype)
# [[1 1 1]
# [1 1 2]
# [1 1 1]] int32
print(y,type(y),y.dtype)
# [[1 1 1]
# [1 1 1]
# [1 1 1]] int32
print(z,type(z),z.dtype)
# [[1 1 1]
# [1 1 2]
# [1 1 1]] int32
print(w,type(w),w.dtype)
# [[1 1 1]
# [1 1 1]
# [1 1 1]] float64
通过在每个坐标上执行一个函数来构造数组
import numpy as np
def f(x, y):
return x + y
x = np.fromfunction(f, (5, 4), dtype=int)
print(x)
# [[0 1 2 3]
# [1 2 3 4]
# [2 3 4 5]
# [3 4 5 6]
# [4 5 6 7]]
zeros()函数:返回给定形状和类型的零数组。
zeros_like()函数:返回与给定数组形状和类型相同的零数组。
import numpy as np
x = np.zeros(3)
print(x) # [0. 0. 0.]
x = np.zeros([2, 3])
print(x)
# [[0. 0. 0.]
# [0. 0. 0.]]
x = np.array([[1, 2, 3], [4, 5, 6]])
y = np.zeros_like(x)
print(y)
# [[0 0 0]
# [0 0 0]]
ones()函数:返回给定形状和类型的1数组。
ones_like()函数:返回与给定数组形状和类型相同的1数组。
把0数组中数字“0”变成数字“1,其余与0数组完全一样。
empty()函数:返回一个空数组,数组元素为随机数。
empty_like函数:返回与给定数组具有相同形状和类型的新数组。
把0数组中数字“0”变成随机数,其余与0数组完全一样。
eye()函数:返回一个对角线上为1,其它地方为零的单位数组。identity()函数:返回一个方的单位数组。
import numpy as np
x = np.eye(4)
print(x)
# [[1. 0. 0. 0.]
# [0. 1. 0. 0.]
# [0. 0. 1. 0.]
# [0. 0. 0. 1.]]
x = np.eye(2, 3)
print(x)
# [[1. 0. 0.]
# [0. 1. 0.]]
x = np.identity(4)
print(x)
# [[1. 0. 0. 0.]
# [0. 1. 0. 0.]
# [0. 0. 1. 0.]
# [0. 0. 0. 1.]]
diag()函数:有两个功能,一是提取数组的对角线,二是构造对角数组。
import numpy as np
# 提取数组对角线
x = np.arange(9).reshape((3, 3))
print(x)
# [[0 1 2]
# [3 4 5]
# [6 7 8]]
print(np.diag(x)) # [0 4 8]
print(np.diag(x, k=1)) # [1 5]
print(np.diag(x, k=-1)) # [3 7]
# 构建对角数组
v = [1, 3, 5, 7]
x = np.diag(v)
print(x)
# [[1 0 0 0]
# [0 3 0 0]
# [0 0 5 0]
# [0 0 0 7]]
full()函数:返回一个常数数组。
full_like()函数:返回与给定数组具有相同形状和类型的常数数组。
import numpy as np
x = np.full(2, 5)
print(x)
# [5 5]
x = np.full((2, 3), 7)
print(x)
# [[7 7 7]
# [7 7 7]]
x = np.array([[1, 2, 3], [4, 5, 6]])
y = np.full_like(x, 6)
print(y)
# [[6 6 6]
# [6 6 6]]
import numpy as np
x = np.arange(5)
print(x) # [0 1 2 3 4]
x = np.arange(3, 7, 2)
print(x) # [3 5]
x = np.logspace(0, 1, 5)
print(np.around(x, 2))
# [0. 0.25 0.5 0.75 1. 1.25 1.5 1.75 2. ]
x = np.linspace(start=0, stop=1, num=5) # 解释了np.logspace()函数
x = [10 ** i for i in x]
print(np.around(x, 2)) # np.around 返回四舍五入后的值,可指定精度。
# [ 1. 1.78 3.16 5.62 10. ]
x = np.random.random(5)
print(x)
# [ 1. 1.78 3.16 5.62 10. ]
x = np.random.random([2, 3])
print(x)
# [0.41768753 0.16315577 0.80167915 0.99690199 0.11812291]
# [[0.41151858 0.93785153 0.57031309]
# [0.13482333 0.20583516 0.45429181]]
import numpy as np
personType = np.dtype({
'names': ['name', 'age', 'weight'],
'formats': ['U30', 'i8', 'f8']})
a = np.array([('yiyi', 18, 50), ('dawang', 20, 57.)],
dtype=personType)
print(a, type(a))
# [('yiyi', 18, 50.) ('dawang', 20, 57.)]
#
import numpy as np
personType = np.dtype([('name', 'U30'), ('age', 'i8'), ('weight', 'f8'), ('height', 'f8')])
a = np.array([('yiyi', 18, 50, 161), ('dawang', 20, 57, 170)],
dtype=personType)
print(a, type(a))
# [('yiyi', 18, 50., 161.) ('dawang', 20, 57., 170.)]
#
# 结构数组也可以通过下标取得元素
print(a[0])
# ('yiyi', 18, 50., 161.)
# 我们可以使用字段名作为下标获取对应的值
print(a['name'])
# ['yiyi' 'dawang']
print(a['height'])
# [161. 170.]
print(a['age'])
# [18 20]
print(a['weight'])
# [[50. 57.]
类型 | 备注 |
---|---|
布尔类型(b) | ‘b1’ : |
整形(i) | ‘i1’, ‘i2’, ‘i4’, ‘i8’ : |
无符号整型(u) | ‘u1’, ‘u2’ ,‘u4’ ,‘u8’ : |
浮点型(f) | ‘f2’, ‘f4’, ‘f8’ : |
字符串(U) | ‘U5’ : |
import numpy as np
a = np.array([1, 2, 3, 4, 5])
print(a.shape) # (5,)
print(a.dtype) # int32
print(a.size) # 5
print(a.ndim) # 1
print(a.itemsize) # 4
b = np.array([[1, 2, 3], [4, 5, 6.0]])
print(b.shape) # (2, 3)
print(b.dtype) # float64
print(b.size) # 6
print(b.ndim) # 2
print(b.itemsize) # 8
# 在ndarray中所有元素必须是同一类型,否则会自动向下转换,int->float->str。
a = np.array([1, 2, 3, 4, 5])
print(a) # [1 2 3 4 5]
b = np.array([1, 2, 3, 4, '5'])
print(b) # ['1' '2' '3' '4' '5']
c = np.array([1, 2, 3, 4, 5.0])
print(c) # [1. 2. 3. 4. 5.]