什么是 NumPy 呢?
NumPy 这个词来源于两个单词 – Numerical
和Python
。其是一个功能强大的 Python 库,可以帮助程序员轻松地进行数值计算,通常应用于以下场景:
Python只定义一种整数类型,一种浮点类型。这在不需要关心数据在计算机中表示的所有方式的应用中是方便的。然而,对于科学计算,通常需要更多的控制。
导入 numpy。
import numpy as np
numpy 提供的最重要的数据结构是ndarray
,它是 python 中list
的扩展。
利用现有数据
numpy.array(object, dtype=None, copy=True, order='K', subok=False, ndmin=0)
【例】
import numpy as np
# 创建一维数组
a = np.array([0, 1, 2, 3, 4])
b = np.array((0, 1, 2, 3, 4))
print(a, type(a))
# [0 1 2 3 4]
print(b, type(b))
# [0 1 2 3 4]
# 创建二维数组
c = np.array([[11, 12, 13, 14, 15],
[16, 17, 18, 19, 20],
[21, 22, 23, 24, 25],
[26, 27, 28, 29, 30],
[31, 32, 33, 34, 35]])
print(c, type(c))
# [[11 12 13 14 15]
# [16 17 18 19 20]
# [21 22 23 24 25]
# [26 27 28 29 30]
# [31 32 33 34 35]]
# 创建三维数组
d = np.array([[(1.5, 2, 3), (4, 5, 6)],
[(3, 2, 1), (4, 5, 6)]])
print(d, type(d))
# [[[1.5 2. 3. ]
# [4. 5. 6. ]]
#
# [[3. 2. 1. ]
# [4. 5. 6. ]]]
array()
和asarray()
都可以将结构数据转化为 ndarray,但是主要区别就是当数据源是 ndarray 时,array()
仍然会 copy 出一个副本,占用新的内存,但不改变 dtype 时 asarray()
不会。
numpy.asarray(a, dtype = None, order = None)
def asarray(a, dtype=None, order=None):
return array(a, dtype, copy=False, order=order)
【例】
import numpy as np
x = [[1, 1, 1], [1, 1, 1], [1, 1, 1]]
y = np.array(x)
z = np.asarray(x)
x[1][2] = 2
print(x)
# [[1, 1, 1], [1, 1, 2], [1, 1, 1]]
print(y)
# [[1 1 1]
# [1 1 1]
# [1 1 1]]
print(z)
# [[1 1 1]
# [1 1 1]
# [1 1 1]]
【例】
import numpy as np
x = np.array([[1, 1, 1], [1, 1, 1], [1, 1, 1]])
y = np.array(x)
z = np.asarray(x)
w = np.asarray(x, dtype=np.int)
x[1] = 2
print(x)
# [[1. 1. 1.]
# [2. 2. 2.]
# [1. 1. 1.]]
print(y)
# [[1. 1. 1.]
# [1. 1. 1.]
# [1. 1. 1.]]
print(z)
# [[1. 1. 1.]
# [2. 2. 2.]
# [1. 1. 1.]]
print(w)
# [[1 1 1]
# [1 1 1]
# [1 1 1]]
【例】
import numpy as np
x = np.array([[1, 1, 1], [1, 1, 1], [1, 1, 1]])
print(x, x.dtype)
# [[1 1 1]
# [1 1 1]
# [1 1 1]] int32
x.dtype = np.float
# ValueError: When changing to a larger dtype, its size must be a divisor of the total size in bytes of the last axis of the array.
利用 Ones 和 zeros 填充方式
在机器学习任务中经常做的一件事就是初始化参数,需要用常数值或者随机值来创建一个固定大小的矩阵。
numpy.zeros(shape, dtype=float, order='C')
返回给定形状和类型的新数组,并用零填充。numpy.zeros_like(a, dtype=None, order='K', subok=True, shape=None)
Return an array of zeros with the same shape and type as a given array.【例】
import numpy as np
x = np.zeros(5)
print(x) # [0. 0. 0. 0. 0.]
x = np.zeros([2, 3])
print(x)
# [[0. 0. 0.]
# [0. 0. 0.]]
x = np.array([[1, 2, 3], [4, 5, 6]])
y = np.zeros_like(x)
print(y)
# [[0 0 0]
# [0 0 0]]
numpy.ones(shape, dtype=float, order='C')
返回给定形状和类型的新数组,并填充为1。numpy.ones_like(a, dtype=None, order='K', subok=True, shape=None)
Return an array of ones with the same shape and type as a given array.【例】
import numpy as np
x = np.ones(5)
print(x) # [1. 1. 1. 1. 1.]
x = np.ones([2, 3])
print(x)
# [[1. 1. 1.]
# [1. 1. 1.]]
x = np.array([[1, 2, 3], [4, 5, 6]])
y = np.ones_like(x)
print(y)
# [[1 1 1]
# [1 1 1]]
numpy.empty(shape, dtype=float, order='C')
返回一个空数组,数组元素为随机数。numpy.empty_like(prototype, dtype=None, order='K', subok=True, shape=None)
Return a new array with the same shape and type as a given array.【例】
import numpy as np
x = np.empty(5)
print(x)
# [1.95821574e-306 1.60219035e-306 1.37961506e-306 9.34609790e-307
# 1.24610383e-306]
x = np.empty((3, 2))
print(x)
# [[1.60220393e-306 9.34587382e-307]
# [8.45599367e-307 7.56598449e-307]
# [1.33509389e-306 3.59412896e-317]]
x = np.array([[1, 2, 3], [4, 5, 6]])
y = np.empty_like(x)
print(y)
# [[ 7209029 6422625 6619244]
# [ 100 707539280 504]]
numpy.full(shape, fill_value, dtype=None, order='C')
返回一个常数数组。numpy.full_like(a, fill_value, dtype=None, order='K', subok=True, shape=None)
Return a full array with the same shape and type as a given array.【例】
import numpy as np
x = np.full((2,), 7)
print(x)
# [7 7]
x = np.full((2, 7), 7)
print(x)
# [[7 7 7 7 7 7 7]
# [7 7 7 7 7 7 7]]
x = np.array([[1, 2, 3], [4, 5, 6]])
y = np.full_like(x, 7)
print(y)
# [[7 7 7]
# [7 7 7]]
numpy.eye(N, M=None, k=0, dtype=)
返回一个二维数组,对角线上为1,其他地方为零。numpy.identity(n, dtype=None)[source]
Return the identity array,The identity array is a square array with ones on the main diagonal.【例】
import numpy as np
x = np.eye(4)
print(x)
# [[1. 0. 0. 0.]
# [0. 1. 0. 0.]
# [0. 0. 1. 0.]
# [0. 0. 0. 1.]]
x = np.eye(2, 3)
print(x)
# [[1. 0. 0.]
# [0. 1. 0.]]
x = np.identity(4)
print(x)
# [[1. 0. 0. 0.]
# [0. 1. 0. 0.]
# [0. 0. 1. 0.]
# [0. 0. 0. 1.]]
利用数值范围
numpy.arange([start, ]stop, [step, ]dtype=None)
返回给定间隔内的均匀间隔的值。numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
返回指定间隔内的等间隔数字。numpy.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None, axis=0)
返回数以对数刻度均匀分布。numpy.random.random(size=None)
返回一个由[0,1)内的随机数组成的数组。【例】
import numpy as np
x = np.arange(5)
print(x) # [0 1 2 3 4]
x = np.arange(3, 7, 2)
print(x) # [3 5]
x = np.linspace(start=0, stop=2, num=9)
print(x)
# [0. 0.25 0.5 0.75 1. 1.25 1.5 1.75 2. ]
x = np.random.random(5)
print(x) # [0.19918248 0.37849338 0.53131778 0.54145778 0.54659923]
x = np.random.random([2, 3])
print(x)
# [[0.64563931 0.81257475 0.05123273]
# [0.21415045 0.98966487 0.71510226]]
【例】
import numpy as np
x = np.linspace(0, 1, 5)
print(x)
# [0. 0.25 0.5 0.75 1. ]
x = np.logspace(0, 1, 5)
print(np.around(x, 2))
# [ 1. 1.78 3.16 5.62 10. ]
x = [10 ** i for i in x]
print(np.around(x, 2))
# [ 1. 1.78 3.16 5.62 10. ]
在使用 numpy 时,你会想知道数组的某些信息。很幸运,在这个包里边包含了很多便捷的方法,可以给你想要的信息。
numpy.ndarray.ndim
用于返回数组的维数(轴的个数)也称为秩,一维数组的秩为 1,二维数组的秩为 2,以此类推。numpy.ndarray.shape
表示数组的维度,返回一个元组,这个元组的长度就是维度的数目,即 ndim
属性(秩)。numpy.ndarray.size
数组中所有元素的总量,相当于数组的shape
中所有元素的乘积,例如矩阵的元素总量为行与列的乘积。numpy.ndarray.dtype
ndarray
对象的元素类型。numpy.ndarray.itemsize
以字节的形式返回数组中每一个元素的大小。【例】
import numpy as np
a = np.array([1, 2, 3, 4, 5])
print(a.shape) # (5,)
print(a.dtype) # int32
print(a.size) # 5
print(a.ndim) # 1
print(a.itemsize) # 4
b = np.array([[1, 2, 3], [4, 5, 6.0]])
print(b.shape) # (2, 3)
print(b.dtype) # float64
print(b.size) # 6
print(b.ndim) # 2
print(b.itemsize) # 8
在ndarray
中所有元素必须是同一类型,否则会自动向下转换,int->float->str
。
【例】
import numpy as np
a = np.array([1, 2, 3, 4, 5])
print(a) # [1 2 3 4 5]
b = np.array([1, 2, 3, 4, '5'])
print(b) # ['1' '2' '3' '4' '5']
c = np.array([1, 2, 3, 4, 5.0])
print(c) # [1. 2. 3. 4. 5.]
当前活动
我是 终身学习者“老马”,一个长期践行“结伴式学习”理念的 中年大叔。
我崇尚分享,渴望成长,于2010年创立了“LSGO软件技术团队”,并加入了国内著名的开源组织“Datawhale”,也是“Dre@mtech”、“智能机器人研究中心”和“大数据与哲学社会科学实验室”的一员。
愿我们一起学习,一起进步,相互陪伴,共同成长。
后台回复「搜搜搜」,随机获取电子资源!
欢迎关注,请扫描二维码: