Numpy使用Python进行科学计算的基础包。因为机器学习当中很多都会用到数组、线性代数等知识,经常需要和数组打交道,所以Numpy学习成为了科研之路上必须掌握的一门技能。Numpy包含以下的内容:
Numpy支持比Python更多的数据类型。
比如:
#创建数组的各种方法
print(np.array([[1,2,3],[4,5,6]]))
print(np.arange(10,20,2))
a = [(1,2,3),(4,5,6)]
print(np.asarray(a))
print(np.ones((4,3),int,'c')) print(np.linspace(10,20,5,False,True,float)) print(np.logspace(0,9,10,True,base=2))
## Numpy的切片和索引
Numpy对象的内容可以通过索引和切片用来访问和修改,与Python中list的切片一样。
切面与索引举例:
#单维数组
a = np.arange(10)
print(slice(2,7,2))
print(a[2:7:2])
print(a[2:])
#多维数组
a = np.array([[1,2,3],[3,4,5],[4,5,6]])
print(a[1:]) #输出第二行和第三行
print(a[...,1]) #第二列元素
print(a[1,...]) #第二行元素
print(a[...,1:]) #第二列以及后面的所有元素
整数数组索引
一个数组访问另外一个数组,这个数组中的元素都是目标数组的某个维度的索引值。
import numpy as np
x = np.array([[1, 2], [3, 4], [5, 6]])
y = x[[0,1,2], [0,1,0]]
#访问(0,0),(1,1,),(2,0)这三个位置的元素
print (y)
布尔索引
x = np.array([[ 0, 1, 2],[ 3, 4, 5],[ 6, 7, 8],[ 9, 10, 11]])
print(x[x>5])
a = np.array([np.nan, 1,2,np.nan,3,4,5])
print (a[~np.isnan(a)])
a = np.array([1, 2+6j, 5, 3.5+5j])
print (a[np.iscomplex(a)])
花式索引
x=np.arange(32).reshape((8,4))
print(x)
# 二维数组读取指定下标对应的行
print("-------读取下标对应的行-------")
print (x[[4,2,1,7]])
广播(Broadcast)是numpy对不同形状的数组进行数值计算的方式。
#如果两个数组 a 和 b 形状相同,即满足 a.shape == b.shape,那么 a*b 的结果就是 a 与 b 数组对应位相乘。这要求维数相同,且各维度的长度相同。
a = np.array([1,2,3,4])
b = np.array([10,20,30,40])
c = a * b
print (c)
#当运算中的 2 个数组的形状不同时,numpy 将自动触发广播机制
a = np.array([[ 0, 0, 0],
[10,10,10],
[20,20,20],
[30,30,30]])
b = np.array([0,1,2])
print(a + b)
"""
输出结果为:
[[ 0 1 2]
[10 11 12]
[20 21 22]
[30 31 32]]
"""
广播的规则: