Python 真火来学习一下,先来看一个库 NumPy。NumPy是Python语言的一个扩充程序库。支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
1. 读取文件
numpy.genfromtxt() 用于读取 txt 文件,其中传入的参数依次为:
- 需要读取的 txt 文件位置,此处文件与程序位于同一目录下
- 分割的标记
- 转换类型,如果文件中既有文本类型也有数字类型,就先转成文本类型
help(numpy.genfromtxt)用于查看帮助文档:
如果不想看 API 可以启动一个程序用 help 查看指令的详细用法
import numpy
world_alcohol = numpy.genfromtxt("world_alcohol.txt", delimiter=",",dtype=str)
print(type(world_alcohol))
print(world_alcohol)
print(help(numpy.genfromtxt))
2. 构造 ndarray
numpy.array()构造 ndarray
numpy.array()中传入数组参数,可以是一维的也可以是二维三维的。numpy 会将其转变成 ndarray 的结构。
vector = numpy.array([1,2,3,4])
matrix = numpy.array([[1,2,3],[4,5,6]])
传入的参数必须是同一结构,不是同一结构将发生转换。
vector = numpy.array([1,2,3,4])
array([1, 2, 3, 4])
均为 int 类型
vector = numpy.array([1,2,3,4.0])
array([ 1., 2., 3., 4.])
转为浮点数类型
vector = numpy.array([1,2,'3',4])
array(['1', '2', '3', '4'],dtype='
转为字符类型
利用 .shape 查看结构
能够了解 array 的结构,debug 时通过查看结构能够更好地了解程序运行的过程。
print(vector.shape)
print(matrix.shape)
(4,)
(2, 3)
利用 dtype 查看类型
vector = numpy.array([1,2,3,4])
vector.dtype
dtype('int64')
ndim 查看维度
一维
vector = numpy.array([1,2,3,4])
vector.ndim
1
二维
matrix = numpy.array([[1,2,3],
[4,5,6],
[7,8,9]])
matrix.ndim
2
size 查看元素数量
matrix.size
9
3. 获取与计算
numpy 能使用切片获取数据
matrix = numpy.array([[1,2,3],
[4,5,6],
[7,8,9]])
根据条件获取
numpy 能够依次比较 vector 和元素之间是否相同
vector = numpy.array([5, 10, 15, 20])
vector == 10
array([False, True, False, False], dtype=bool)
根据返回值获取元素
vector = numpy.array([5, 10, 15, 20])
equal_to_ten = (vector == 10)
print(equal_to_ten)
print(vector[equal_to_ten])
[False True False False]
[10]
进行运算之后获取
vector = numpy.array([5, 10, 15, 20])
equal_to_ten_and_five = (vector == 10) & (vector == 5)
vector = numpy.array([5, 10, 15, 20])
equal_to_ten_or_five = (vector == 10) | (vector == 5)
类型转换
将整体类型进行转换
vector = numpy.array([5, 10, 15, 20])
print(vector.dtype)
vector = vector.astype(str)
print(vector.dtype)
int64
求和
sum() 能够对 ndarray 进行各种求和操作,比如分别按行按列进行求和
matrix = numpy.array([[1,2,3],
[4,5,6],
[7,8,9]])
print(matrix.sum())
print(matrix.sum(1))
print(matrix.sum(0))
45
[ 6 15 24]
[12 15 18]
sum(1) 是 sum(axis=1)) 的缩写,1表示按照 x轴方向求和,0表示按照y轴方向求和
4. 常用函数
reshape
生成从 0-14 的 15 个数字,使用 reshape(3,5) 将其构造成一个三行五列的 array。
import numpy as np
arr = np.arange(15).reshape(3, 5)
arr
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14]])
zeros
生成指定结构的默认为 0. 的 array
np.zeros ((3,4))
array([[ 0., 0., 0., 0.],
[ 0., 0., 0., 0.],
[ 0., 0., 0., 0.]])
ones
生成一个三维的 array,通过 dtype 指定类型
np.ones( (2,3,4), dtype=np.int32 )
array([[[1, 1, 1, 1],
[1, 1, 1, 1],
[1, 1, 1, 1]],
[[1, 1, 1, 1],
[1, 1, 1, 1],
[1, 1, 1, 1]]])
range
指定范围和数值间的间隔生成 array,注意范围包左不包右
np.arange(0,10,2)
array([0, 2, 4, 6, 8])
random 随机数
生成指定结构的随机数,可以用于生成随机权重
np.random.random((2,3))
array([[ 0.86166627, 0.37756207, 0.94265883],
[ 0.9768257 , 0.96915312, 0.33495431]])
5. ndarray 运算
元素之间依次相减相减
a = np.array([10,20,30,40])
b = np.array(4)
a - b
array([ 6, 16, 26, 36])
乘方
a**2
array([ 100, 400, 900, 1600])
开根号
np.sqrt(B)
array([[ 1.41421356, 0. ],
[ 1.73205081, 2. ]])
e 求方
np.exp(B)
array([[ 7.3890561 , 1. ],
[ 20.08553692, 54.59815003]])
向下取整
a = np.floor(10*np.random.random((2,2)))
a
array([[ 0., 0.],
[ 3., 6.]])
行列变换
a.T
array([[ 0., 3.],
[ 0., 6.]])
变换结构
a.resize(1,4)
a
array([[ 0., 0., 3., 6.]])
6. 矩阵运算
矩阵之间的运算
A = np.array( [[1,1],
[0,1]] )
B = np.array( [[2,0],
[3,4]] )
对应位置一次相乘
A*B
array([[2, 0],
[0, 4]])
矩阵乘法
print (A.dot(B))
print(np.dot(A,B))
[[5 4]
[3 4]]
横向相加
a = np.floor(10*np.random.random((2,2)))
b = np.floor(10*np.random.random((2,2)))
print(a)
print(b)
print(np.hstack((a,b)))
[[ 2. 3.]
[ 9. 3.]]
[[ 8. 1.]
[ 0. 0.]]
[[ 2. 3. 8. 1.]
[ 9. 3. 0. 0.]]
纵向相加
print(np.vstack((a,b)))
[[ 2. 3.]
[ 9. 3.]
[ 8. 1.]
[ 0. 0.]]
矩阵分割
#横向分割
print( np.hsplit(a,3))
#纵向风格
print(np.vsplit(a,3))
7. 复制的区别
地址复制
通过 b = a 复制 a 的值,b 与 a 指向同一地址,改变 b 同时也改变 a。
a = np.arange(12)
b = a
print(a is b)
print(a.shape)
print(b.shape)
b.shape = (3,4)
print(a.shape)
print(b.shape)
True
(12,)
(12,)
(3, 4)
(3, 4)
复制值
通过 a.view() 仅复制值,当对 c 值进行改变会改变 a 的对应的值,而改变 c 的 shape 不改变 a 的 shape
a = np.arange(12)
c = a.view()
print(c is a)
c.shape = 2,6
c[0,0] = 9999
print(a)
print(c)
False
[9999 1 2 3 4 5 6 7 8 9 10 11]
[[9999 1 2 3 4 5]
[ 6 7 8 9 10 11]]
完整拷贝
a.copy() 进行的完整的拷贝,产生一份完全相同的独立的复制
a = np.arange(12)
c = a.copy()
print(c is a)
c.shape = 2,6
c[0,0] = 9999
print(a)
print(c)
False
[ 0 1 2 3 4 5 6 7 8 9 10 11]
[[9999 1 2 3 4 5]
[ 6 7 8 9 10 11]]