这是面向新用户的 Python 教程,并结合了 JoinQuant 获取到的数据进行了讲解。
如果你之前没有学过 Python, 或者对 Python 不熟,那不要再犹豫了,这个教程就是为你准备的!
更多内容请查看量化课堂 - Python 编程板块。
本节概要: 主要讲解了 Numpy 库中的一些知识
Numpy 本身并没有提供多么高级的数据分析功能,理解 Numpuy 数组以及面向数组的计算将有助于你更加高效的使用诸如 pandas 之类的工具,如果你是 Python 新手,而且只是想随意处理一下数据就行,那就跳过本节吧,没关系的。
Numpy是高性能科学计算和数据分析的基础包。
Numpy本身并没有提供多么高级的数据分析功能,理解 Numpuy 数组以及面向数组的计算将有助于你更加高效的使用诸如 pandas 之类的工具,如果你是Python新手,而且只是想随意处理一下数据就行,那就跳过本节吧,没关系的。
Pyhton 中用列表保存一组值,可将列表当成是数组使用。此外,Python 有 array 模快,但他不支持多维数组,无论是列表还是 array 模块都没有科学运算函数,不适合做矩阵等科学计算。因此,Numpy没有使用 Python 本身的数组机制,而是提供了 ndarray 数组对象,该对象不断能方便的存取数组,而且拥有丰富的数组计算函数,比如向量的加法、减法、乘法等。
使用 ndarray 数组,首先需要导入 Numpy 函数库,也可以直接导入该函数库:
from numpy import *
或指定导入库的别名(在引入多个库的时候,推荐使用这个方法)。
import numpy as np
下面正式进入Numpy的数组世界。如果没有说明,所称数组均为 Numpy 数组对象,与 Python 的列表和 array模块无关。
1.1 创建数组
创建数组是进行数组计算的先决条件,可以通过array()函数定义数组实例对象,其参数为Python 的序列对象(比如列表。)如果想定义多维数组,则传递多层嵌套的序列。例如下面这条语句定义了一个二维数组,其大小为(2,3),即有2行,3列。
a = np.array([[1,2,4.0],[3,6,9]]) a
array([[ 1., 2., 4.], [ 3., 6., 9.]])
接着我们看下数组的一些属性:
# 查看行数 a.ndim
2
# 查看数组的维数,返回(n,m), 其中 n 为行数,m 为列数。 a.shape
(2, 3)
# 查看元素的类型,比如 numpy.int32、numpy.float64 a.dtype
dtype('float64')
1.2 特殊数组
Numpy的特殊数组主要有以下几种:
下面是全零、全1、空数组的创建方法:
np.zeros((2,3))
array([[ 0., 0., 0.], [ 0., 0., 0.]])
np.ones((3,4))
array([[ 1., 1., 1., 1.], [ 1., 1., 1., 1.], [ 1., 1., 1., 1.]])
np.empty((3,2))
array([[ 0., 0.], [ 0., 0.], [ 0., 0.]])
1.3 序列数组
arange函数:他与 Python 的 range 函数相似,但他属于Numpy 库,其参数依次为:开始值、结束值、步长
。
np.arange(1,20,5)
array([ 1, 6, 11, 16])
我们还可以使用 linspace 函数创建等差序列数组,其参数依次为:开始值、结束值、元素数量
。
np.linspace(0,2,9)
array([ 0. , 0.25, 0.5 , 0.75, 1. , 1.25, 1.5 , 1.75, 2. ])
1.4 数组索引
Numpy 数组的每个元素、每行元素、每列元素都可以用索引访问,不过注意:索引是从 0 开始的。
其操作与列表基本相同。
a = np.array([[1,2,4.0],[3,6,9]])
# 取 a 的第一行元素 a[0]
array([ 1., 2., 4.])
# 取 a 的第二列元素 a[:,1]
array([ 2., 6.])
# 取 a 的第一行的第三个元素 a[0,2]
4.0
1.5 数组运算
a = np.array([1,2,3]) b = np.array([4.,5,6])
# 加法运算 a + b
array([ 5., 7., 9.])
# 减法运算 a - b
array([-3., -3., -3.])
# 乘法运算 a * b
array([ 4., 10., 18.])
# 乘方运算:a的2次方 a ** 2
array([1, 4, 9])
# 除法运算 a/b
array([ 0.25, 0.4 , 0.5 ])
# 数组点乘 np.dot(a,b)
32.0
# 判断大小,返回 bool 值 a >= 2
array([False, True, True], dtype=bool)
# a中最大的元素 a.max()
3
# a中最小的元素 a.min()
1
# a的和 a.sum()
6
1.6 数组拷贝
数组的拷贝分为浅拷贝和深拷贝两种,浅拷贝通过数组变量的复制完成,深拷贝使用数组对象的copy方法完成。
浅拷贝只拷贝数组的引用,如果对拷贝对象修改。原数组也将修改。
下面的代码演示了浅拷贝的方法:
a = np.ones((2,3)) a
array([[ 1., 1., 1.], [ 1., 1., 1.]])
# b 为 a 的浅拷贝 b = a b
array([[ 1., 1., 1.], [ 1., 1., 1.]])
# 对 b 进行修改,a 也会被修改 b[1,2] = 9 a
--------------------------------------------------------------------------- NameError Traceback (most recent call last)in () 1 # 对 b 进行修改,a 也会被修改 ----> 2 b[1,2] = 9展开输出 ↓
深拷贝会复制一份和原数组一样的数组,但他们在内存中是分开存放的,所以改变拷贝数组,原数组不会改变。
下面的代码演示了 b 使用 copy 方法从原数组 a 复制一份拷贝的情况。
a = np.ones((2,3)) a
array([[ 1., 1., 1.], [ 1., 1., 1.]])
b = a.copy()
b[1,2] = 9 b
array([[ 1., 1., 1.], [ 1., 1., 9.]])
a
array([[ 1., 1., 1.], [ 1., 1., 1.]])
2.1 创建矩阵
Numpy的矩阵对象与数组对象相似,主要不同之处在于,矩阵对象的计算遵循矩阵数学运算规律。矩阵使用 matrix 函数创建,以(2,2)大小的矩阵为例(2行2列),定义方法如下:
A = np.matrix([[1.0,2.0],[3.0,4.0]]) A
matrix([[ 1., 2.], [ 3., 4.]])
# 查看A的类型 type(A)
numpy.matrixlib.defmatrix.matrix
2.2 矩阵运算
矩阵的常用数学运算有转置、乘法、求逆等。下面的代码演示了矩阵的基本运算。
# 转置 A.T
matrix([[ 1., 3.], [ 2., 4.]])
B = np.matrix([[3.0],[5.0]]) B
matrix([[ 3.], [ 5.]])
# 矩阵乘法 A * B
matrix([[ 13.], [ 29.]])
# 逆矩阵 A.I
matrix([[-2. , 1. ], [ 1.5, -0.5]])
# 解线性方程组 solve(A, B)
matrix([[-1.], [ 2.]])
有关 Numpy 的东西就讲到这里了,接下来让我们学习激动人心的 pandas ~~~