numpy和pandas是python中最常用的数据处理模块,在进行机器学习时不可少。numpy和pandas都是用C语言编写的,并且使用矩阵进行计算,计算速度快,消耗计算内存小。
numpy的主要属性:
numpy导入:
import numpy as np
创建数组:
a=np.array([1,2,3])
print (a)
# [1 2 3]
指定数据dtype:
a=np.array([1,3,4],dtype=np.int)
print (a)
# int 64
'''
dtype=np.int int 64
dtype=np.int32 int32
dtype=np.float float64
dtype=np.float32 float32
'''
列表转化为矩阵:
array=np.array([[1,2,3],[4,5,6]])
print (array)
创建全零数组:np.zeros((x,y)):
创建全一数组:np.ones((x,y),dtype=np.int):
创建全空数组 np.empty((x,y))#每个值都是接近于零的数
arange创建连续数组
a=np.arange(10,20,2)#10-19的数据,步长为2
b=np.arange(4)# array([[0,1,2,3]) 默认开始为0,步长为1,不包括终端数字
reshape改变数组形状
a=np.array(12).reshape((3,4)) #3行4列,0到11
linspace创建线段型数据
a=np.linspace(1,10,20)#开始端为1,结束端10,且分割成20个数据,生成线段
Numpy的基本运算
标准矩阵运算
a=np.array([[1,2],[3,4]])
b=np.arange(4).reshape(2,2)
c_dot_1=np.dot(a,b)
c_dot_2=a.dot(b)
(未完待续)