Python数据分析与应用学习笔记1

NumPy 数值计算基础

  • 1.NumPy 数组对象 ndarray
    • 创建数组对象
      • 数组数据类型转换
    • 生成随机数
      • random模块常用随机数生成函数
    • 通过索引访问数组
      • 一维数组的索引
      • 多维数组的索引
    • 展平数组
    • 组合数组
    • 切割数组
  • 2.NumPy 矩阵与通用函数
    • 创建与组合矩阵
    • 矩阵的运算
  • 3.NumPy 统计分析
    • 读取文本格式的数据
    • 直接排序
    • 间接排序
    • 去重与重复数据
    • 常用的统计函数

)

1.NumPy 数组对象 ndarray

创建数组对象

1.数组属性:ndarray(数组)是存储单一数据类型的多维数组。
Python数据分析与应用学习笔记1_第1张图片
2.数组创建
numpy.array(object, dtype=None, copy=True, order=‘K’,subok=False, ndmin=0)
Python数据分析与应用学习笔记1_第2张图片
使用 arange 函数创建数组
Python数据分析与应用学习笔记1_第3张图片
Python数据分析与应用学习笔记1_第4张图片
Python数据分析与应用学习笔记1_第5张图片
Python数据分析与应用学习笔记1_第6张图片

3.创建数组并查看数组属性
Python数据分析与应用学习笔记1_第7张图片
Python数据分析与应用学习笔记1_第8张图片
4.重新设置数组的 shape 属性
Python数据分析与应用学习笔记1_第9张图片

数组数据类型转换

Python数据分析与应用学习笔记1_第10张图片

生成随机数

Python数据分析与应用学习笔记1_第11张图片

random模块常用随机数生成函数

Python数据分析与应用学习笔记1_第12张图片

通过索引访问数组

一维数组的索引

Python数据分析与应用学习笔记1_第13张图片
三个参数则分别表示:开始、结果、步长(前闭后开)

多维数组的索引

Python数据分析与应用学习笔记1_第14张图片
Python数据分析与应用学习笔记1_第15张图片

展平数组

使用ravel函数展平数组
Python数据分析与应用学习笔记1_第16张图片
使用flatten函数展平数组

Python数据分析与应用学习笔记1_第17张图片

组合数组

使用hstack函数实现数组横向组合:np.hstack((arr1,arr2))
使用vstack函数实现数组纵向组合:np.vstack((arr1,arr2))
使用concatenate函数实现数组横向组合:np.concatenate((arr1,arr2),axis = 1))
使用concatenate函数实现数组纵向组合:np.concatenate((arr1,arr2),axis = 0))

切割数组

使用hsplit函数实现数组横向分割: np.hsplit(arr1, 2)
使用vsplit函数实现数组纵向分割: np.vsplit(arr, 2)
使用split函数实现数组横向分割: np.split(arr, 2, axis=1)
使用split函数实现数组纵向分割: np.split(arr, 2, axis=0)

2.NumPy 矩阵与通用函数

创建与组合矩阵

使用mat函数创建矩阵: matr1 = np.mat(“1 2 3;4 5 6;7 8 9”)
使用matrix函数创建矩阵:matr2 = np.matrix([[123],[456],[789]])
使用bmat函数合成矩阵:np.bmat(“arr1 arr2; arr1 arr2”)

矩阵的运算

矩阵与数相乘:matr13
矩阵相加减:matr1±matr2
矩阵相乘:matr1
matr2
矩阵对应元素相乘:np.multiply(matr1,matr2)
矩阵特有属性:Python数据分析与应用学习笔记1_第18张图片

3.NumPy 统计分析

读取文本格式的数据

savetxt函数是将数组写到某种分隔符隔开的文本文件中。
np.savetxt("…/tmp/arr.txt", arr, fmt="%d", delimiter=",")

loadtxt函数执行的是把文件加载到一个二维数组中。
np.loadtxt("…/tmp/arr.txt",delimiter=",")

genfromtxt函数面向的是结构化数组和缺失数据。
np.genfromtxt("…/tmp/arr.txt", delimiter = “,”)

直接排序

sort函数是最常用的排序方法。 arr.sort()

sort函数也可以指定一个axis参数,使得sort函数可以沿着指定轴对数据集进行排序。axis=1为沿横轴排序; axis=0为沿纵轴排序。

间接排序

argsort函数返回值为重新排序值的下标。 arr.argsort()

去重与重复数据

lexsort函数返回值是按照最后一个传入数据排序的。 np.lexsort((a,b,c))
通过unique函数可以找出数组中的唯一值并返回已排序的结果。
tile函数主要有两个参数,参数“A”指定重复的数组,参数“reps”指定重复的次数。
np.tile(A,reps)
repeat函数主要有三个参数,参数“a”是需要重复的数组元素,参数“repeats”是重复次数,参数“axis”指定沿着哪个轴进行重复,axis = 0表示按行进行元素重复;axis = 1表示按列进行元素重复。
numpy.repeat(a, repeats, axis=None)
这两个函数的主要区别在于,tile函数是对数组进行重复操作,repeat函数是对数组中的每个元素进行重复操作。

常用的统计函数

当axis=0时,表示沿着纵轴计算。当axis=1时,表示沿着横轴计算。默认时计算一个总值。
Python数据分析与应用学习笔记1_第19张图片

你可能感兴趣的:(数据分析,numpy,python,数据分析)