Python数据分析——numpy知识总结

文章目录

  • 前言
  • 属性
  • 创建array以及一些操作
  • numpy的运算
  • 随机数生成以及矩阵运算
  • numpy的索引
  • array的合并
  • array的分割
  • numpy的浅拷贝与深拷贝

https://www.bilibili.com/video/BV18K4y187Wd

前言

Numpy是学习python必学的一个库,在数据分析、机器学习、深度学习等领域常使用。

属性

array.ndim 查看矩阵维度,二维,三维等

array.shape 查看矩阵形状,得到行列的元组

array.size 查看矩阵大小,几个元素

array.dtype 查看类型

创建array以及一些操作

import numpy as np

a = np.array([1,2,3],dtype=np.int32)
print(a.dtype)

b = np.array([1,2,3],dtype=np.float)
print(b.dtype)

c = np.array([1,2,3])#一维数据
print(c)

d = np.array([[1,2,3],   #2维矩阵
              [4,5,6]])
print(d)

zero = np.zeros((2,3)) #生成2行3列全为0的矩阵
print(zero)

one = np.ones((3,4)) #生成3行4列全为1的矩阵
print(one)

empty = np.empty((3,2))#生成3行2列全都接近于0(不等于0)的矩阵
print(empty)

g = np.arange(1,20,3) #同range操作
print(g)

h = np.arange(8).reshape(4,2)#重新定义矩阵的形状
print(h)

numpy的运算

import numpy as np

arr1 = np.array([[1,2,3],
                 [4,5,6]])
arr2 = np.array([[1,1,2],
                 [2,3,3]])
print(arr1)
print(arr2)

# 按位运算
print(arr1 + arr2)
print(arr1 - arr2)
print(arr1 * arr2)
print(arr1 ** arr2)# arr1的对应位乘arr2的次幂
print(arr1 / arr2)
print(arr1 % arr2)
print(arr1 // arr2)

print(arr1+2)#所有的元素加2
print(arr1*10)#所有的元素乘以10

arr3 = arr1 > 3 #判断哪些元素大于3,得到布尔值矩阵
print(arr3)

arr4 = np.ones((3,5))
print(arr4)
print(arr1)

np.dot(arr1,arr4)#矩阵乘法
arr1.dot(arr4)#矩阵乘法

print(arr1)
print(arr1.T)#矩阵转置
print(np.transpose(arr1))#矩阵转置

随机数生成以及矩阵运算

import numpy as np

sample1 = np.random.random((3,2))#生成3行2列从0到1的随机数
print(sample1)

sample2 = np.random.normal(size=(3,2))#生成3行2列符合标准正态分布的随机数
# 正态分布随机数则是各个数字的出现几率是满足正态分布的,越靠近中间的数字出现几率越大,越是在两边的出现几率越小。 
print(sample2)

sample3 = np.random.randint(0,10,size=(3,2))#生成3行2列从0到10的随机整数
print(sample3)

np.sum(sample1)#求和

np.min(sample1)#求最小值

np.max(sample1)#求最大值

np.sum(sample1,axis=0)#对列求和

np.sum(sample1,axis=1)#对行求和

print(sample1)

np.argmin(sample1)#求最小值的索引,从0开始数的

np.argmax(sample1)#求最大值的索引

print(np.mean(sample1))#求平均值
print(sample1.mean())#求平均值

np.median(sample1)#求中位数

np.sqrt(sample1)#开方

sample4 = np.random.randint(0,10,size=(1,10))
print(sample4)

np.sort(sample4)#排序

np.sort(sample1)#默认对每一行升序

np.clip(sample4,2,7)#限定区间,小于2就变成2,大于7就变为7

numpy的索引

import numpy as np

# 一维的操作等同于列表
arr1 = np.arange(2,14)
print(arr1)
print(arr1[2])#第三个位置的数据
print(arr1[1:4])#第二到第五个位置的数据
print(arr1[2:-1])#第三到倒数第一个位置的数据
print(arr1[:5])#前五个数据
print(arr1[-2:])#最后两个数据

# 二维操作类似二维列表
arr2 = arr1.reshape(3,4)
print(arr2)
print(arr2[1]) # 第二行
print(arr2[1][1]) # 第二行,第二个
print(arr2[1,2]) # 第二行,第三个
print(arr2[:,2]) # 所有行的第三列

for i in arr2: #迭代行
    print(i)
for i in arr2.T:#迭代列。首先转置了
    print(i)
for i in arr2.flat:#一个一个元素迭代
    print(i)

array的合并

import numpy as np

# 两个array合并
arr1 = np.array([1,2,3])
arr2 = np.array([4,5,6])
arr3 = np.vstack((arr1,arr2))#垂直合并
print(arr3)
print(arr3.shape)
arr4 = np.hstack((arr1,arr2))#水平合并,得到一行数据,123456
print(arr4)
print(arr4.shape)# 得到(6,)

# 多个array合并
arrv = np.vstack((arr1,arr2,arr3))
print(arrv)
arrh = np.hstack((arr1,arr2,arr4))
print(arrh)

# 另一种合并方式,但是可以指定axis,来选择合并行还是列
arr = np.concatenate((arr1,arr2,arr1))
print(arr)
arr = np.concatenate((arr3,arrv),axis=0)#合并的array维度要相同,array形状要匹配,axis=0纵向合并
print(arr)
arr = np.concatenate((arr3,arr3),axis=1)#合并的array维度要相同,array形状要匹配,axis=1横向合并
print(arr)

arr1.T 
print(arr1.T) #一维的array不能转置
print(arr1.shape)

arr1_1 = arr1[np.newaxis,:] # 变成二维数组了,1行3列
print(arr1_1)
print(arr1_1.shape)

print(arr1_1.T)

arr1_2 = arr1[:,np.newaxis] # 变成二维数组了,3行1列
print(arr1_2)
print(arr1_2.shape)

arr1_3 = np.atleast_2d(arr1) # 变成二维数组了,1行3列
print(arr1_3)
print(arr1_3.T)

array的分割

import numpy as np

arr1 = np.arange(12).reshape((3,4))
print(arr1)

# 使用split
arr2,arr3 = np.split(arr1,2,axis=1)#水平方向分割,分成2份
print(arr2)
print(arr3)
arr4,arr5,arr6 = np.split(arr1,3,axis=0)#垂直方向分割,分成3份
print(arr4)
print(arr5)
print(arr6)

# 使用array_split不等分割
arr7,arr8,arr9 = np.array_split(arr1,3,axis=1)#水平方向分割,分成3份,不等分割
print(arr7)
print(arr8)
print(arr9)

# 使用vsplit和hsplit
arrv1,arrv2,arrv3 = np.vsplit(arr1,3)#垂直分割
print(arrv1)
print(arrv2)
print(arrv3)
arrh1,arrh2 = np.hsplit(arr1,2)#水平分割
print(arrh1)
print(arrh2)

numpy的浅拷贝与深拷贝

import numpy as np

arr1 = np.array([1,2,3])

# 浅拷贝
arr2 = arr1#arr1,arr2共享一块内存,浅拷贝
arr2[0] = 5
print(arr1)
print(arr2)

# 深拷贝
arr3 = arr1.copy()#深拷贝
arr3[0] = 10
print(arr1)
print(arr3)

你可能感兴趣的:(数据分析,python,numpy)