【Python】Numpy数据处理教程

目录

Numpy简介

Numpy基本属性

用Numpy创建array

Numpy的基础运算(一)

Numpy的基本运算(二)

Numpy的索引

Numpy的合并和分割

Numpy的copy


Numpy简介

Numpy是Python中的一个用于数据处理的库,可以用来处理矩阵等数据,方便快捷。

下面以代码和注释的方式来介绍Numpy中的实用功能,所有操作和array数组相关。

Numpy基本属性

import numpy as np # 取缩写np代替numpy接下来要用到的话就直接写np.即可

# 第一节介绍的是numpy的一些属性

array = np.array([[1,2,3],[2,3,4]]) # 定array为numpy的矩阵类型

print(array)

# 打印矩阵的维数
print('number of dim:',array.ndim) 

# 打印矩阵的形状(几行几列)
print('shape:',array.shape)

# 打印矩阵的大小,也就是元素的数量
print('size:',array.size)
[[1 2 3]
 [2 3 4]]
number of dim: 2
shape: (2, 3)
size: 6

用Numpy创建array

import numpy as np


# 第二节介绍如何用numpy创建array

a = np.array([2,3,4]) #输出没有逗号分隔
print(a)

# 定义矩阵元素的数据类型

b = np.array([2,23,4],dtype = int) # 直接写int则默认为32位的
print(a.dtype)

c = np.array([3,4,5],dtype = float)
print(c.dtype)

d = np.array([[1,2,3],
              [4,5,6]]) # 定义一个二维矩阵时,尽量写成方形
print(d)

e = np.zeros((3,4)) # 输出一个全为0的矩阵,描述矩阵每个维度的大小时,要在外面加个括号
print(e)

f = np.ones((3,4),dtype = int) # 输出全为1的矩阵,同时可以指定元素的数据类型
print(f)

g = np.empty((3,4)) # 生成一个每个元素接近为0的矩阵
print(g)

h = np.arange(10,20,2) # 生成从10到20,步长为2的数组
print(h)

i = np.arange(12).reshape((3,4)) # 需要更改形状时,都可以在后面加reshape,但要记住多加一层括号
print(i)

j = np.linspace(1,10,5) # 生成一条线段,数据从1到10之间,有五个节点
print(j)
[2 3 4]
int32
float64
[[1 2 3]
 [4 5 6]]
[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]
[[1 1 1 1]
 [1 1 1 1]
 [1 1 1 1]]
[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]
[10 12 14 16 18]
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
[ 1.    3.25  5.5   7.75 10.  ]

Numpy的基础运算(一)

import numpy as np

# 下面两节介绍numpy的基础运算

a = np.array([10,20,30,40])
b = np.arange(4)

print(a,b)

c = a + b # 可为加减乘除,平方为**
print(c)
print(b**2)

c = 10 * np.sin(a) # 也可以调用cos、tan
print(c)

print(b)
print(b<3) # 判断哪些值小于3,位置上返回true或false,也可以是>或==

a = np.array([[1,1],
             [0,1]])
b = np.arange(4).reshape((2,2))

print(a)
print(b)

c = a * b # 元素的乘法
c_dot = np.dot(a,b) # 矩阵的乘法
c_dot_2 = a.dot(b) # 与上面的计算结果相同

print(c)
print(c_dot)
print(c_dot_2)

a = np.random.random((2,4)) # 随机生成数字
print(a)

print(np.sum(a,axis = 1)) # 按列求和
print(np.min(a,axis = 0)) # 按行求最小值
print(np.max(a,axis = 1)) # 按列求最大值

Numpy的基本运算(二)

import numpy as np

A = np.arange(2,14).reshape(3,4)

print(A)
print(np.argmin(A)) # 最小值
print(np.argmax(A)) # 最大值

# 下面三个都是输出平均值
print(np.mean(A)) 
print(A.mean())
print(np.average(A))

print(np.median(A)) # 输出中位数

print(A)
print(np.cumsum(A)) # 逐个元素累加,生成一个一维数组

print(A)
print(np.diff(A)) #输出行中相邻元素的差
print(np.nonzero(A)) # 输出两个数组,第一个数组存储非零元素的行数,第二个数组存储非零元素的列数

print(np.sort(A)) # 逐行排序
print(np.transpose(A)) # 矩阵的转置,行列互换
print((A.T).dot(A))
print(np.clip(A,5,9)) # 让A中所有小于5的数都变成5,所有大于9的数都变成9
[[ 2  3  4  5]
 [ 6  7  8  9]
 [10 11 12 13]]
0
11
7.5
7.5
7.5
7.5
[[ 2  3  4  5]
 [ 6  7  8  9]
 [10 11 12 13]]
[ 2  5  9 14 20 27 35 44 54 65 77 90]
[[ 2  3  4  5]
 [ 6  7  8  9]
 [10 11 12 13]]
[[1 1 1]
 [1 1 1]
 [1 1 1]]
(array([0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2], dtype=int64), array([0, 1, 2, 3, 0, 1, 2, 3, 0, 1, 2, 3], dtype=int64))
[[ 2  3  4  5]
 [ 6  7  8  9]
 [10 11 12 13]]
[[ 2  6 10]
 [ 3  7 11]
 [ 4  8 12]
 [ 5  9 13]]
[[140 158 176 194]
 [158 179 200 221]
 [176 200 224 248]
 [194 221 248 275]]
[[5 5 5 5]
 [6 7 8 9]
 [9 9 9 9]]

Numpy的索引

import numpy as np

# 本节介绍numpy的索引

A = np.arange(3,15)
print(A)
print(A[3])

A = np.arange(3,15).reshape(3,4) # 下面是简单的索引方法 
print(A)
print(A[2])
print(A[1][1])
print(A[1,1])
print(A[2,:])
print(A[:,1])
print(A[1,1:3])

for col in A.T: # 按列打印的技巧
    print(col)
    
print(A.flatten()) # 把多维矩阵展开成一维
    
for item in A.flat: # 逐个打印出所有元素
    print(item)
[ 3  4  5  6  7  8  9 10 11 12 13 14]
6
[[ 3  4  5  6]
 [ 7  8  9 10]
 [11 12 13 14]]
[11 12 13 14]
8
8
[11 12 13 14]
[ 4  8 12]
[8 9]
[ 3  7 11]
[ 4  8 12]
[ 5  9 13]
[ 6 10 14]
[ 3  4  5  6  7  8  9 10 11 12 13 14]
3
4
5
6
7
8
9
10
11
12
13
14

Numpy的合并和分割

import numpy as np

# 本节介绍numpy的array的合并和分割

A = np.array([1,1,1])
B = np.array([2,2,2])
A = A[:,np.newaxis] # 将A这个一位数组纵向重置
B = B[:,np.newaxis]

print(np.vstack((A,B))) # vertical stack 上下合并

print(np.hstack((A,B))) # horizontal stack 左右合并

C = np.concatenate((A,B,B,A),axis = 1) # 可以定义矩阵在哪个维度进行合并
print(C)

A = np.arange(12).reshape((3,4))
print(A)

print(np.split(A,2,axis=1)) # 把数组按列分成相同大小的两份
print(np.array_split(A,3,axis=1)) # 把数组按列分成三份,可以是不等项的分割

print(np.vsplit(A,3)) # 纵向分成三份
print(np.hsplit(A,2)) # 横向分成两份

[[1]
 [1]
 [1]
 [2]
 [2]
 [2]]
[[1 2]
 [1 2]
 [1 2]]
[[1 2 2 1]
 [1 2 2 1]
 [1 2 2 1]]

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
[array([[0, 1],
       [4, 5],
       [8, 9]]), array([[ 2,  3],
       [ 6,  7],
       [10, 11]])]
[array([[0, 1],
       [4, 5],
       [8, 9]]), array([[ 2],
       [ 6],
       [10]]), array([[ 3],
       [ 7],
       [11]])]
[array([[0, 1, 2, 3]]), array([[4, 5, 6, 7]]), array([[ 8,  9, 10, 11]])]
[array([[0, 1],
       [4, 5],
       [8, 9]]), array([[ 2,  3],
       [ 6,  7],
       [10, 11]])]

Numpy的copy

import numpy as np

#  本节介绍numpy的copy,也就是deep copy

# numpy中赋值后所有变量是相同的,会互相跟随改变
# 如果不想要变量间相互关联,就可以使用copy

a = np.arange(12)
b = a
c = a.copy()

print(a)
print(b)
print(c)

c[0] = 1

print(a)
print(c)
[ 0  1  2  3  4  5  6  7  8  9 10 11]
[ 0  1  2  3  4  5  6  7  8  9 10 11]
[ 0  1  2  3  4  5  6  7  8  9 10 11]
[ 0  1  2  3  4  5  6  7  8  9 10 11]
[ 1  1  2  3  4  5  6  7  8  9 10 11]

你可能感兴趣的:(#,Python,python,numpy,数据分析)