numpy基础入门

import numpy as np

1. 矩阵的创建

a=np.arange(1,5)
a=np.array([1,2,3,4,5])
print(a, a.dtype, a.shape, a.size, a.ndim)
[1 2 3 4 5] int64 (5,) 5 1
  • np.arange类似range函数
  • np.array用来生成矩阵
  • dtype是数据类型,有int64, complex, uint16等
  • shape是个元组属性,表示每一维的宽度
  • size是所有元素个数
  • ndim是维数
b=np.array([1,2,3],dtype='int') # int64, complex, uint16......
h = b.astype(np.float)  # 用另一种类型表示
print(b, b.dtype, h.dtype)
[1 2 3] int64 float64
m=np.array([np.arange(6),np.arange(6)])
print(m, m.shape, m.size)
[[0 1 2 3 4 5]
 [0 1 2 3 4 5]] (2, 6) 12
# 每一个[]代表一维,比如
# [[[1,2,3],[4,5,6]],[[7,8,9],[10,11,12]]], 代表矩阵的维度是(2,2,3)
# 其中第一个2,代表最外层的两个[],第二个2代表第二层[],第三个3代表最里层的维度。
n=np.array([[1,2,3,4],[5,6,7,8]])
print(n, n[0,2], n[1,1])

m=np.array([[[1,2,3],[4,5,6]],[[7,8,9],[10,11,12]]])
print(m.shape)
[[1 2 3 4]
 [5 6 7 8]] 3 6
(2, 2, 3)
x=m.ravel()
y=n.flatten()
print(x)
print(y)
[ 1  2  3  4  5  6  7  8  9 10 11 12]
[1 2 3 4 5 6 7 8]

ravel()和flatten()看起来效果一样,都是把矩阵展平了。它们的区别在于

  • ravel()返回的是原有数据的一个映射(view),没有分配新的存储
  • flatten()返回的是新的数据
    因此如果我们改变它们的值,就可以看出区别

numpy还有一些函数有这样的区别,关键在于判断函数返回是原数据的映射还是返回新的数据。

x[3]=10;y[3]=10
print(m)
print(n)
# 看看m,n哪个的值改变了
[[[ 1  2  3]
  [10  5  6]]

 [[ 7  8  9]
  [10 11 12]]]
[[1 2 3 4]
 [5 6 7 8]]
# reshape返回一个view
x=m.reshape(3,4)
# resize直接在当前数据上更改,返回空
y=n.resize(3,4)
print(x,y,'\n',n)
[[ 1  2  3 10]
 [ 5  6  7  8]
 [ 9 10 11 12]] None 
 [[1 2 3 4]
 [5 6 7 8]
 [0 0 0 0]]
x[2]=10
print(x, m)
# 看看m和n哪个改变了,有什么区别
[[ 1  2  3 10]
 [ 5  6  7  8]
 [10 10 10 10]] [[[ 1  2  3]
  [10  5  6]]

 [[ 7  8 10]
  [10 10 10]]]
m=np.array([np.arange(6),np.arange(6)])
# copy()可以强制返回一个新的数据
x=m.reshape(3,4).copy()
x[2]=10;print(x);print(m)
#看看这次m的值随x改变而改变吗
# linspace返回0,1之间的10个数据,等差数列
x=np.linspace(0,1,10)
print(x)
[ 0.          0.11111111  0.22222222  0.33333333  0.44444444  0.55555556
  0.66666667  0.77777778  0.88888889  1.        ]
a = np.arange(10)
np.random.shuffle(a)  # 随机排第一维
print(a)

a = np.arange(9).reshape((3, 3)) # 随机排第一维,想一想结果是什么
np.random.shuffle(a)
print(a)
[1 5 0 6 4 7 3 2 9 8]
[[3 4 5]
 [6 7 8]
 [0 1 2]]
# 全0矩阵
a=np.zeros((3,3))
# 全1矩阵
b=np.ones((5,4))
# 单位矩阵
c=np.eye(3)
# 取对角元素
print(b)
np.diag(b) # np.diag(b) 返回b的对角线元素
[[ 1.  1.  1.  1.]
 [ 1.  1.  1.  1.]
 [ 1.  1.  1.  1.]
 [ 1.  1.  1.  1.]
 [ 1.  1.  1.  1.]]
[3 3 3 3]
print(m.transpose()) # 转秩
print(m.T) # 转秩
[[[ 1  7]
  [10 10]]

 [[ 2  8]
  [ 5 10]]

 [[ 3 10]
  [ 6 10]]]
[[[ 1  7]
  [10 10]]

 [[ 2  8]
  [ 5 10]]

 [[ 3 10]
  [ 6 10]]]

2.索引

a = np.arange(24).reshape((2, 3, 4))

# 用:表示当前维度上所有下标
c = a[:, 2, :]
d = a[:, :, 1]
e = a[:, 1:, 1:-1]

# 用...表示没有明确指出的维度
f = a[..., 1] # 等价于[:, :, 1]

print(a)
print(c)
print(d)
print(e)
print(f)
[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]
[[ 8  9 10 11]
 [20 21 22 23]]
[[ 1  5  9]
 [13 17 21]]
[[[ 5  6]
  [ 9 10]]

 [[17 18]
  [21 22]]]
[[ 1  5  9]
 [13 17 21]]

3. 矩阵的加法

a = np.arange(9).reshape((3, 3))

## 每个元素的broadcast
print(a)
print(a+3)

## 行broadcast
print(a+np.arange(3))

## 列broadcast
print(a+np.arange(3).reshape(3,1))
[[0 1 2]
 [3 4 5]
 [6 7 8]]
[[ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]
[[ 0  2  4]
 [ 3  5  7]
 [ 6  8 10]]
[[ 0  1  2]
 [ 4  5  6]
 [ 8  9 10]]

broadcast广播操作,运算不仅仅作用在某个元素,而是作用在整个矩阵,或者整行,或者整列。
比如

  • nm + 11 就是将11的元素作用在nm的整个矩阵
  • nm + n1 就是将n1的元素作用在nm的每一列
  • nm + 1m 就是将1m的元素作用在nm的每一行
  • 乘法类似
a = np.array([[1, 2], [3, 4]])
print(np.sum(a,axis=0))
print(np.sum(a,axis=1))
print(np.mean(a,axis=0))
print(np.mean(a,axis=1))
print(np.std(a,axis=0)) # 标准差

#axis=0,就是按第一个维度进行计算,行向量[1,2], [3,4]
#axis=1,就是按第二个维度进行计算,列向量[1,3], [2,4]
[4 6]
[3 7]
[ 2.  3.]
[ 1.5  3.5]
[ 1.  1.]
#再拓展到3维
a = np.arange(12).reshape((2,2,3))
print(a)
print(np.sum(a,axis=0)) #按第一维度加,结果为2*3矩阵, 可以理解为1*2*3
print(np.sum(a,axis=1))#按第二维度加,结果为2*3矩阵, 可以理解为2*1*3
print(np.sum(a,axis=2)) #按第三维度加,结果为2*2矩阵, 可以理解为2*2*1
[[[ 0  1  2]
  [ 3  4  5]]

 [[ 6  7  8]
  [ 9 10 11]]]
[[ 6  8 10]
 [12 14 16]]
[[ 3  5  7]
 [15 17 19]]
[[ 3 12]
 [21 30]]

4. 矩阵的乘法

a = np.arange(12).reshape((6, 2))
b = np.arange(10).reshape((2,5))

# 两种矩阵乘法形式
print(a.dot(b))
print(np.dot(a,b))
[[  5   6   7   8   9]
 [ 15  20  25  30  35]
 [ 25  34  43  52  61]
 [ 35  48  61  74  87]
 [ 45  62  79  96 113]
 [ 55  76  97 118 139]]
[[  5   6   7   8   9]
 [ 15  20  25  30  35]
 [ 25  34  43  52  61]
 [ 35  48  61  74  87]
 [ 45  62  79  96 113]
 [ 55  76  97 118 139]]
## 每个元素broadcast
print(a*2)
[[ 0  2]
 [ 4  6]
 [ 8 10]
 [12 14]
 [16 18]
 [20 22]]
# 行broadcast
print(a*[1,2])
[[ 0  2]
 [ 2  6]
 [ 4 10]
 [ 6 14]
 [ 8 18]
 [10 22]]
# 列broadcast
print(a*np.arange(6).reshape(6,1))

5.矩阵的拼接和拆分

a = np.arange(9).reshape(3,3)
b = 2 * a
c = np.hstack((a, b)) # 以面向列的方式进行堆叠(axis=1)
print(c)
[[ 0  1  2  0  2  4]
 [ 3  4  5  6  8 10]
 [ 6  7  8 12 14 16]]
print(np.concatenate((a, b), axis=1))
[[ 0  1  2  0  2  4]
 [ 3  4  5  6  8 10]
 [ 6  7  8 12 14 16]]
c=np.vstack((a, b)) # 以面向行的方式进行堆叠(axis=0)
c=np.concatenate((a, b), axis=0)
# hsplit, vsplit, dsplit 分别沿轴0,1,2进行拆分
print(np.hsplit(a, 3)) 
print(np.vsplit(a,3))
[array([[0],
       [3],
       [6]]), array([[1],
       [4],
       [7]]), array([[2],
       [5],
       [8]])]
[array([[0, 1, 2]]), array([[3, 4, 5]]), array([[6, 7, 8]])]
# 平均分成3份
g = np.split(np.arange(9), 3)

# 按照下标位置进行划分
h = np.split(np.arange(9), [2, -3])
print(g)
print(h)
[array([0, 1, 2]), array([3, 4, 5]), array([6, 7, 8])]
[array([0, 1]), array([2, 3, 4, 5]), array([6, 7, 8])]
  • hsplit, vsplit, dsplit 分别沿轴0,1,2进行拆分
  • hstack, vstack, dstack 分别以面向列(1),行(0),深度(2)的方式进行堆叠
  • row_stack, column_stack 分别以面向列(1),行(0)的方式进行堆叠
  • np.r_, np.c_ 分别以面向列(1),行(0)的方式进行堆叠

6. 矩阵的查找

a = np.arange(12).reshape((3, 4))
b = a%2==0
c = a>4
print(b)
print (c)
# 这里也用到了broadcast
[[ True False  True False]
 [ True False  True False]
 [ True False  True False]]
[[False False False False]
 [False  True  True  True]
 [ True  True  True  True]]
a = np.arange(12).reshape((3, 4))
print(a)
print(np.argmax(a))
# 其实是列broadcast,返回每列最大值的idx
print(np.argmax(a, axis=0))

# 行broadcast,返回每行最大值的idx
print(np.argmax(a, axis=1))
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
11
[2 2 2 2]
[3 3 3]
# np.where支持多个逻辑组合, 得到满足条件的index
idx=np.where((a>3))
print(a[idx])

idx=np.where((a>3)&(a<7))
print(a[idx])
[ 4  5  6  7  8  9 10 11]
[4 5 6]

7. 元素的重复操作:tile和repeat

# repeat会将数组中元素重复一定次数
a = np.repeat(3, 4) # 创建一个一维数组,元素值是把3重复4次,array([3, 3, 3, 3])

b = np.arange(3)
c = b.repeat(4) # 如果传入一个整数,则把每个元素重复多次
d = b.repeat([2,3,4]) # 如果传入一组整数, 则把个元素重复不同次数

e = np.arange(6).reshape(2,3)
f = e.repeat(2, axis=1) # 对于多维数组还可以沿指定轴重复
g = e.repeat([2, 3], axis=0)
print(a)
print(c)
print(d)
print(f)
print(g)

# tile会沿指定轴向堆叠数组的副本
h1 = np.tile(e, 2) # 对于标量按照水平铺设
h2 = np.tile(e, (2, 3)) # 对于原则则按照纵向和横向分别铺设
print(h1)
print(h2)
[3 3 3 3]
[0 0 0 0 1 1 1 1 2 2 2 2]
[0 0 1 1 1 2 2 2 2]
[[0 0 1 1 2 2]
 [3 3 4 4 5 5]]
[[0 1 2]
 [0 1 2]
 [3 4 5]
 [3 4 5]
 [3 4 5]]
[[0 1 2 0 1 2]
 [3 4 5 3 4 5]]
[[0 1 2 0 1 2 0 1 2]
 [3 4 5 3 4 5 3 4 5]
 [0 1 2 0 1 2 0 1 2]
 [3 4 5 3 4 5 3 4 5]]

8. 随机模块(random)

import numpy as np
import numpy.random as random

# 设置随机数种子
random.seed(42)

# 产生一个1x3,[0,1)之间的浮点型随机数
random.rand(1, 3)

# 产生一个[0,1)之间的浮点型随机数
random.random()

# 下边4个没有区别,都是按照指定大小产生[0,1)之间的浮点型随机数array,不Pythonic…
random.random((3, 3))
random.sample((3, 3))
random.random_sample((3, 3))
random.ranf((3, 3))

# 产生10个[1,6)之间的浮点型随机数
5*random.random(10) + 1
random.uniform(1, 6, 10)

# 产生指定形状的随机数
random.randint(1, 6, 10)
random.randint(1, 6, size=(3,3))

# 产生2x5的标准正态分布样本
random.normal(size=(5, 2))

# 产生5个,n=5,p=0.5的二项分布样本
random.binomial(n=5, p=0.5, size=5)

a = np.arange(10)

# 从a中有回放的随机采样7个
random.choice(a, 7)

# 从a中无回放的随机采样7个
random.choice(a, 7, replace=False)

# 对a进行乱序并返回一个新的array
b = random.permutation(a)

# 对a进行in-place乱序
random.shuffle(a)

# 生成一个长度为9的随机bytes序列并作为str返回
# '\x96\x9d\xd1?\xe6\x18\xbb\x9a\xec'
random.bytes(9)

9. numpy 100题

http://www.labri.fr/perso/nrougier/teaching/numpy.100/

你可能感兴趣的:(numpy基础入门)