Numpy 学习专题(一)—— 数组的创建

前言

  • NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。随着大数据技术不断发展,numpy在数据处理中的作用越来越重要。

  • Numpy中最重要的数据结构是ndarray,下面我们将从多种方式来创建ndarray。

一、依据现有数据创建ndarray

1. 通过array()函数创建

#一维数组
a = np.array([0, 1, 2, 3, 4])
print(a, type(a))
# [0 1 2 3 4] 

#二维数组
c = np.array([[1, 2, 3],
              [6, 7, 8],
              [3, 4, 5]])

#三维数组
d = np.array([[(8, 2, 3), (4, 5, 6)],
              [(3, 2, 1), (4, 5, 6)]])

2. 通过asarray()函数创建

array()和asarray()的区别如下:
当数据源是ndarray 时,array()仍然会 copy 出一个副本,占用新的内存;
当数据源是ndarray并且不改变 dtype 时,asarray()不会占用新内存,但改变dtype时,asarray()会占用新内存。
占用新内存意味着新创建的ndarray数据不随原array()数据改变而改变。

import numpy as np
x = np.array([[1, 1, 1], [1, 1, 1], [1, 1, 1]], dtype=np.int)
y = np.array(x)
z = np.asarray(x)
w = np.asarray(x, dtype=np.float)  # 改变dtype类型

# 改变x中某个值
x[1][2] = 2

print(x,type(x),x.dtype)
# [[1 1 1]
#  [1 1 2]
#  [1 1 1]]  int32
print(y,type(y),y.dtype)
# [[1 1 1]
#  [1 1 1]
#  [1 1 1]]  int32
print(z,type(z),z.dtype)
# [[1 1 1]
#  [1 1 2]
#  [1 1 1]]  int32
print(w,type(w),w.dtype)
# [[1 1 1]
#  [1 1 1]
#  [1 1 1]]  float64

3. 通过fromfunction()函数创建

通过在每个坐标上执行一个函数来构造数组

import numpy as np

def f(x, y):
    return x + y
 
x = np.fromfunction(f, (5, 4), dtype=int)
print(x)
# [[0 1 2 3]
#  [1 2 3 4]
#  [2 3 4 5]
#  [3 4 5 6]
#  [4 5 6 7]]

二、依据ones和zeros填充方式创建ndarray

1. 0数组

zeros()函数:返回给定形状和类型的零数组。
zeros_like()函数:返回与给定数组形状和类型相同的零数组。

import numpy as np

x = np.zeros(3)
print(x)  # [0. 0. 0.]
x = np.zeros([2, 3])
print(x)
# [[0. 0. 0.]
#  [0. 0. 0.]]

x = np.array([[1, 2, 3], [4, 5, 6]])
y = np.zeros_like(x)
print(y)
# [[0 0 0]
#  [0 0 0]]

2. 1数组

ones()函数:返回给定形状和类型的1数组。
ones_like()函数:返回与给定数组形状和类型相同的1数组。
把0数组中数字“0”变成数字“1,其余与0数组完全一样。

3. 空数组

empty()函数:返回一个空数组,数组元素为随机数。
empty_like函数:返回与给定数组具有相同形状和类型的新数组。
把0数组中数字“0”变成随机数,其余与0数组完全一样。

4. 单位数组

eye()函数:返回一个对角线上为1,其它地方为零的单位数组。identity()函数:返回一个方的单位数组。

import numpy as np

x = np.eye(4)
print(x)
# [[1. 0. 0. 0.]
#  [0. 1. 0. 0.]
#  [0. 0. 1. 0.]
#  [0. 0. 0. 1.]]

x = np.eye(2, 3)
print(x)
# [[1. 0. 0.]
#  [0. 1. 0.]]

x = np.identity(4)
print(x)
# [[1. 0. 0. 0.]
#  [0. 1. 0. 0.]
#  [0. 0. 1. 0.]
#  [0. 0. 0. 1.]]

5. 对角数组

diag()函数:有两个功能,一是提取数组的对角线,二是构造对角数组。

import numpy as np

# 提取数组对角线
x = np.arange(9).reshape((3, 3))
print(x)
# [[0 1 2]
#  [3 4 5]
#  [6 7 8]]
print(np.diag(x))  # [0 4 8]
print(np.diag(x, k=1))  # [1 5]
print(np.diag(x, k=-1))  # [3 7]

# 构建对角数组
v = [1, 3, 5, 7]
x = np.diag(v)
print(x)
# [[1 0 0 0]
#  [0 3 0 0]
#  [0 0 5 0]
#  [0 0 0 7]]

6. 常数数组

full()函数:返回一个常数数组。
full_like()函数:返回与给定数组具有相同形状和类型的常数数组。

import numpy as np

x = np.full(2, 5)
print(x)
# [5 5]

x = np.full((2, 3), 7)
print(x)
# [[7 7 7]
# [7 7 7]]

x = np.array([[1, 2, 3], [4, 5, 6]])
y = np.full_like(x, 6)
print(y)
# [[6 6 6]
# [6 6 6]]

三、利用数值范围来创建ndarray

  • arange()函数:返回给定间隔内的均匀间隔的值。
  • linspace()函数:返回指定间隔内的等间隔数字。
  • logspace()函数:返回数以对数刻度均匀分布。
  • numpy.random.random() 返回一个由[0,1)内的随机数组成的数组。
import numpy as np

x = np.arange(5)
print(x)  # [0 1 2 3 4]

x = np.arange(3, 7, 2)
print(x)  # [3 5]

x = np.logspace(0, 1, 5)
print(np.around(x, 2))
# [0.   0.25 0.5  0.75 1.   1.25 1.5  1.75 2.  ]

x = np.linspace(start=0, stop=1, num=5)  # 解释了np.logspace()函数
x = [10 ** i for i in x]
print(np.around(x, 2))  # np.around 返回四舍五入后的值,可指定精度。
# [ 1.    1.78  3.16  5.62 10.  ]   

x = np.random.random(5)
print(x)
# [ 1.    1.78  3.16  5.62 10.  ]

x = np.random.random([2, 3])
print(x)
# [0.41768753 0.16315577 0.80167915 0.99690199 0.11812291]
# [[0.41151858 0.93785153 0.57031309]
#  [0.13482333 0.20583516 0.45429181]]
 

四、结构数组的创建

1. 利用字典定义结构

import numpy as np

personType = np.dtype({
    'names': ['name', 'age', 'weight'],
    'formats': ['U30', 'i8', 'f8']})
    
a = np.array([('yiyi', 18, 50), ('dawang', 20, 57.)],
             dtype=personType)
print(a, type(a))
# [('yiyi', 18, 50.) ('dawang', 20, 57.)]
# 

2. 利用包含多个元组的列表定义结

import numpy as np

personType = np.dtype([('name', 'U30'), ('age', 'i8'), ('weight', 'f8'), ('height', 'f8')])

a = np.array([('yiyi', 18, 50, 161), ('dawang', 20, 57, 170)],
             dtype=personType)
print(a, type(a))
# [('yiyi', 18, 50., 161.) ('dawang', 20, 57., 170.)] 
# 

# 结构数组也可以通过下标取得元素
print(a[0])
# ('yiyi', 18, 50., 161.)

# 我们可以使用字段名作为下标获取对应的值
print(a['name'])
# ['yiyi' 'dawang']
print(a['height'])
# [161. 170.]
print(a['age'])
# [18 20]
print(a['weight'])
# [[50. 57.]

五、补充知识

  1. 数据类型
    numpy主要的数据类型如下所示:
类型 备注
布尔类型(b) ‘b1’ :
整形(i) ‘i1’, ‘i2’, ‘i4’, ‘i8’ :
无符号整型(u) ‘u1’, ‘u2’ ,‘u4’ ,‘u8’ :
浮点型(f) ‘f2’, ‘f4’, ‘f8’ :
字符串(U) ‘U5’ : (此处U后面是几就代表字符串长度是几个字符)
  1. 数组的属性
  • numpy.ndarray.ndim用于返回数组的维数(轴的个数)也称为秩,一维数组的秩为 1,二维数组的秩为 2,以此类推。
  • numpy.ndarray.shape表示数组的维度,返回一个元组,这个元组的长度就是维度的数目,即 ndim 属性(秩)。
  • numpy.ndarray.size数组中所有元素的总量,相当于数组的shape中所有元素的乘积,例如矩阵的元素总量为行与列的乘积。
  • numpy.ndarray.dtype ndarray 对象的元素类型。
  • numpy.ndarray.itemsize以字节的形式返回数组中每一个元素的大小。
import numpy as np

a = np.array([1, 2, 3, 4, 5])
print(a.shape)  # (5,)
print(a.dtype)  # int32
print(a.size)  # 5
print(a.ndim)  # 1
print(a.itemsize)  # 4

b = np.array([[1, 2, 3], [4, 5, 6.0]])
print(b.shape)  # (2, 3)
print(b.dtype)  # float64
print(b.size)  # 6
print(b.ndim)  # 2
print(b.itemsize)  # 8

# 在ndarray中所有元素必须是同一类型,否则会自动向下转换,int->float->str。
a = np.array([1, 2, 3, 4, 5])
print(a)  # [1 2 3 4 5]
b = np.array([1, 2, 3, 4, '5'])
print(b)  # ['1' '2' '3' '4' '5']
c = np.array([1, 2, 3, 4, 5.0])
print(c)  # [1. 2. 3. 4. 5.]

你可能感兴趣的:(Numpy学习)