NumPy数值计算基础(数组的创建方法,生成随机数)

Numpy  简介

Numpy 是用于数据科学计算的基础,不但能够完成科学计算任务,还能被用作高效地多维数据容器。用于存储和处理大型矩阵。

Python提供了一个 array 模块,和list 不同,它直接保存数值,但是由于Python的 array 模块不支持多维,也没有各种运算函数。

Numpy 弥补了这一遗憾。Numpy 提供了一种存储单一数据类型的多维数组——ndarray(下文统称数组)

1、数组属性:
      ndarray(数组)是存储单一数据类型的多维数组。

 
属性 说明
ndim 返回 int。表示数组的维数
shape 返回 tuple。表示数组的尺寸,对于 n 行 m 列的矩阵,形状为(n,m)
size 返回 int。表示数组的元素总数,等于数组形状的乘积
dtype 返回 data-type。描述数组中元素的类型
itemsize 返回 int。表示数组的每个元素的大小(以字节为单位)

2、数组创建(创建一维或多维数组)
      numpy.array(object,dtype=None,copy=True,order=‘K’,subok=False,ndmin=0)

参数名称 说明
object 接收 array。表示想要创建的数组。无默认
dtype 接收 data-type。表示数组所需的数据类型。如果未给定,则选择
保存对象所需的最小类型。默认为 None
ndmin 接收 int。指定生成数组应该具有的最小维数。默认为 None

数组的创建

(1)一维数组的创建

import numpy as np

arr1 = np.array([1,2,3,4])
print(arr1)
# 结果: [1 2 3 4]

print(type(arr1))
# 结果: 

 

(2)二维数组的创建

import numpy as np

arr2 = np.array([[1,2,3,4],[4,5,6,6],[7,8,9,10]])
print(arr2)
# 结果: 
# [[ 1  2  3  4]
#  [ 4  5  6  6]
#  [ 7  8  9 10]]

print(type(arr2))
# 结果: 

 

(3)数组的属性

import numpy as np

arr = np.array([[1,2,3,4],[4,5,6,6],[7,8,9,10]])

print('数组结构:',arr.shape) 
print('数组元素个数:',arr.size)
print('数组元素类型:',arr.dtype)
print('数组维度:',arr.ndim)
print('数组元素大小:',arr.itemsize)

# 结果: 
# 数组结构: (3, 4)  # 3行4列
# 数组元素个数: 12
# 数组元素类型: int32
# 数组维度: 2   # 二维数组
# 数组元素大小: 4 

 

(4)重设数据结构

import numpy as np

arr = np.array([[1,2,3,4],[4,5,6,6],[7,8,9,10]])    # 原本3行4列
print(arr)
# 结果: 
# [[ 1  2  3  4]
#  [ 4  5  6  6]
#  [ 7  8  9 10]]

arr.shape = 4,3    # 重设为4行3列
print('重设arr2数据结构后:',arr)
# 重设arr2数据结构后: 
# [[ 1  2  3]
#  [ 4  4  5]
#  [ 6  6  7]
#  [ 8  9 10]]

 

numpy中自动生成数组的函数

(1)arange()函数的表达式

格式: arange(起始值,结束值,步长)    注意: 不包含结束值

import numpy as np

print(np.arange(1,10,1))
# 结果: [1 2 3 4 5 6 7 8 9]

 range与arange的区别:

range( )函数只能创建int型list,如果步长不是整数,是小数,则会出现错误

arange()可以使用float型数据

import numpy as np

arr = np.arange(0,1,0.1)    # arange()可以使用float型数据
print(arr)
# 结果: [ 0.   0.1  0.2  0.3  0.4  0.5  0.6  0.7  0.8  0.9]

arr2 = list(range(1,10,1))
print(arr2)
# 结果: [1, 2, 3, 4, 5, 6, 7, 8, 9]

arr3 = list(range(1,10,0.1))    # 如果步长是float类型,则会报错
print(arr3)
# 结果: ypeError: 'float' object cannot be interpreted as an integer

 

(2)等差数列:  linspace(起始值,结束值,元素个数) 

import numpy as np

arr = np.linspace(1,10,10)
print(arr)
# 结果: [  1.   2.   3.   4.   5.   6.   7.   8.   9.  10.]

 

(3)等比数列: logspace(起始值10^a,结束值10^b,元素个数),底数默认为10

import numpy as np

arr = np.logspace(1,2,5)
print(arr)
# 结果: [  10.           17.7827941    31.6227766    56.23413252  100.        ]

 

(4)全0数组

import numpy as np

arr = np.zeros((2,3))   # 2行3列
print(arr)
# 结果:
# [[ 0.  0.  0.]
#  [ 0.  0.  0.]]

 

(5)全1数组

import numpy as np

arr = np.ones((2,3))  # 2行3列
print(arr)
# 结果:
# [[ 1.  1.  1.]
#  [ 1.  1.  1.]]

 

(6)单位数组

import numpy as np

arr = np.eye(3)  # 3行3列
print(arr)
# 结果:
# [[ 1.  0.  0.]
#  [ 0.  1.  0.]
#  [ 0.  0.  1.]]

 

(7)对角数组: diag,一定是方阵

import numpy as np

arr = np.diag([1,2,3,4])  
print(arr)
# 结果:
# [[1 0 0 0]
#  [0 2 0 0]
#  [0 0 3 0]
#  [0 0 0 4]]

 

生成随机数

(1)0~1的一维数组:  np.random.random

import numpy as np

arr = np.random.random(10)   # 随机取10个
print(arr)

# 结果:
# [ 0.51801865  0.5746457   0.29800094  0.81485959  0.54768688  0.40696099
#   0.94247636  0.74356589  0.95578567  0.79127131]

 

(2)均匀分布:  np.random.rand

以给定的形状创建一个数组,并在数组中加入在[0,1)之间均匀分布的随机样本

import numpy as np

arr = np.random.rand(4,3) 
print(arr)

# 结果:
# [[ 0.80227604  0.88811862  0.41145791]
#  [ 0.7945255   0.47529523  0.67895032]
#  [ 0.34225024  0.82894344  0.03426757]
#  [ 0.793489    0.00724797  0.58662593]]

arr2 = np.random.rand(2) 
print(arr2)

# 结果: [ 0.23103931  0.66302526]

 

(3)正态分布:  np.random.randn 

通过本函数可以返回一个或一组服从标准正态分布的随机样本值,标准正态分布是以0为均数、以1为标准差的正态分布,记为N(0,1)

import numpy as np

arr = np.random.randn(4,3)
print(arr)

# 结果例如:
# [[ 0.04315637 -0.45477833 -0.27857073]
#  [-1.91932412  0.7338659   0.2525201 ]
#  [ 0.18677151  0.84322074  1.65225377]
#  [ 0.28711352 -0.79008218  0.72578138]]

arr2 = np.random.randn(3)
print(arr2)

# 结果例如: [-0.78690609  0.56418809 -1.64700147]

 

(4)随机整数:  np.random.randint(最小值,最大值,size=[行,列])

import numpy as np

arr = np.random.randint(2,10,size=[2,5])
print(arr)

# 结果: 
# [[6 8 5 9 7]
#  [8 2 7 8 5]]

 

你可能感兴趣的:(数据分析,生成随机数))