Python数据分析与展示——Numpy

        NumPy是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。使用N维数组对象可以直接对其进行科学计算。

N维数组对象:ndarray

ndarray是一个多维数组对象,由实际数据和描述这些数组的元数据(数据维度、数据类型)这两部分构成,ndarray数组一般要求所有元素类型相同,数组下标从0开始。

np.array():生成一个ndarray数组

np.array()输出成[]形式,元素由空格分割。

a = np.array([[0,1,2,3],[4,5,6,7]])
print(a)

ndarry对象属性

 

Python数据分析与展示——Numpy_第1张图片

a = np.array([[0,1,2,3,4],[5,6,7,8,9]])

a.ndim #2
a.shape #(2,4)
a.size #10
a.dtype #dtype('int32')
a.itemsize #int32类型数据是4个字节

ndarray元素类型

Python数据分析与展示——Numpy_第2张图片

Python数据分析与展示——Numpy_第3张图片

Python数据分析与展示——Numpy_第4张图片

        注意:ndarray数组也可以由非同质对象构成,非同质ndarray元素为对象类型,但其无法有效发挥numpy优势,尽量避免使用。

ndarray数组的创建和变换

ndarray数组的创建

numpy.empty

numpy.empty 方法用来创建一个指定形状(shape)、数据类型(dtype)且未初始化的数组:

numpy.empty(shape, dtype = float, order = 'C')

numpy.zeros

创建指定大小的数组,数组元素以 0 来填充:

numpy.zeros(shape, dtype = float, order = 'C')

numpy.ones

创建指定形状的数组,数组元素以 1 来填充:

numpy.ones(shape, dtype = None, order = 'C')

numpy.asarray

numpy.asarray 类似 numpy.array,但 numpy.asarray 参数只有三个,比 numpy.array 少两个。其中参数a是任意形式的输入参数,可以是列表, 列表的元组, 元组, 元组的元组, 元组的列表,多维数组。

numpy.asarray(a, dtype = None, order = None)

numpy.arange

numpy 包中的使用 arange 函数创建数值范围并返回 ndarray 对象,函数格式如下:

numpy.arange(start, stop, step, dtype)

numpy.linspace

numpy.linspace 函数用于创建一个一维数组,数组是一个等差数列构成的,格式如下:

np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)

numpy.logspace

numpy.logspace 函数用于创建一个于等比数列。格式如下:

np.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None)

Python数据分析与展示——Numpy_第5张图片

 

Python数据分析与展示——Numpy_第6张图片

 Python数据分析与展示——Numpy_第7张图片

 Python数据分析与展示——Numpy_第8张图片

ndarray数组的变换

        对于创建后的ndarray数组,可以对其进行维度变换和元素类型变换。

ndarray数组的维度变换

ndarray数组的类型变换

索引和切片

        切片对象可以通过内置的 slice 函数,并设置 start, stop 及 step 参数进行,从原数组中切割出一个新数组。

import numpy as np
 
a = np.arange(10)
s = slice(2,7,2)   # 从索引 2 开始到索引 7 停止,间隔为2
print (a[s])


[2  4  6]

也可以通过冒号分隔切片参数 start:stop:step 来进行切片操作:

import numpy as np
 
a = np.arange(10)  
b = a[2:7:2]   # 从索引 2 开始到索引 7 停止,间隔为 2
print(b)



[2,4,6]

        如果只放置一个参数,如 [2],将返回与该索引相对应的单个元素。如果为 [2:],表示从该索引开始以后的所有项都将被提取。如果使用了两个参数,如 [2:7],那么则提取两个索引(不包括停止索引)之间的项。

        切片还可以包括省略号 …,来使选择元组的长度与数组的维度相同。 如果在行位置使用省略号,它将返回包含行中元素的 ndarray。

import numpy as np
 
a = np.array([[1,2,3],[3,4,5],[4,5,6]])  
print (a[...,1])   # 第2列元素
print (a[1,...])   # 第2行元素
print (a[...,1:])  # 第2列及剩下的所有元素


[2 4 5]
[3 4 5]
[[2 3]
 [4 5]
 [5 6]]

你可能感兴趣的:(数据分析,python)