Python数据分析与展示-Numpy入门

Python数据分析与展示-Numpy入门

  • 数据维度
  • Numpy数组对象
    • NumPy的引用
    • ndarray对象的属性
  • ndarray数组的元素类型
  • ndarray数组的创建
    • Python中的列表、元组等类型创建ndarray数组
    • 使用NumPy中函数创建ndarray数组
    • 从字节流(raw bytes)中创建
    • 从文件中读取特定格式创建
  • ndarray数组的变换
    • 维度变换
    • 元素类型变换
    • 向数组转换
  • ndarray数组的索引和切片
    • 一维数组索引和切片
    • 多维数组索引和切片
  • ndarray数组的运算
    • 数组与标量运算
    • 一元函数
    • 二元函数

数据维度

维度是一组数据的组织形式,数据维度包括一维、二维、多维和高维。
一维数据由对等关系的有序或无序数据构成,采用线性方式组织;
二维数据由多个一维数据构成,是一维数据的组合形式;
多维数据由一维或二维数据在新维度上扩展形成;
高维数据仅利用最基本的二元关系展示数据间的复杂结构。
Python中表示
一维数据用列表和集合类型
二维数据用列表类型
多维数据用列表类型
高维数据用字典类型或数据表示格式

Numpy数组对象

NumPy是一个开源的Python科学计算基础库,包含:一个强大的N维数组对象即ndarray,NumPy是SciPy、Pandas等数据处理或科学计算库的基础。

如上所述,Python已有列表类型,为什么需要一个数组对象(类型)?
主要是由于ndarray数组对象可以去掉元素间运算所需的循环,使一维向量更像单个数据,经过优化可以提升这类应用的运算速度观察:在科学计算中,一个维度所有数据的类型往往相同,数组对象采用相同的数据类型,有助于节省运算和存储空间。

ndarray是一个多维数组对象,由实际的数据和描述这些数据的元数据(数据维度、数据类型等)两部分构成;
ndarray数组一般要求所有元素类型相同(同质),且数组下标从0开始,在计算机世界中大多从0开始。

NumPy的引用

import numpy as np

ndarray对象的属性

属性 含义
.ndim 秩,即轴的数量或维度的数量
.shape ndarray对象的尺度,对于矩阵,n行m列
.size ndarray对象元素的个数,相当于.shape中n*m的值
.dtype ndarray对象的元素类型
.itemsize ndarray对象中每个元素的大小,以字节为单位

比如有一个数组对象a,查看a的元素个数

a.shape

ndarray数组的元素类型

类型 含义
bool 布尔类型,True或False
intc 与C语言中的int类型一致,一般是int32或int64
intp 用于索引的整数,与C语言中ssize_t一致,int32或int64
int8 字节长度的整数,取值:[‐128, 127]
int16 16位长度的整数,取值:[‐32768, 32767]
int32 32位长度的整数,取值:[‐231, 231‐1]
int64 64位长度的整数,取值:[‐263, 263‐1]
uint8 8位无符号整数,取值:[0, 255]
uint16 16位无符号整数,取值:[0, 65535]
uint32 32位无符号整数,取值:[0, 232‐1]
uint64 32位无符号整数,取值:[0, 264‐1]
float16 16位半精度浮点数:1位符号位,5位指数,10位尾数
float32 32位半精度浮点数:1位符号位,8位指数,23位尾数
float64 64位半精度浮点数:1位符号位,11位指数,52位尾数
complex64 复数类型,实部和虚部都是32位浮点数
complex128 复数类型,实部和虚部都是64位浮点数

ndarray可以包括非同质数据,但是不建议使用。

ndarray数组的创建

主要分为四种方法

Python中的列表、元组等类型创建ndarray数组

x = np.array(list/tuple)
x = np.array(list/tuple,dtype=np.float32)
示例:

x=np.array([0,1,2,3]) #列表
x=np.array((4,5,6,7)) #元组
x=np.array([[1,2],[9,8],(0.1,0.2)]) #列表、元组混合

使用NumPy中函数创建ndarray数组

如:arange, ones, zeros等

函数 含义
np.arange(n) 类似range()函数,返回ndarray类型,元素从0到n‐1
np.ones(shape) 根据shape生成一个全1数组,shape是元组类型
np.zeros(shape) 根据shape生成一个全0数组,shape是元组类型
np.full(shape,val) 根据shape生成一个数组,每个元素值都是val
np.eye(n) 创建一个正方的n*n单位矩阵,对角线为1,其余为0
np.ones_like(a) 根据数组a的形状生成一个全1数组
np.zeros_like(a) 根据数组a的形状生成一个全0数组
np.full_like(a,val) 根据数组a的形状生成一个数组,每个元素值都是val
np.linspace() 根据起止数据等间距地填充数据,形成数组np.concatenate()

示例:

x=np.arange(10)
x=np.ones((3,6)) #二维
x=np.ones((2,3,4)) #三维
x=np.zeros((3,6),dtype=np.int32)
x=np.eye(5)
x=np.linspace(1,10,4) #结果是array([1. ,4., 7., 10.])
c=np.concatenate(a,b) #将ab合并为c

从字节流(raw bytes)中创建

从文件中读取特定格式创建

ndarray数组的变换

数组的变换主要包括维度变换、元素类型变换、转为python列表

维度变换

方法 含义
.reshape(shape) 不改变数组元素,返回一个shape形状的数组,原数组不变
.resize(shape) 与.reshape()功能一致,但修改原数组
.swapaxes(ax1,ax2) 将数组n个维度中两个维度进行调换
.flatten() 对数组进行降维,返回折叠后的一维数组,原数组不变

示例:

a.reshape((3,8))
a.resize((3,8))
a.flatten()

元素类型变换

示例:

new_a= a.astype(new_type)

astype()方法一定会创建新的数组(原始数据的一个拷贝),即使两个类型一致。

向数组转换

示例:

ls = a.tolist()

ndarray数组的索引和切片

索引是获取数组中特定位置元素的过程
切片是获取数组元素子集的过程

一维数组索引和切片

与Python的列表类似,用 [起始编号: 终止编号(不含): 步长],三个元素冒号分隔,编号0开始从左递增,或‐1开始从右递减
示例:

a=np.array([9,8,7,6,5])
a[2] #索引结果为7
a[1:4:2] #结果为array([8,6]])

多维数组索引和切片

索引时每个维度一个索引值,逗号分割
示例:

a=np.arange(24).reshape((2,3,4))
'''
a:
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])
'''
a[1,2,3] #索引结果为23
a[-1,-2,-3] #索引结果为17

切片时选取一个维度,每个维度切片方法与一维数组相同,同样每个维度可以使用步长跳跃切片
示例:

a=np.arange(24).reshape((2,3,4))
#过程1
a[:,1:,-3]
'''
结果为
array([[ 5,  9],
       [17, 21]])
'''
#过程2
a[:,:,::2]
'''
结果为
array([[[ 0,  2],
        [ 4,  6],
        [ 8, 10]],

       [[12, 14],
        [16, 18],
        [20, 22]]])
'''

ndarray数组的运算

数组与标量运算

数组与标量运算作用于每一个元素
比如a=a*3,即所有元素都乘以3

一元函数

函数 含义
np.abs(x) np.fabs(x) 计算数组各元素的绝对值
np.sqrt(x) 计算数组各元素的平方根
np.square(x) 计算数组各元素的平方
np.log(x) np.log10(x) np.log2(x) 计算数组各元素的自然对数、10底对数和2底对数
np.ceil(x) np.floor(x) 计算数组各元素的ceiling值或floor值
np.rint(x) 计算数组各元素的四舍五入值
np.modf(x) 将数组各元素的小数和整数部分以两个独立数组形式返回
np.cos(x) np.cosh(x) np.sin(x) np.sinh(x) np.tan(x) np.tanh(x) 计算数组各元素的普通型和双曲型三角函数
np.exp(x) 计算数组各元素的指数值
np.sign(x) 计算数组各元素的符号值,1(+), 0, ‐1(‐)

二元函数

函数 含义
+ ‐* / ** 两个数组各元素进行对应运算
np.maximum(x,y) np.fmax()np.minimum(x,y)np.fmin() 元素级的最大值/最小值计算
np.mod(x,y) 元素级的模运算
np.copysign(x,y) 将数组y中各元素值的符号赋值给数组x对应元素
> < >= <= == != 算术比较,产生布尔型数组

示例:

a=np.arange(24).reshape((2,3,4))
b=np.square(a)

# 过程1
c=np.maximum(a,b)
'''
结果是
array([[[  0,   1,   4,   9],
        [ 16,  25,  36,  49],
        [ 64,  81, 100, 121]],

       [[144, 169, 196, 225],
        [256, 289, 324, 361],
        [400, 441, 484, 529]]])
'''
# 过程2
a>b
'''
array([[[False, False, False, False],
        [False, False, False, False],
        [False, False, False, False]],

       [[False, False, False, False],
        [False, False, False, False],
        [False, False, False, False]]])
'''

参考自中国大学MOOC

你可能感兴趣的:(数据科学,python,数据分析)