Numpy在处理图片的时候,dtype属性影响了图片的读取,计算,保存,显示。同时也影响着与其他三方库(如opencv)交互的时候的运算,下面列出Numpy主要的数据类型。
数据名称 | 说明 |
---|---|
bool | 布尔类型,true,false |
int_ | 默认的整数类型(类似于 C 语言中的 long,int32 或 int64) |
intc | 与 C 的 int 类型一样,一般是 int32 或 int 64 |
intp | 用于索引的整数类型(类似于 C 的 ssize_t,一般情况下仍然是 int32 或 int64) |
int8 | 字节(-128 to 127) |
int16 | 整数(-32768 to 32767) |
int32 | 整数(-2147483648 to 2147483647) |
int64 | 整数(-9223372036854775808 to 9223372036854775807) |
uint8 | 无符号整数(0 to 255) |
uint16 | 无符号整数(0 to 65535) |
uint32 | 无符号整数(0 to 4294967295) |
uint64 | 无符号整数(0 to 18446744073709551615) |
float_ | float64 类型的简写 |
float16 | 半精度浮点数,包括:1 个符号位,5 个指数位,10 个尾数位 |
float32 | 单精度浮点数,包括:1 个符号位,8 个指数位,23 个尾数位 |
float64 | 双精度浮点数,包括:1 个符号位,11 个指数位,52 个尾数位 |
complex_ complex128 | 类型的简写,即 128 位复数 |
complex64 | 复数,表示双 32 位浮点数(实数部分和虚数部分) |
complex128 | 复数,表示双 64 位浮点数(实数部分和虚数部分) |
numpy 的数值类型实际上是 dtype 对象的实例,并对应唯一的字符,包括 np.bool_,np.int32,np.float32,等等。同时在上表突出了在图像处理时,常用的几种数据类型。无论是opencv还是PIL的Image库读取的一般图像的数据类型都是uint8。
查看数据类型
# 创建一个数组
>>> arr = np.arange(0, 11, 2).reshape((2, 3))
>>> arr
array([[ 0, 2, 4],
[ 6, 8, 10]])
>>> arr.dtype
dtype('int32')
指定数据类型
# 同样是上面那个数组
>>> arr
array([[ 0, 2, 4],
[ 6, 8, 10]])
# 错误方法,用dtype直接指定会导致数组大小发生改变,同时该法直接改变原数组
>>> arr.dtype = np.uint8
>>> arr
array([[ 0, 0, 0, 0, 2, 0, 0, 0, 4, 0, 0, 0],
[ 6, 0, 0, 0, 8, 0, 0, 0, 10, 0, 0, 0]], dtype=uint8)
# 正确方法,用np.astype()指定
>>> arr1 = arr.astype('float64')
>>> arr1
array([[ 0., 2., 4.],
[ 6., 8., 10.]])
>>> arr1.dtype
dtype('float64')
>>> arr.dtype
dtype('int32')
# 可以发现原数组并未发生改变,np.astype()返回的是原数组的一个拷贝
几种指定数据的表示
# 下列操作结果是一样的
arr.astype(float)
arr.astepe(np.float64)
arr.astype('float64')
对于复数域的矩阵或数组
# 随便创建一个复数域的矩阵
>>> arr = np.mat('1+1j 2+0j;1+0.1j 3+1j')
>>> arr
matrix([[1.+1.j , 2.+0.j ],
[1.+0.1j, 3.+1.j ]])
>>> arr.dtype
dtype('complex128')
# 取其实部
>>> a = arr.real
>>> a
matrix([[1., 2.],
[1., 3.]])
>>> a.dtype
dtype('float64')
# 该方法返回的也是一个拷贝,并不改变原数组
# 取复部
>>> arr.imag
matrix([[1. , 0. ],
[0.1, 1. ]])