图像通道转换——从np.ndarray的[w, h, c]转为Tensor的[c, w, h]

在神经网络中,图像常被转换为张量形式。

pytorch中张量的通道顺序为                  [c, h, w]格式或者[n, c, h, w]格式

如果需要将图像以np.ndarray形式输入

需要知道np.ndarray默认将图像表示成 [h, w, c]个格式,并且要对其进行转化。

n:样本数量
c:图像通道数
w:图像宽度
h:图像高度

转换需要用到np.transpose函数:

例如:在加载cifar10数据集时,在对数据集的预处理过程中,将图片转换为了tensor类型,如果需要将该图片打印出来,就需要重新转换为numpy数组形式,就要进行跟之前预处理相反的操作。

tensor:[c,h,w]

     0 1 2

np.数组[h,w,c]

因此,

np数组中h的位置放的是tensor中索引为1的位置

np数组中w的位置放的是tensor中索引为2的位置

np数组中c的位置放的是tensor中索引为0的位置

因此将tensor转换为numpy数组,需要进行以下操作

np.transpose(img, (1, 2, 0))

你可能感兴趣的:(深度学习,深度学习,计算机视觉)