pytorch,tensorflow,matplotlib.pyplot 读取图片的及其注意事项

在图片的深度学习中,我们经常需要画出图片。当我们需要在多种框架中转换时,尤其需要注意图片的格式问题。

matplotlib.pyplot.imshow()

  1. 这个函数的格式是 Height, Width, Channel, 特别需要注意这里channnel的位置。
  2. 输入的数据范围有两个0到1的小数,或者0到255的整数。所以需要注意这想要展示图片的数据格式
  3. 官方网址

pytorch中的torchvision.transforms和torchvision.datasets.ImageFolder,torch.utils.data.DataLoader

我们通常会将pytorch中的tensor数据转化成numpy格式,然后用matplotlib来显示图片。
但是一般我们都是先用pytorch中的图片预处理模块来读取图片,用到两个模块torchvision.transforms和torchvision.datasets.ImageFolder。最后用torch.utils.data.DataLoader来获取图片矩阵。

而torch.utils.data.DataLoader返回值中第一个就是图片的数据信息,(第二个是标签信息)。
数据的矩阵信息是 Channel,Height, Width.
与第一个不同的地方在于图片的通道位置不同。

在这样的情况下,我们通常采取两步转化:
第一步:把torch中的tensor变成numpy:img = tensor.numpy()
第二步:用numpy中的变换位置函数转化通道位置:numpy.transpose(img, (1,2,0))

注意:
torchvision.utils.make_grid()这个函数可以直接输入一个四维的tensor。可以显示多张图片

如果不进行图片预处理,准确的说不改变图片像素值,torchvision.transforms和torchvision.datasets.ImageFolder,torch.utils.data.DataLoader读取的图片像素范围是0到1之间的小数。

还要注意的是,pytorch中的tensor的数据范围是多少,如果不符合matplotlib里的两个范围(要么0到1之间的小数,要么0到255之间的整数)设置,图片将会看起来不自然。

tensorflow

先留个坑

你可能感兴趣的:(python,numpy,pytorch)