PIL
from PIL import Image
# 返回PIL.Image.Image类
img = Image.open(imgpth)
# 保存使用IMage类的方法save
img.save(pth)
SciPy是一个开放源码的BSD许可的数学,科学和工程库。 SciPy库依赖于NumPy,它提供了便捷且快速的N维数组操作。构建SciPy库的主要原因是,它能与NumPy数组一起工作,并提供了许多用户友好和高效的数字实践,例如:数值积分和优化的例程。
scipy.misc
misc 是 miscellaneous 的缩写,杂项 的意思。代表没别的合适的地方放了,就放在这里了.和图像io相关的操作都在这里的,所以对CVer 来说还很重要
import scipy.misc as misc
img = misc.imread(imgpth)
# 返回的是np.array数组
cv2
img = cv2.open(imgpth)
# 返回值仍然是shape为H x W x C的np.array
# 只是C的三个索引顺序是BGR而不是RGB
剩余的还有skimage.io, matplotlib.image.
比较推荐的是scipy.misc, 因为读入后就是np.array, 方便后续的数据增强等操作,而且是RGB顺序。
PIL.Image.Image与np.array间的相互转化
img_np = np.array(PIL_img)
img_PIL = Image.fromarray(img_np)
神经网络的input有如下要求:
torchvision提供一系列的操作。 ToTensor直接实现对PIL.Image的归一化和维度对调。还提供了一系列数据增强操作。
但如果相应的标签也发生变化,则应该通过对numpy的操作进行。
# 维度间调换H x W x C --> C x H x W
img = np.transpose(img, axes=(2,0,1))
# 归一化
img = img / 255.0