pytorch中文文档中总结了pytorch的torchvision中的数据集、模型、变换和雪碧图(CSS sprites)制作四部分;链接如下:torchvision.utils - PyTorch中文文档 (pytorch-cn.readthedocs.io)
transforms可以对PIL.image进行变换,PIL包括了基础的图像处理函数,PIL库支持图像的缩放、旋转和任意的仿射变换,pytorch中可以对给定的PIL.image进行多项变换,可支持随机选取中心点切割、给定概率的随机水平翻转、随机切割成给定尺寸和填充图像的边缘;
还支持对图片的向量矩阵进行变换,比如对PIL.img的shape进行变换。
data = np.random.randint(0, 255, size=300)
img = data.reshape(10,10,3)
print(img.shape)
img_tensor = transforms.ToTensor()(img) # 转换成tensor
print(img_tensor)
如果上述的变换不满足你的需求,比如我在处理图像时想要自己指定一个位置进行截取,这个时候就会用到transforms.Lambda,通常需要我们给定一个截取函数,以下代码来自:pytorch transforms.Lambda的使用 - 慢行厚积 - 博客园 (cnblogs.com)
from torchvision import transforms as T
def __crop(img, pos, size):
"""
:param img: 输入的图像
:param pos: 图像截取的位置,类型为元组,包含(x, y)
:param size: 图像截取的大小
:return: 返回截取后的图像
"""
ow, oh = img.size
x1, y1 = pos
tw = th = size
# 有足够的大小截取
# img.crop坐标表示 (left, upper, right, lower)
if (ow > tw or oh > th):
return img.crop((x1, y1, x1+tw, y1+th))
return img
# 然后使用transforms.Lambda封装其为transforms策略
# 然后定义新的transforms为
normalize = T.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
data_transforms = T.Compose([
T.Lambda(lambda img: __crop(img, (5,5), 224)),
T.RandomHorizontalFlip(), # 随机水平翻转给定的PIL.Image,翻转概率为0.5
T.ToTensor(), # 转成Tensor格式,大小范围为[0,1]
normalize
])