Pytorch中的torchvision.transforms笔记

      pytorch中文文档中总结了pytorch的torchvision中的数据集、模型、变换和雪碧图(CSS sprites)制作四部分;链接如下:torchvision.utils - PyTorch中文文档 (pytorch-cn.readthedocs.io)  

      transforms可以对PIL.image进行变换,PIL包括了基础的图像处理函数,PIL库支持图像的缩放、旋转和任意的仿射变换,pytorch中可以对给定的PIL.image进行多项变换,可支持随机选取中心点切割、给定概率的随机水平翻转、随机切割成给定尺寸和填充图像的边缘;

      还支持对图片的向量矩阵进行变换,比如对PIL.img的shape进行变换。

data = np.random.randint(0, 255, size=300)
img = data.reshape(10,10,3)
print(img.shape)
img_tensor = transforms.ToTensor()(img) # 转换成tensor
print(img_tensor)

      如果上述的变换不满足你的需求,比如我在处理图像时想要自己指定一个位置进行截取,这个时候就会用到transforms.Lambda,通常需要我们给定一个截取函数,以下代码来自:pytorch transforms.Lambda的使用 - 慢行厚积 - 博客园 (cnblogs.com)

from torchvision import transforms as T

def __crop(img, pos, size):
    """
    :param img: 输入的图像
    :param pos: 图像截取的位置,类型为元组,包含(x, y)
    :param size: 图像截取的大小
    :return: 返回截取后的图像
    """
    ow, oh = img.size
    x1, y1 = pos
    tw = th = size
    # 有足够的大小截取
    # img.crop坐标表示 (left, upper, right, lower)
    if (ow > tw or oh > th):
        return img.crop((x1, y1, x1+tw, y1+th))
    return img

# 然后使用transforms.Lambda封装其为transforms策略
# 然后定义新的transforms为
normalize = T.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
data_transforms = T.Compose([
    T.Lambda(lambda img: __crop(img, (5,5), 224)),
    T.RandomHorizontalFlip(),  # 随机水平翻转给定的PIL.Image,翻转概率为0.5
    T.ToTensor(),  # 转成Tensor格式,大小范围为[0,1]
    normalize
])

你可能感兴趣的:(pytorch学习笔记,pytorch,python)