PyTorch入门学习(四):常见的Transforms使用

目录

一、引言

二、ToTensor

三、Normalize

四、Resize

五、RandomCrop


一、引言

在深度学习项目中,通常需要处理各种类型的数据。数据预处理是确保数据适合于模型训练的关键步骤之一。PyTorch提供了Transforms模块,用于灵活地对数据进行转换和增强,以满足模型的需求。下面,将学习如何使用常见的Transforms操作。

二、ToTensor

ToTensor是一个常用的Transforms,它将图像数据从PIL格式转换为Tensor格式,这是深度学习模型常用的数据类型。

trans_tensor = transforms.ToTensor()
img_tensor = trans_tensor(img)

这个操作可以将图像数据转换为PyTorch张量,从而可以直接用于神经网络的输入。

三、Normalize

Normalize用于对张量进行归一化操作,将数据缩放到特定的均值和标准差范围内,以便于模型的训练和收敛。

trans_norm = transforms.Normalize([0.1, 0.1, 0.1], [1, 1, 1])
img_norm = trans_norm(img_tensor)

在上述示例中,将图像张量的每个通道的均值设置为0.1,标准差设置为1。这有助于模型更快地学习数据的特征。

四、Resize

Resize操作用于调整图像的大小,以便于模型的输入。注意,Resize操作的输入必须是PIL格式的图像。

trans_size = transforms.Resize((128, 128))
img_resize = trans_size(img)

在示例中,将图像的大小调整为128x128像素,以满足模型的输入要求。

五、RandomCrop

RandomCrop操作用于随机裁剪图像,以进行数据增强。在训练深度学习模型时,这种数据增强可以增加模型的鲁棒性。

trans_random = transforms.RandomCrop(200, 200)
trans_compose_2 = transforms.Compose([trans_random, trans_tensor])

 在示例中,使用RandomCrop随机裁剪图像,然后将其转换为张量,以进行多次数据增强。

完整代码如下:

from PIL import Image
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms

# 创建一个TensorBoard写入器,将日志保存到名为"logs"的文件夹
writer = SummaryWriter("logs")

# 从文件路径加载图像
img_path = "data/train/ants_image/0013035.jpg"
img = Image.open(img_path)

# ToTensor
# 将图像转换为PyTorch张量
trans_tensor = transforms.ToTensor()
img_tensor = trans_tensor(img)
writer.add_image("ToTensor", img_tensor)

# Normalize
# 将张量数据进行归一化,均值设置为[0.1, 0.1, 0.1],标准差设置为[1, 1, 1]
print(img_tensor[0][0][0])
trans_norm = transforms.Normalize([0.1, 0.1, 0.1], [1, 1, 1])
img_norm = trans_norm(img_tensor)
print(img_norm[0][0][0])
writer.add_image("Normalize", img_norm, 3)

# Resize
# 调整图像大小为(128, 128)像素
print(img.size)
trans_size = transforms.Resize((128, 128))
img_resize = trans_size(img)
img_resize = trans_tensor(img_resize)
writer.add_image("Resize", img_resize, 0)
print(img_resize)

# Compose - Resize - ToTensor
"""
Compose允许将多个Transforms操作组合在一起,以便一次性对图像执行多个操作。
传入的参数必须是一个Transforms操作的列表,按照从左到右的顺序执行。
前一个操作的输出类型必须与后一个操作的输入类型匹配。
"""
tran_resize_2 = transforms.Resize(128)
trans_compose = transforms.Compose([tran_resize_2, trans_tensor])
img_resize_2 = trans_compose(img)
writer.add_image("Resize", img_resize_2, 1)

# RandomCrop
# 随机裁剪图像,用于数据增强
trans_random = transforms.RandomCrop(200, 200)
trans_compose_2 = transforms.Compose([trans_random, trans_tensor])

# 多次随机裁剪图像并添加到TensorBoard
for i in range(10):
    img_crop = trans_compose_2(img)
    writer.add_image("RandomCrop", img_crop, i)

# 关闭TensorBoard写入器
writer.close()

参考资料:

视频教程:PyTorch深度学习快速入门教程(绝对通俗易懂!)【小土堆】

你可能感兴趣的:(PyTorch,pytorch,学习,深度学习,1024程序员节)