犬冢紬希

Pytorch(三)：数据变换 Transforms

- 0. 简介
- 1. 裁剪类
- - (1) torchvision.transforms.CenterCrop(size)
  - (2) torchvision.transforms.FiveCrop(size)
  - (3) torchvision.transforms.RandomCrop()
  - (4) torchvision.transforms.RandomResizedCrop()
  - (5) torchvision.transforms.TenCrop(size, vertical_flip=False)
- 2. 翻转和旋转类
- - (1) torchvision.transforms.RandomHorizontalFlip(p=0.5)
  - (2) torchvision.transforms.RandomVerticalFlip(p=0.5)
  - (3) torchvision.transforms.RandomRotation()
- 3. 图像变换类
- - (1) torchvision.transforms.Resize()
  - (2) torchvision.transforms.Normalize()
  - (3) torchvision.transforms.Pad()
  - (4) torchvision.transforms.Grayscale(num_output_channels)
  - (5) torchvision.transforms.RandomGrayScale(p=0.1)
  - (6) torchvision.transforms.ColorJitter()
  - (7) torchvision.transforms.RandomAffine()
  - (8) torchvision.transforms.LinearTransformation()
  - (9) torchvision.transforms.RandomErasing()
  - (10) torchvision.transforms.GaussianBlur()
  - (11) torchvision.transforms.RandomPerspective()
- 4. 图像格式转换类
- - (1) torchvision.transforms.ConvertImageDtype()
  - (2) torchvision.transforms.ToTensor
  - (3) torchvision.transforms.ToPILImage(mode=None)
- 5. 系列变换类
- - (1) torchvision.transforms.RandomApply()
  - (2) torchvision.transforms.RandomChoice()
  - (3) torchvision.transforms.RandomOrder()
- 6. 通用变换
- - torchvision.transforms.lambda
- 7. 组合变换
- - torchvision.transforms.Compose(transforms)

一般情况下，预加载的数据集或自己构造的数据集并不能直接用于训练机器学习算法，为了将其转换为训练模型所需的最终形式，我们可以使用 transforms 对数据进行处理，以使其适合训练。

0. 简介

在介绍 Dataset 时，提到 torchvision.datasets 中的数据集都有两个参数：

transform：可以对数据进行的变换；
target_transform：可以对标签进行的变换。

而 torchvision.transforms.functional 模块提供了一些常用的转换，这些转换都能够接受以下三种输入：

PIL Image：对于 RGB 图像，size 为 (W, H)，将其转换为 NumPy array 后 size 为 (H, W, C)；
Tensor Image：指具有 shape 为 (C, H, W) 的一个 tensor，C 为通道数，H、W 分别是图像的高和宽；
batch of Tensor Images：指具有 shape 为 (B, C, H, W) 的一个 tensor，B 为 batchsize，也就是一个批次中的图像数量。

这里需要注意的一个地方是：

Pytorch 中存储的 Tensor Image 的存储格式为 (C, H, W)；
而转换为 NumPy array 的 PIL Image 的存储格式为 (H, W, C)；

所以在可视化图像数据或将 PIL Image 用于训练时常常会涉及格式转化，一般有以下几种情况。

可参考 Pytorch中Tensor与各种图像格式的相互转化

转换类型	操作
PIL --> Tensor	将参数 `transform` 设置为 `torchvision.transforms.ToTensor()`
Tensor --> PIL	将参数 `transform` 设置为 `torchvision.transforms.ToPILImage()`
NumyP --> Tensor	`img_tensor = img_numpy.transpose(2, 0, 1)`
Tensor --> NumPy	`img_numpy = img_tensor.transpose(1, 2, 0)`

ok 回到torchvision.transforms.functional 模块上，该模块提供的这些转换都可以通过 torchvision.transforms.compose() 组合在一起使用，对于构建比较复杂的转换任务(例如：分割任务)是非常有用的。下面会简单记录几个比较常见的转换，示例代码均是以单张图片作为输入。

参考 TORCHVISION.TRANSFORMS

1. 裁剪类

(1) torchvision.transforms.CenterCrop(size)

可用于 PIL Image 或 Tensor Image。

参数：

size，类型是元组序列或整数，表示裁剪后的图像大小。如果 size 是一个整数，则会生成一个方形的裁剪，即输出大小为 (size，size)；如果 size 是 (h, w) 之类的序列，则输出大小为 (h, w)；如果提供长度为 1 的序列，那么输出大小将被认是 (size [0]，size [0])。

该转换的意义是对给定的图像进行中心裁剪，返回值是一张图像。被裁剪的图像类型可以是 PIL Image 或 Tensor Image，如果图像尺寸沿任何维度都小于输出尺寸 size，则图像会被以 0 填充，然后再进行中心裁剪。

示例代码。

# @Time : 2021/5/22 16:10
# @Author : ykx
# @File : 03-Transforms.py
# @Software : PyCharm
# -------------------------- #
# 1.中心裁剪
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(2, 2, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

# 展示经过不同参数的中心裁剪后的图像
titles = ['int_size', 'sequence_size', '0 padding']
tfs = [transforms.CenterCrop(200),
       transforms.CenterCrop((150, 200)),
       transforms.CenterCrop(300)
       ]
for i in range(3):
    figure.add_subplot(2, 2, i+2)
    plt.title(titles[i])
    plt.imshow(tfs[i](im))
    plt.axis('off')
plt.show()

(2) torchvision.transforms.FiveCrop(size)

可用于 PIL Image 或 Tensor Image。

参数：

size，类型是元组序列或整数，表示裁剪后的图像大小。如果 size 是一个整数，则会生成一个方形的裁剪，即输出大小为 (size，size)；如果 size 是 (h, w) 之类的序列，则输出大小为 (h, w)；如果提供长度为 1 的序列，那么输出大小将被认是 (size [0]，size [0])。

该转换的意义是对图像进行五点裁剪，被裁剪的图像类型可以是 PIL Image 或 Tensor Image，将给定的一幅图像裁剪为四个角和一个中心，因此 返回值是一个具有5个图像的元组。

示例代码。

# -------------------------- #
# 2.五点裁剪
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(2, 3, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tf = transforms.FiveCrop(100)
ims = tf(im)
titles = ['left_up', 'right_up', 'left_bottom', 'right_bottom', 'center']
for i in range(5):
    figure.add_subplot(2, 3, i+2)
    plt.title(titles[i])
    plt.imshow(ims[i])
    plt.axis('off')
plt.show()

(3) torchvision.transforms.RandomCrop()

随机裁剪：torchvision.transforms.RandomCrop(size, padding=None, pad_if_needed=False, fill=0, padding_mode='constant')

可用于 PIL Image 或 Tensor Image。

参数：

size：类型是元组序列或整数，表示裁剪后的图像大小。
- 如果 size 是一个整数，则会生成一个方形的裁剪，即输出大小为 (size，size)；
- 如果 size 是 (h, w) 类型的元组，则输出大小为 (h, w)；
- 如果提供长度为 1 的序列，那么输出大小将被认是 (size [0]，size [0])。
padding：可选参数，类型是元组序列或整数，默认是不进行填充。
- 如果 padding 是一个整数，那么填充将作用于所有边上；
- 如果 padding 是一个 长度为2 的序列，那么对应序列中不同值的填充将对应作用于 左/右 和 上/下 边界上；
- 如果 padding 是一个 长度为4 的序列，那么对应序列中不同值的填充将对应作用于 左、上、右、下 边界上。
- 注意，在 torchscript 模式下是不支持 single int 填充的，因此需要使用 长度为1 的序列 [padding,]。
pad_if_needed：类型为布尔值，如果原图小于参数 size，图像将被填充，以免引发异常，注意这里裁剪是在填充之后完成的。
fill：类型是数字或字符串或元组，表示用于常值填充的像素值，也就是仅当 padding_mode=constant 时才会用到该参数。
- 默认是0；
- 如果是长度为3 的元组，那么分别用于填充R、G、B通道；
- 注意，对于 Tensor Image 仅支持数字类型，对于 PIL Image 支持整数或字符串或元组类型。
padding_mode：表示填充的类型，有以下几种选择：
- constant：表示常值填充，常值由参数 fill 指定，默认填充类型；
- edge：表示以图像边缘处的最后一个像素值进行填充。如果输入是一个 5D 的 Tensor Image，那么最后的三个维度会被填充；
- reflect：表示反射填充，但不重复最边缘处的像素值，例如在 reflect mode 下以每边上的2个元素填充 [1, 2, 3, 4]，那么结果应该是 [3, 2, 1, 2, 3, 4, 3, 2]；
- symmetric：表示对称填充，重复最边缘处的像素值，例如在 symmetric mode 下以每边上的2个元素填充 [1, 2, 3, 4]，那么结果应该是 [2, 1, 1, 2, 3, 4, 4, 3]。

该变换的意义是对给定的图像进行随机裁剪，返回值是一幅裁剪后的图像。
示例代码。

# -------------------------- #
# 3.随机裁剪
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(2, 3, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tfs = [transforms.RandomCrop(150, padding=None, pad_if_needed=False, fill=None, padding_mode=None),
       transforms.RandomCrop((150, 200), padding=None, pad_if_needed=False, fill=None, padding_mode=None),
       transforms.RandomCrop(250, padding=20, pad_if_needed=True, fill=255, padding_mode='constant'),
       transforms.RandomCrop(300, padding=(20, 40), pad_if_needed=True, fill=(0, 0, 255), padding_mode='edge'),
       transforms.RandomCrop(350, padding=(20, 40), pad_if_needed=True, fill=0, padding_mode='symmetric'),
       ]
titles = ['sq_no_pad', 'rec_no_pad', 'sq_cons_pad', 'sq_edge_pad', 'sq_sym_pad']

for i in range(5):
    im_i = tfs[i](im)
    figure.add_subplot(2, 3, i+2)
    plt.title(titles[i])
    plt.imshow(im_i)
    plt.axis('off')
plt.show()

(4) torchvision.transforms.RandomResizedCrop()

随机缩放裁剪：torchvision.transforms.RandomResizedCrop(size, scale=(0.08, 1.0), ratio=(0.75, 1.3333333333333333), interpolation=)

可用于 PIL Image 或 Tensor Image。

参数：

size，类型是元组序列或整数，表示裁剪后的图像大小。
- 如果 size 是一个整数，则会生成一个方形的裁剪，即输出大小为 (size，size)；
- 如果 size 是 (h, w) 类型的元组，则输出大小为 (h, w)；
- 如果提供长度为 1 的序列，那么输出大小将被认是 (size [0]，size [0])。
scale，类型是浮点型元组，表示缩放前裁剪后图像相对于原始图像的比例范围。
ratio，类型是浮点型元组，表示缩放前裁剪后图像的宽高比范围。
interpolation，由 torchvision.transforms.InterpolationMode 定义的插值模式，默认值为 InterpolationMode.NEAREST。
- 如果输入为 Tensor Image，则仅支持 InterpolationMode.NEAREST、InterpolationMode.BILINEAR；
- 为了反向兼容，也可使用整数值，eg：PIL.Image.NEAREST。

该变换的意义是将给定图像裁剪为随机的大小和宽高比，返回值是Tensor Image 或PIL Image。 上述参数执行了一个尺寸范围为 $(0.08, 1.0)$ 、宽高比范围在 $(0.75, 1.3333333333333333)$ 的随机裁剪，并将裁剪后的图像调整至 size 大小。

示例代码。

# -------------------------- #
# 4.随机缩放裁剪
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(3, 3, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tf = transforms.RandomResizedCrop(size=200, scale=(0.08, 1.0),
                                  ratio=(0.75, 1.3333333333333333), interpolation=Image.BILINEAR)
im1 = tf(im)
figure.add_subplot(1, 2, 2)
plt.title('rc')
plt.imshow(im1)
plt.axis('off')

plt.show()

(5) torchvision.transforms.TenCrop(size, vertical_flip=False)

可用于 PIL Image 或 Tensor Image。

参数：

size，类型是元组序列或整数，表示裁剪后的图像大小。
- 如果 size 是一个整数，则会生成一个方形的裁剪，即输出大小为 (size，size)；
- 如果 size 是 (h, w) 类型的元组，则输出大小为 (h, w)；
- 如果提供长度为 1 的序列，那么输出大小将被认是 (size [0]，size [0])。
vertical_flip，类型是布尔值，True 表示使用垂直翻转，False 表示使用水平翻转，默认为 False。

该变换的意义是将给定的图像裁剪为四个角和中心，以及翻转后的四个角和中心（默认情况下使用水平翻转），返回值是一个元素为 Tensor Image 或 PIL Image 的长度为 10 的元组。

示例代码。

# -------------------------- #
# 5.TenCrop()
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
# figure.add_subplot(2, 5, 1)
# plt.title('origin image')
# plt.imshow(im)
# plt.axis('off')

tf = transforms.TenCrop(100)
ims = tf(im)
titles = ['l_u', 'r_u', 'l_b', 'r_b', 'c', 'l_uf', 'r_uf', 'l_bf', 'r_bf', 'cf', ]
for i in range(10):
    figure.add_subplot(2, 5, i+1)
    plt.title(titles[i])
    plt.imshow(ims[i])
    plt.axis('off')
plt.show()

2. 翻转和旋转类

(1) torchvision.transforms.RandomHorizontalFlip(p=0.5)

可用于 PIL Image 或 Tensor Image。

参数：

p：类型是浮点型，表示水平翻转的概率，默认值是 0.5。返回值是原图或翻转后图像。

示例代码。

# -------------------------- #
# 8.随机水平翻转
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(2, 3, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tfs = [transforms.RandomHorizontalFlip(p=0.1),
       transforms.RandomHorizontalFlip(p=0.3),
       transforms.RandomHorizontalFlip(p=0.5),
       transforms.RandomHorizontalFlip(p=0.7),
       transforms.RandomHorizontalFlip(p=0.9)]

titles = ['p=0.1', 'p=0.3', 'p=0.5', 'p=0.7', 'p=0.9', ]
for i in range(5):
    im_i = tfs[i](im)
    figure.add_subplot(2, 3, i + 2)
    plt.title(titles[i])
    plt.imshow(im_i)
    plt.axis('off')
plt.show()

(2) torchvision.transforms.RandomVerticalFlip(p=0.5)

该变换与上一个随机水平翻转几乎一致，表示以给定的概率 $p$ 对输入图像执行随机垂直翻转，返回值是Tensor Image 或 PIL Image，这里就不重复叙述了。

(3) torchvision.transforms.RandomRotation()

随机旋转：torchvision.transforms.RandomRotation(degrees, interpolation=, expand=False, center=None, fill=0, resample=None)

可用于 PIL Image 或 Tensor Image。

参数：

degrees，类型是数字或元组，表示旋转的角度范围，如果给定的度数是数字而不是序列 (min, max)，则度数的范围将是 (-degrees, +degrees)。
interpolation，由 torchvision.transforms.InterpolationMode 定义的插值模式，默认值为 InterpolationMode.NEAREST。
- 如果输入为 Tensor Image，则仅支持 InterpolationMode.NEAREST、InterpolationMode.BILINEAR；
- 为了反向兼容，也可使用整数值，eg：PIL.Image.NEAREST。
expand，可选参数，布尔型，表示是否扩张输出。
- 如果为 True，则扩展输出使其足够大以容纳整个旋转后的图像；
- 如果为 False 或 None，则使输出图像的大小与输入图像的大小相同；
- 注意，expand 假定围绕中心旋转且没有平移。
center，可选参数，类型为元组，表示旋转中心 (x, y)，默认是图像的中心，原点是图像左上角。
fill，类型为数字或元组序列，表示转换后图像外部区域的像素填充值，默认值为0。
- 如果类型为数字，则该值用于所有分段；
- 如果输入为PIL Image，则该选项仅适用于 Pillow> = 5.0.0 的版本。
resample，可选参数，类型为整数，官方表示不推荐使用该参数，且自 v0.10.0 版本起将被删除，如有需要改用 interpolation 参数，Image.NEAREST (0), Image.BILINEAR (2) or Image.BICUBIC (3)。

该变换的意义是按给定角度旋转图像，返回值是Tensor Image 或 PIL Image。

示例代码。

# -------------------------- #
# 3.随机旋转
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片


figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(1, 2, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tfs = transforms.RandomRotation((40, 90), expand=True)
im1 = tfs(im)
figure.add_subplot(1, 2, 2)
plt.title('r')
plt.imshow(im1)
plt.axis('off')

plt.show()

3. 图像变换类

(1) torchvision.transforms.Resize()

缩放：torchvision.transforms.Resize(size, interpolation=)

可用于 PIL Image 或 Tensor Image。

参数：

size，类型是元组序列或整数，表示裁剪后的图像大小。
- 如果 size 是一个整数，则图像的较短边会与该数匹配，即如果 h > w，图像将被缩放为 (size * height / width, size)；
- 如果 size 是 (h, w) 类型的元组，则输出大小为 (h, w)；
- 在 torchscript 模式下，不支持单个 int 的 size，需要使用长度为 1 的序列：[size, ]。
interpolation，由 torchvision.transforms.InterpolationMode 定义的插值模式，默认值为 InterpolationMode.NEAREST。
- 如果输入为 Tensor Image，则仅支持 InterpolationMode.NEAREST、InterpolationMode.BILINEAR；
- 为了反向兼容，也可使用整数值，eg：PIL.Image.NEAREST。

该变换的意义是将输入图像调整至给定的尺寸，返回值是Tensor Image 或 PIL Image。

示例代码。

# -------------------------- #
# 1.缩放 Resize()
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(2, 2, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tfs = [transforms.Resize(150, interpolation=0),
       transforms.Resize((100, 200), interpolation=0),
       transforms.Resize(80, interpolation=2)]
titles = ['square-0', 'rectangle-0', 'square-2']
for i in range(3):
    im_i = tfs[i](im)
    figure.add_subplot(2, 2, i+2)
    plt.title(titles[i])
    plt.imshow(im_i)
    plt.axis('off')
plt.show()

(2) torchvision.transforms.Normalize()

归一化：torchvision.transforms.Normalize(mean, std, inplace=False)

只能用于 Tensor Image。

参数：

mean，类型是元组序列，表示每个通道的均值；
std，类型是元组序列，表示每个通道的标准差；
inplace，可选参数，类型是布尔值，表示是否以 in-place 执行该操作。

该变换的意义是用均值和标准差对 Tensor Image 进行归一化，即给定 n 个通道的均值 (mean[1], mean[2], ..., mean[n]) 和标准差 (std[1], std[2]), ..., std[n]，那么输出图像：output[channel] = (input[channel] - mean[channel])/std[channel]，返回值是 Tensor Image。

示例代码。

# -------------------------- #
# 2.归一化
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片


figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(1, 3, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tf1 = transforms.Compose([transforms.ToTensor(),
                          transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225))])
tf2 = transforms.ToPILImage()
im_tensor = tf1(im)
im_pil = tf2(im_tensor)
figure.add_subplot(1, 2, 2)
plt.title('normalized')
plt.imshow(im_pil)
plt.axis('off')
plt.show()

这个输出的图片有点吓人哈哈哈~

(3) torchvision.transforms.Pad()

填充：torchvision.transforms.Pad(padding, fill=0, padding_mode='constant')

可用于 PIL Image 或 Tensor Image。

参数：

padding，类型是元组序列或整数，表示用于填充边界的大小。
- 如果 padding 是一个整数，那么填充将作用于所有边上；
- 如果 padding 是一个 长度为2 的序列，那么对应序列中不同值的填充将对应作用于 左/右 和 上/下 边界上；
- 如果 padding 是一个 长度为4 的序列，那么对应序列中不同值的填充将对应作用于 左、上、右、下 边界上。
- 注意，在 torchscript 模式下是不支持 single int 填充的，因此需要使用 长度为1 的序列 [padding,]。
fill，类型是数字或字符串或元组，表示用于常值填充的像素值，也就是仅当 padding_mode=constant 时才会用到该参数。
- 默认是0；
- 如果是长度为3 的元组，那么分别用于填充R、G、B通道；
- 注意，对于 Tensor Image 仅支持数字类型，对于 PIL Image 支持整数或字符串或元组类型。
padding_mode，表示填充的类型，有以下几种选择：
- constant：表示常值填充，常值由参数 fill 指定，默认填充类型；
- edge：表示以图像边缘处的最后一个像素值进行填充。如果输入是一个 5D 的 Tensor Image，那么最后的三个维度会被填充；
- reflect：表示反射填充，但不重复最边缘处的像素值，例如在 reflect mode 下以每边上的2个元素填充 [1, 2, 3, 4]，那么结果应该是 [3, 2, 1, 2, 3, 4, 3, 2]；
- symmetric：表示对称填充，重复最边缘处的像素值，例如在 symmetric mode 下以每边上的2个元素填充 [1, 2, 3, 4]，那么结果应该是 [2, 1, 1, 2, 3, 4, 4, 3]。

该变换的意义是在特定的填充模式下对以给定的填充值对图像进行填充，返回值是一幅填充后的图像。
示例代码。

# -------------------------- #
# 3.填充
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(3, 3, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tfs = [transforms.Pad(padding=20, fill=0, padding_mode='constant'),
       transforms.Pad(padding=20, fill=(255, 0, 255), padding_mode='constant'),
       transforms.Pad(padding=20, fill=255, padding_mode='constant'),
       transforms.Pad(padding=(20, 40), fill=0, padding_mode='constant'),
       transforms.Pad(padding=(20, 40, 60, 80), fill=0, padding_mode='constant'),
       transforms.Pad(padding=30, fill=0, padding_mode='edge'),
       transforms.Pad(padding=40, fill=0, padding_mode='reflect'),
       transforms.Pad(padding=50, fill=0, padding_mode='symmetric'),
       transforms.Grayscale(num_output_channels=1),
       transforms.Grayscale(num_output_channels=3)]
titles = ['all-black-padding', 'all-purple-padding', 'all-red-padding',
          'lr-tb-padding', 'l-t-r-b-padding',
          'edge-mode', 'reflect-mode', 'symmetric-mode']
for i in range(8):
    im_i = tfs[i](im)
    figure.add_subplot(3, 3, i+2)
    plt.title(titles[i])
    plt.imshow(im_i)
    plt.axis('off')
plt.show()

(4) torchvision.transforms.Grayscale(num_output_channels)

可用于 PIL Image 或 Tensor Image。

参数：

num_output_channels，指输出通道数。
- 当设置为 1 时，输出为通道数=1 的灰度图；
- 当设置为 3 时，输出为通道数=3 的彩色图，通道为 (r,g,b)。

该转换的意义是将图像转换为灰度图，同样适用于 PIL Image 或 Tensor Image 的图像类型，返回值是一幅灰度图像。

示例代码。

# -------------------------- #
# 4.转换为灰度图
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(1, 3, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tfs = [transforms.Grayscale(num_output_channels=1),
       transforms.Grayscale(num_output_channels=3)]
titles = ['out_c=1', 'out_c=3']

for i in range(2):
    im_i = tfs[i](im)
    figure.add_subplot(1, 3, i+2)
    plt.title(titles[i])
    plt.imshow(im_i)
    plt.axis('off')
plt.show()

(5) torchvision.transforms.RandomGrayScale(p=0.1)

可用于 PIL Image 或 Tensor Image。

参数：

p：类型为浮点型，表示图像被转换为灰度图的概率，默认为 0.1。
- 如果输入图像是 1 通道，那么输出的灰度图也是 1 通道；
- 如果输入图像是 3 通道：那么输出的灰度图也是 3 通道，其中 r == g == b 。

该变换的意义是以一个给定的概率 p 对图像进行灰度图转换，因此返回值是原图或灰度图，保持原图的概率为 1-p。

示例代码。

# -------------------------- #
# 5.随机转换灰度图
# -------------------------- #

from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(2, 3, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tfs = [transforms.RandomGrayscale(p=0.1),
       transforms.RandomGrayscale(p=0.3),
       transforms.RandomGrayscale(p=0.5),
       transforms.RandomGrayscale(p=0.7),
       transforms.RandomGrayscale(p=0.9)]

titles = ['p=0.1', 'p=0.3', 'p=0.5', 'p=0.7', 'p=0.9', ]
for i in range(5):
    im_i = tfs[i](im)
    figure.add_subplot(2, 3, i+2)
    plt.title(titles[i])
    plt.imshow(im_i)
    plt.axis('off')
plt.show()

(6) torchvision.transforms.ColorJitter()

随机更改图像的亮度，对比度，饱和度和色调：torchvision.transforms.ColorJitter(brightness=0, contrast=0, saturation=0, hue=0)

可用于PIL Image或Tensor Image。

参数：

brightnesss：类型为浮点型数字或浮点型元组 (min, max)，表示对亮度进行调整的程度，应为非负数，因此该参数会从 (max(0, 1 - brightness), 1 + brightness) 中选取。
contrast：类型为浮点型数字或浮点型元组 (min, max)，表示对比度的调整程度，应为非负数，因此该参数会从 (max(0, 1 - contrast), 1 + contrast) 中选取。
saturation：类型为浮点型数字或浮点型元组 (min, max)，表示对饱和度进行调整的程度，应为非负数，因此该参数会从 (max(0, 1 - saturati), 1 + saturation) 中选取。
hue：类型为浮点型数字或浮点型元组 (min, max)，表示对色调进行调整的程度。如果给定浮点型数字，那么选取范围为 [-hue, hue]，否则为 [min, max]，该参数应当满足：0 <= hue <= 0.5，或 -0.5 <= min <= max <= 0.5

该变换的意义是返回值是随机更改图像的亮度，对比度，饱和度和色调，如果输入图像是 PIL Image，则不支持模式为 1, L, I, F 或具有 alpha channel 的模式，返回值为Tensor Image 或PIL Image。

示例代码。

# -------------------------- #
# 6.色度变化 ColorJitter()
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(2, 3, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tfs = [transforms.ColorJitter(brightness=0.5, contrast=0, saturation=0, hue=0),
       transforms.ColorJitter(brightness=0, contrast=0.5, saturation=0, hue=0),
       transforms.ColorJitter(brightness=0, contrast=0, saturation=0.5, hue=0),
       transforms.ColorJitter(brightness=0, contrast=0, saturation=0, hue=0.5),
       transforms.ColorJitter(brightness=0.2, contrast=0.1, saturation=0.5, hue=0.3)]
titles = ['b', 'c', 's', 'h', 'bcsh']

for i in range(5):
    im_i = tfs[i](im)
    figure.add_subplot(2, 3, i+2)
    plt.title(titles[i])
    plt.imshow(im_i)
    plt.axis('off')
plt.show()

(7) torchvision.transforms.RandomAffine()

随机仿射：torchvision.transforms.RandomAffine(degrees, translate=None, scale=None, shear=None, interpolation=, fill=0, fillcolor=None, resample=None)

可用于 PIL Image 或 Tensor Image。

参数：

degrees：可供选择的旋转度数范围，类型是数字或元组序列。
- 如果是数字，那么实际范围是 (-degrees, +degrees)；
- 如果是序列，那么范围直接就是 (min, max)；
- degrees=0 表示不进行旋转。
translate：可选参数，类型是元组，表示水平和垂直方向上最大平移的绝对值比例，默认不进行平移。例如，translate=(a,b)，那么水平方向的平移程度 dx 将从 (-img_width * a, img_width * a) 中随机抽取，垂直方向的平移程度 dy 将从 (-img_height * b, img_height * b) 中随机抽取。
scale：可选参数，类型是元组，表示缩放因子的区间，默认不进行缩放。例如，scale=(a,b)，那么缩放因子将从 (a,b) 中随机抽取。
shear：可选参数，类型是数字或元组序列，表示可供选择的剪切度数范围，默认不进行剪切。
- 如果是数字，(-shear, shear) 范围内的平行剪切将会应用在x轴上；
- 如果是长度为2 的元组，那么(shear[0], shear[1]) 范围内的平行剪切将会应用在x轴上；
- 如果是长度为4 的元组，那么(shear[0], shear[1]) 范围内的剪切会应用在x轴上，(shear[2], shear[3]) 范围内的剪切会应用在y轴上。
interpolation：由 torchvision.transforms.InterpolationMode 定义的插值模式，默认值为 InterpolationMode.NEAREST。
- 如果输入为 Tensor Image，则仅支持 InterpolationMode.NEAREST、InterpolationMode.BILINEAR；
- 为了反向兼容，也可使用整数值，eg：PIL.Image.NEAREST。
fill，类型为数字或元组序列，表示转换后图像外部区域的像素填充值，默认值为0。
- 如果类型为数字，则该值用于所有分段；
- 如果输入为PIL Image，则该选项仅适用于 Pillow> = 5.0.0 的版本。
fillcolor，可选参数，类型是数字或元组序列，官方表示不推荐使用该参数，且自 v0.10.0 版本起将被删除，如有需要改用 fill 参数。
resample，可选参数，类型为整数，官方表示不推荐使用该参数，且自 v0.10.0 版本起将被删除，如有需要改用 interpolation 参数，Image.NEAREST (0), Image.BILINEAR (2) or Image.BICUBIC (3)。

该变换的意义是保持中心不变的随机仿射，返回值是一幅仿射后的图像。

但是在Pytorch中使用时，发现参数和官网上的不太一致，所以示例代码中只展示了可以使用的参数：

示例代码。

# -------------------------- #
# 7.随机仿射变换
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(3, 3, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tfs = [transforms.RandomAffine(135, fillcolor=(255, 0, 0)),
       transforms.RandomAffine((45, 90), fillcolor=(0, 0, 255)),
       transforms.RandomAffine(0, translate=(0, 0.5), fillcolor=(0, 255, 0)),
       transforms.RandomAffine(0, scale=(0.5, 2), fillcolor=125),
       transforms.RandomAffine(0, shear=(10, 20, 30, 40), fillcolor=225),
       transforms.RandomAffine(0, fillcolor=175, resample=0),
       transforms.RandomAffine(0, fillcolor=75, resample=2),
       transforms.RandomAffine(0, translate=(0, 0.5), scale=(0.5, 2), shear=(5, 10, 15, 20), fillcolor=255, resample=0)
       ]
titles = ['135 rotation', '(45,90) rotation', 'translate', 'scale', 'shear',
          'nearest', 'Bilinear', 'all']
for i in range(8):
    im_i = tfs[i](im)
    figure.add_subplot(3, 3, i + 2)
    plt.title(titles[i])
    plt.imshow(im_i)
    plt.axis('off')
plt.show()

(8) torchvision.transforms.LinearTransformation()

线性变换：torchvision.transforms.LinearTransformation(transformation_matrix, mean_vector)

只能用于Tensor Image。
参数：

transformation_matrix：是一个形状为 [D x D] 的 tensor，其中 D=C x H x W，表示一个变换方阵；
mean_vector：是一个形状为 [D] 的 tensor，其中 D=C x H x W，表示一个均值向量。

该变换的意义是对 Tensor Image 进行线性变换（ $A x + B$ ），将输入图像减去均值向量后，与变换方阵做点积，并将结果调整至原始形状，返回值是一个Tensor Image。

(9) torchvision.transforms.RandomErasing()

随机抹除像素值：torchvision.transforms.RandomErasing(p=0.5, scale=(0.02, 0.33), ratio=(0.3, 3.3), value=0, inplace=False)

只能用于 Tensor Image。

参数：

p，类型为浮点型，表示随机擦除像素操作被执行的概率；
scale，元组序列或浮点型，表示被擦除的区域相对于输入图像的比例；
ratio，元组序列或浮点型，表示被擦除区域的宽高比；
value，类型为整数或元组序列或字符串 random，默认值为0。
- 如果为单一整数，则用于擦除所有像素；
- 如果是一个长度为 3 的元组，则分别用于擦除 R，G，B 通道的像素；
- 如果是 random，则使用随机值擦除每个像素。
inplace，类型为布尔值，默认是 False，表示是否以 in-place 执行该操作。

该变换的意义是在输入 Tensor Image 图像中随机选取一个矩形区域并将该区域中的像素擦除，返回值是 erased Tensor Image。可以参考 Random Erasing Data Augmentation

示例代码。

# -------------------------- #
# 11.随机擦除区域像素
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片


figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(1, 3, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tf1 = transforms.ToTensor()
tf2 = transforms.ToPILImage()
im_tensor = tf1(im)

tfs = [transforms.RandomErasing(p=0.8, scale=(0.02, 0.33), ratio=(0.3, 3.3), value=0, inplace=False),
       transforms.RandomErasing(p=0.8, scale=(0.05, 0.25), ratio=(3.3, 0.3), value=0, inplace=False)]
titles = ['1', '2']

for i in range(2):
    im_i = tfs[i](im_tensor)
    im_pil = tf2(im_i)
    figure.add_subplot(1, 3, i+2)
    plt.title(titles[i])
    plt.imshow(im_pil)
    plt.axis('off')
plt.show()

(10) torchvision.transforms.GaussianBlur()

高斯模糊：torchvision.transforms.GaussianBlur(kernel_size, sigma=(0.1, 2.0))

可用于 PIL Image或 Tensor Image。

参数：

kernel_size，类型为整数或元组，表示高斯核的大小。
sigma，浮点型或元组浮点型 (min, max)，表示用于创建高斯核以执行模糊的标准差。
- 如果是浮点型数字，则 sigma 是固定的；
- 如果是元组 (min, max)，则从给定范围内均匀的选择 sigma。

该变换的意义是对输入图像进行高斯模糊，返回值是Tensor Image 或 PIL Image。

(11) torchvision.transforms.RandomPerspective()

随机透视变换：torchvision.transforms.RandomPerspective(distortion_scale=0.5, p=0.5, interpolation=, fill=0)

可用于 PIL Image 或 Tensor Image。

参数：

distortion_scale，类型为浮点型数字，表示用于控制失真程度的参数，范围为 0到1，默认值为 0.5。
p，类型为浮点型数字，表示图像进行透视变换的概率，默认为 0.5。
interpolation：由 torchvision.transforms.InterpolationMode 定义的插值模式，默认值为 InterpolationMode.NEAREST。
- 如果输入为 Tensor Image，则仅支持 InterpolationMode.NEAREST、InterpolationMode.BILINEAR；
- 为了反向兼容，也可使用整数值，eg：PIL.Image.NEAREST。
fill，类型为数字或元组，表示转换后图像外部区域的像素填充值，默认值为0。
- 如果类型为数字，则该值用于所有分段；
- 如果输入为PIL Image，则该选项仅适用于 Pillow> = 5.0.0 的版本。

该变换的意义是以给定的概率 $p$ 对输入图像执行随机透视变换，返回值是Tensor Image 或 PIL Image；

示例代码。

# -------------------------- #
# 11.随机透视变换
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(1, 3, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tfs = [transforms.RandomPerspective(0.5, 0.5, interpolation=Image.BILINEAR),
       transforms.RandomPerspective(0.3, 0.7, interpolation=Image.BILINEAR)]
titles = ['0.5-0.5', '0.3-0.7']

for i in range(2):
    im_i = tfs[i](im)
    figure.add_subplot(1, 3, i+2)
    plt.title(titles[i])
    plt.imshow(im_i)
    plt.axis('off')
plt.show()

4. 图像格式转换类

(1) torchvision.transforms.ConvertImageDtype()

数据类型转换：torchvision.transforms.ConvertImageDtype(dtype: torch.dtype)

只能用于 Tensor Image。

参数：

dtype，表示所需的输出数据的类型。

该变换的意义是将 Tensor Image 转换为给定的 dtype 并相应地缩放像素值，该变换无返回值。

注意，Runtime Error，当尝试将 torch.float32 转换为 torch.int32 或torch.int64 时，以及尝试将 torch.float64 转换为 torch.int64 时，可能会导致溢出错误，因为浮点类型无法在整数类型的范围内存储连续的整数。

(2) torchvision.transforms.ToTensor

该变换的意义是：

如果 PIL Image 属于其中一种模式(L, LA, P, I, F, RGB, YCbCr, RGBA, CMYK, 1) 或 numpy.ndarray 具有 dtype = np.uint8，那么将 PIL Image 或范围为 [0, 255] 的 numpy.ndarray(H xW x C)转换为形状为 (C x H x W) 的范围为 [0.0，1.0] 的 Torch.FloatTensor Image；
在其他情况下，返回的 Tensor Image 不进行缩放。

(3) torchvision.transforms.ToPILImage(mode=None)

参数：

mode，可选参数，表示输入数据的色彩模式和像素深度，默认为None。
- 如果输入具有 4 个通道，则假定该模式为 RGBA；
- 如果输入具有 3 个通道，则该模式假定为 RGB；
- 如果输入具有 2 个通道，则该模式假定为 LA；
- 如果输入具有1个通道，则模式由数据类型（即 int，float，short）决定。

该变换的意义是将形状为 C x H x W 的 Tensor Image 或形状为 H x W x C 的 Ndarray Image 转换为 PIL Image，此转换不支持torchscript。

5. 系列变换类

(1) torchvision.transforms.RandomApply()

随机应用变换：torchvision.transforms.RandomApply(transforms, p=0.5)

可应用于 PIL Image 或 Tensor Image。

参数：

transforms，类型为序列或 torch.nn.Module，表示一个以变换为元素的列表。
p，表示给定的应用列表中变换的概率。

该变换的意义是以给定的概率 $p$ 对输入图像做一系列的变换 transforms；

# -------------------------- #
# 1.随机应用 RandomApply()
# -------------------------- #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(1, 3, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tfs = [transforms.CenterCrop(200),
       transforms.Grayscale(num_output_channels=3),
       transforms.ColorJitter(0.5, 0.5, 0.5, 0.5)]
tf = [transforms.RandomApply(tfs, 0.7),
      transforms.RandomApply(tfs, 0.5)]
titles = ['p=0.7', 'p=0.5']

for i in range(2):
    im_i = tf[i](im)
    figure.add_subplot(1, 3, i + 2)
    plt.title(titles[i])
    plt.imshow(im_i)
    plt.axis('off')
plt.show()

(2) torchvision.transforms.RandomChoice()

随机选择一个变换：torchvision.transforms.RandomChoice(transforms)

仅适用于 PIL Image 的变换。

参数：

transforms，表示一个以变换为元素的列表。

该变换的意义是从变换列表 transforms 中随机选择一个转换应用于输入图像，此转换不支持torchscript。

示例代码。

# ------------------------------ #
# 2.随机选择变换应用 RandomChoice()
# ------------------------------ #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(1, 2, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tfs = [transforms.CenterCrop(200),
       transforms.Grayscale(num_output_channels=3),
       transforms.ColorJitter(0.5, 0.5, 0.5, 0.5)]
tf = transforms.RandomChoice(tfs)
im1 = tf(im)
figure.add_subplot(1, 2, 2)
plt.title('choice')
plt.imshow(im1)
plt.axis('off')
plt.show()

(3) torchvision.transforms.RandomOrder()

以随机顺序应用列表中变换：torchvision.transforms.RandomOrder(transforms)

仅适用于 PIL Image 的变换。

参数：

transforms，表示一个以变换为元素的列表。

该变换的意义是以随机顺序对输入图像应用变换列表 transforms 中的转换，此转换不支持torchscript。
示例代码。

# ------------------------------ #
# 3.随机顺序应用变换 RandomOrder()
# ------------------------------ #
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt  # plt 用于显示图片

figure = plt.figure()
im = Image.open('./data/faces/person.jpg')  # im.size=(239,209)

# 展示原图像
figure.add_subplot(1, 2, 1)
plt.title('origin image')
plt.imshow(im)
plt.axis('off')

tfs = [transforms.CenterCrop(200),
       transforms.Grayscale(num_output_channels=3),
       transforms.ColorJitter(0.5, 0.5, 0.5, 0.5)]
tf = transforms.RandomOrder(tfs)
im1 = tf(im)
figure.add_subplot(1, 2, 2)
plt.title('choice')
plt.imshow(im1)
plt.axis('off')
plt.show()

6. 通用变换

torchvision.transforms.lambda

参数：

lambda，相当于函数，用于转换。

该变换需要用户自定义lambd，此转换不支持torchscript。可以看下官网的例子，

7. 组合变换

torchvision.transforms.Compose(transforms)

参数：

transforms，是一个 Transform objects 构成的列表。

表示将几个变换组合在一起使用，此转换不支持torchscript。例如，

>>> transforms.Compose([
>>>     transforms.CenterCrop(10),
>>>     transforms.ToTensor(),
>>> ])

你可能感兴趣的:(蜗牛般的Pytorch小时工,pytorch)

java笔记——Map循环指南啊健的影子 java 笔记 python
一、遍历Map的三种方法Java中的Map是一种以键值对形式存储数据的容器，常用的实现类有HashMap、LinkedHashMap和TreeMap。遍历Map是我们在使用Map时最常遇到的问题之一，下面介绍三种常用的遍历方法。1.通过entrySet遍历Mapmap=newHashMap();map.put(1,"one");map.put(2,"two");map.put(3,"three")
如何使用Vue3创建在线三维模型展示？ ScriptEcho 前端
本文由ScriptEcho平台提供技术支持项目地址：传送门代码相关的技术博客代码应用场景介绍本段代码使用RoughJS库在HTML5Canvas上创建了手绘风格的图像，展示了RoughJS库的强大功能，可用于创建具有有机手绘外观的图形。代码基本功能介绍代码通过RoughJS库创建了一个火焰状的图形，包括：火焰主体：使用path()函数绘制，采用不规则的形状和粗糙的线条。火焰细节：添加了额外的pat
基于GPT一键完成数据分析全流程的AI Agent: Streamline Analyst Wilson_ZheLIN gpt4 ai agent llms 数据分析
大型语言模型（LLM）的兴起不仅为获取知识和解决问题开辟了新的可能性，而且催生了一些新型智能系统，例如旨在辅助用户完成特定任务的AICopilot以及旨在自动化和自主执行复杂任务的AIAgent，使得编程、创作等任务变得高效而条理。在数据科学和可视化方面，非常多家AICopilot通过提供智能提示、建议或辅助决策等手段有效减小了用户的工作量。但是很少有app针对不同种类数据的预处理、建模、可视化等
Java进阶篇之Lambda表达式 code2cat Java Java进阶开发语言 java ide intellij-idea idea myeclipse
引言在前面的文章中，我们介绍了线程池（Java进阶篇之线程池）。你是不是经常遇到需要写大量匿名内部类的情况？比如，我们在使用Java的集合、事件监听器、或者某些框架时，常常需要实现接口中的单一方法。传统的方式往往会导致代码冗长，影响可读性。而Lambda表达式的出现，正是为了简化这些重复的代码，让我们能够以更加简洁、优雅的方式表达操作。今天，我们将深入探讨Java中的Lambda表达式，看看它如何
从零开始掌握哈夫曼树：数据压缩与Python实现详解吴师兄大模型 python 数据结构哈夫曼树哈弗曼编码数据压缩算法开发语言
系列文章目录01-从零开始掌握Python数据结构：提升代码效率的必备技能！02-算法复杂度全解析：时间与空间复杂度优化秘籍03-线性数据结构解密：数组的定义、操作与实际应用04-深入浅出链表：Python实现与应用全面解析05-栈数据结构详解：Python实现与经典应用场景06-深入理解队列数据结构：从定义到Python实现与应用场景07-双端队列（Deque）详解：Python实现与滑动窗口应
WebSocket协议解析 : 双向实时通信的利器氦客网络 websocket 网络协议 HTTP 全双工实时通信局域网工作原理
1.WebSocket是什么WebSocket是一种在单个TCP连接上进行全双工通信的协议。WebSocket允许客户端和服务器之间进行实时的双向通信。这意味着服务器可以主动推送数据到客户端，而不需要客户端每次都发送请求来获取数据。这种通信方式通过长连接实现，即连接建立后，可以持续进行数据传输，直到一方主动关闭连接。1.1什么是实时通信?传统的通信方式，比如电子邮件或者普通的网页浏览，通常都会存在
基于AI的养老服务信息平台毕业设计：技术实现与论文分析（含程序，论文）码农Q103237121Q 人工智能课程设计
图1摘要：随着人口老龄化的不断加剧，养老服务需求日益增长，传统的养老服务模式已难以满足当前社会的需求。为此，本文设计并实现了一个基于AI的养老服务信息平台，旨在为老年人提供更加智能化、个性化的养老服务。本文首先深入分析了老年人的生活需求，明确了系统的功能需求，包括健康监测、紧急救援、生活辅助、社交娱乐及养老院挑选与入住服务等多个方面。在系统设计方面，采用模块化设计思想，将系统划分为多个功能模块，并
C语言数组之字符数组椒绿个屁 c语言算法数据结构
C语言主要内容数组字符数组数组字符数组概念元素类型为char字符型的数组，字符数组往往是用来存储字符串数组的。需要注意的一点是，我们C语言中的字符是字节字符。字节字符：也就是1个字符占一个字节，在C语言中，我们使用char表示字节。测试题：chara='A';//正确charb='1';//正确charc=65;//正确，char支持两种赋值形式，一种是字符，一种是数值，如果是数值表示ASCII码
JS(70-89) 小箌 javascript 开发语言学习
01_内置对象-Math介绍：Math对象是JavaScript提供的一个“数学”对象作用：提供了一系列做数学运算的方法Math对象包含的方法有：random：生成0-1之间的随机数（包含0不包括1）ceil：向上取整floor：向下取整max：找最大数min：找最小数pow：幂运算abs：绝对值生成任意范围随机数介绍：Math.random()随机数函数，返回一个0-1之间，并且包括0不包括1的
如何有效防止TikTok多店铺入驻时IP关联问题？ IPdodo全球网络服务网络
随着TikTok在全球电商领域的崛起，越来越多的商家选择在平台上开设多个店铺，扩大品牌的曝光和销售。然而，随着店铺数量的增加，如何避免因IP关联而导致店铺被封禁或处罚，成为商家们的一大难题。IP关联问题是指在TikTok平台上，多个店铺在后台系统中被识别为同一设备或同一网络下运营，从而被认为是“同一运营主体”进行多个店铺的管理。这种情况可能导致平台对店铺的运营进行限制或封禁，从而影响商家的正常运营
JS(1-69) 小箌 javascript 开发语言学习
01_JS介绍1.1JS是什么1.JavaScript（是什么？)是一种运行在客户端（浏览器）的编程语言，实现人机交互效果。2.作用（做什么？)网页特效（监听用户的一些行为让网页作出对应的反馈)表单验证（针对表单数据的合法性进行判断）数据交互（获取后台的数据，渲染到前端服务端编程（node.js)3.JavaScript的组成（有什么？)ECMAScript:规定了js基础语法核心知识。口比如：变
内聚的程度冰暮流星软设笔记软件工程笔记
偶然内聚:一个模块内各处理元素之间没有任何联系。关键字:无直接关系逻辑内聚:模块内执行若干个逻辑上相似的功能，通过参数确定该模块完成哪一个功能。关键字:逻辑相似，参数决定时间内聚:把需要同时执行的动作组合成一起行成的模块。关键字:同时执行过程内聚:一个模块完成多个任务，这些任务必须按指定的过程执行。关键字:指定的过程顺序通信内聚:模块内所有处理元素都在同一个数据结构上操作，或者各处理使用相同的输入
Windows逆向工程入门之调用约定 0xCC说逆向 windows 汇编开发语言逆向安全
公开视频->链接点击跳转公开课程博客首页->链接点击跳转博客主页目录调用约定调用约定约定规则cdeclstdcallfastcallthiscall调用约定调用约定调用约定（CallingConvention）：确定了函数调用时参数传递、返回值处理以及寄存器使用的规则。堆栈（Stack）：用于存储函数的参数、返回地址和局部变量。约定规则cdecl参数从右到左压入堆栈。调用者负责清理堆栈。#incl
BSD协议栈：UDP输入 skaiuijing TCP/IP协议栈 udp 网络协议网络
UDP输入输入函数的目标是把UDP数据报放到合适的插口缓存内，然后唤醒该插口上因输入阻塞的所有进程或线程（唤醒需要依靠操作系统的IPC机制）。分为三个步骤：1.确认消息并简单处理输入的数据2.处理目的地址是单播类型的数据报：提交给单个socket即可3.处理目的地址是广播或多播类型的数据报：需要找到所有需要提交的socket处理输入的代码如下：代码主要是验证数据报长度，有两个参数：ip_len与u
关于前端产品在低代码上的探索：解锁中台架构的更多可能代码简单说前端低代码架构
撮合前端平台在低代码平台上的落地探索：解锁中台架构的更多可能前言在当前技术高速发展的环境中，中台架构的应用早已成为大规模企业的常态，尤其是在拥有多业务线的公司。中台不仅简化了跨部门协作的流程，还提高了业务的响应速度和创新能力。这种架构的核心在于复用已有能力，实现快速上线和低成本运维。然而，前端业务高度依赖用户需求的变化，需要更灵活的动态能力，因此构建一个灵活的“前端中台”成为我们新的探索方向。在撮
Zookeeper 和 Redis 哪种更好？离别情诗雨 zookeeper redis 分布式
目录前言：什么是Zookeeper和Redis？1.核心定位与功能2.关键差异点(1)一致性模型(2)性能(3)数据容量(4)高可用性3.适用场景使用Zookeeper的场景使用Redis的场景4.替代方案5.如何选择？6.常见误区7.总结前言：什么是Zookeeper和Redis？这个问题看起来有点笼统，需要先了解他们的具体用途和区别。首先，我得确认用户的使用场景是什么？因为这两个工具虽然都是分
ffmpeg源码分析：avformat_open_input() 风雨兼程8023 ffmpeg ffmpeg
目录一、avformat_alloc_context()二、init_input()2.1av_probe_input_format2()2.2av_probe_input_buffer2()2.3io_open三、read_header()本文简单分析FFmpeg中一个常用的函数：avformat_open_input()。该函数用于打开多媒体数据并且获得一些相关的信息。它的声明位于libavf
FFMpeg 源码分析（3）avformat_open_input（）雷霆小屁熊 FFmpeg ffmpeg
这个函数主要用来打开媒体资源。完成媒体格式的探测和获取相关的媒体信息的工作。函数完成定义如下：intavformat_open_input(AVFormatContext**ps,constchar*filename,AVInputFormat*fmt,AVDictionary**options){AVFormatContext*s=*ps;inti,ret=0;AVDictionary*tmp=
如何查看自己电脑是什么架构 F—— 运维学习运维安全
1.win+R打开运行，输入msinfo32，回车。2.弹出系统信息面板，“系统类型”显示架构类型；如果显示“基于x64的电脑”，则你的操作系统是64位的，通常对应的是AMD架构；如果显示“基于ARM的电脑”，则你的操作系统是ARM架构的。
【为什么有些公司禁止使用@Transactional声明式事务？】 @Corgi Java面试题面试题事务 Transactional
为什么有些公司禁止使用@Transactional声明式事务？1.长事务问题2.嵌套调用混乱3.可读性和维护性下降4.统一事务管理需求5.示例说明6.结论有些公司禁止使用@Transactional声明式事务，主要出于以下几个原因：1.长事务问题如果一个方法中存在较多耗时的操作，很容易引发长事务的问题。长事务会带来锁的竞争和性能的消耗，同时也会导致数据库连接池耗尽，影响程序的正常执行。例如，在事务
【@Component和@Bean的区别？】 @Corgi Java面试题 java 面试题 spring
@Component和@Bean的区别？@Component注解@Bean注解区别详解示例代码@Component示例@Bean示例总结@Component注解@Component是一个通用性的注解，用于标识一个类为Spring容器的组件。当你给一个类加上@Component注解后，Spring容器会在启动时自动扫描并实例化这个类，然后将其注册为Bean。这个过程通常是通过类路径扫描来完成的，Sp
后量子密码学：量子安全新防线量子信使量子计算密码学信息与通信深度学习安全算法机器学习
目录背景主要算法介绍基于格的密码学格的概念格密码学中的难题加密和解密过程基于多变量多项式的密码学多变量多项式基础多变量多项式密码学中的难题加密和签名过程基于编码的密码学纠错码简介编码密码学中的难题加密和解密过程安全性分析传统密码学算法在量子计算环境下的安全性RSA算法的破解风险椭圆曲线密码算法的脆弱性后量子密码学算法的安全性评估基于格的密码学算法基于多变量多项式的密码学算法基于编码的密码学算法后量
Java中List、Set、Map 之间的区别是什么？伟主教 java基础篇 java list windows
在Java中，List、Set和Map是三种常见的集合接口，它们有不同的特性和使用场景。以下是它们之间的主要区别：1.List定义：List是一种有序的集合，允许包含重复的元素。实现类：常见实现类有ArrayList、LinkedList、Vector等。特点：元素按插入顺序排列。可以通过索引访问元素。允许添加重复的元素。常用方法：add(Ee)：添加元素。get(intindex)：通过索引获取
BUUCTF 逆向工程(reverse)之Java逆向解密若丶时光破灭 CTF-逆向工程 CTF 逆向工程
程序员小张不小心弄丢了加密文件用的秘钥，已知还好小张曾经编写了一个秘钥验证算法，聪明的你能帮小张找到秘钥吗？注意：得到的flag请包上flag{}提交下载好题目后，发现它是个以.class为后缀的。所以用JD-GUI打开这个文件。就可以看到Java代码importjava.util.ArrayList;importjava.util.Scanner;publicclassReverse{publi
鸿蒙Next 图片高斯模糊处理 anthonyzhu harmonyos 华为
鸿蒙next中对图片的高斯模糊处理，主要是使用effectKit实现针对的pixelMap,代码处理如下所示importeffectKitfrom'@ohos.effectKit'import{image}from'@kit.ImageKit';try{letfd=fs.openSync(result,fs.OpenMode.READ_ONLY).fd;conststat=fs.statSync(
Dio分析-HttpClientAdapter anthonyzhu flutter
官方描述用于Dio与底层HttpClient间的桥接。Dio向业务层开发者提供标准和友好的API接口HttpClient,Dart底层真实的网络请求处理对象。通过HttpClientAdapter，开发者可以使用各种自定义HttpClient，而非dart:io:HttpClient,只需要通过HttpClientAdapter实现桥接。如果开发者想要定制HttpClientAdapter,可以使
深入解析 iOS 视频录制（一）：录制管理核心MWRecordingController 类的设计与实现胖虎1 媒体捕捉开发经验分享音视频音视频录制自定义录制 AVFoundation
深入解析iOS视频录制（一）：录制管理核心MWRecordingController类的设计与实现深入解析iOS视频录制（二）：自定义UI的实现深入解析iOS视频录制（三）：完整录制流程的实现与整合引言在iOS应用开发中，视频录制功能越来越常见，尤其是在直播、短视频和社交应用中，用户经常需要录制高质量的视频内容。为了实现这个功能，我们不仅需要处理视频的输入和输出，还要控制摄像头的切换、录制的开始与
python如何无密码登录_服务器之间实现免密登录的简易教程行者无疆0123 python如何无密码登录
今天这篇文章主要是教会大家如何实现服务器之间的免密登录。1、先在所有服务器上执行命令：ssh-keygen-tdsa-P''-f~/.ssh/id_dsamaster服务器slave1服务器slave2服务器2、而后在所有服务器上执行命令：cat~/.ssh/id_dsa.pub>>~/.ssh/authorized_keysmaster服务器slave1服务器slave2服务器3、之后将每台服务
银河麒麟V10安装docker和docker-compose lj907722644 Docker Linux docker 容器运维
1.说明系统镜像使用的是Kylin-Server-V10-SP3-2403-Release-20240426-x86_64.iso如果是在VMware中安装这个系统，需选择Ubuntu，如果选Centos会有问题。尝试使用在线方式安装docker，报了很多错误，比较麻烦，建议使用离线方式安装。下面是离线包下载路径，根据服务器架构信息下载对应的安装包。本文将介绍离线安装的方式。docker安装包下载
DRF框架使用djangorestframework-simplejwt实现自定义用户类的token校验 lj907722644 Python python django jwt DRF simplejwt
1.安装simplejwt库并修改settings.py安装simplejwtpipinstalldjangorestframeworkpipinstalldjangorestframework-simplejwt修改settings.py注册应用INSTALLED_APPS=[...'rest_framework','rest_framework_simplejwt',]设置jwt鉴权REST_
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

Pytorch(三)：数据变换 Transforms

目录

0. 简介

1. 裁剪类

(1) torchvision.transforms.CenterCrop(size)

(2) torchvision.transforms.FiveCrop(size)

(3) torchvision.transforms.RandomCrop()

(4) torchvision.transforms.RandomResizedCrop()

(5) torchvision.transforms.TenCrop(size, vertical_flip=False)

2. 翻转和旋转类

(1) torchvision.transforms.RandomHorizontalFlip(p=0.5)

(2) torchvision.transforms.RandomVerticalFlip(p=0.5)

(3) torchvision.transforms.RandomRotation()

3. 图像变换类

(1) torchvision.transforms.Resize()

(2) torchvision.transforms.Normalize()

(3) torchvision.transforms.Pad()

(4) torchvision.transforms.Grayscale(num_output_channels)

(5) torchvision.transforms.RandomGrayScale(p=0.1)

(6) torchvision.transforms.ColorJitter()

(7) torchvision.transforms.RandomAffine()

(8) torchvision.transforms.LinearTransformation()

(9) torchvision.transforms.RandomErasing()

(10) torchvision.transforms.GaussianBlur()

(11) torchvision.transforms.RandomPerspective()

4. 图像格式转换类

(1) torchvision.transforms.ConvertImageDtype()

(2) torchvision.transforms.ToTensor

(3) torchvision.transforms.ToPILImage(mode=None)

5. 系列变换类

(1) torchvision.transforms.RandomApply()

(2) torchvision.transforms.RandomChoice()

(3) torchvision.transforms.RandomOrder()

6. 通用变换

torchvision.transforms.lambda

7. 组合变换

torchvision.transforms.Compose(transforms)

你可能感兴趣的:(蜗牛般的Pytorch小时工,pytorch)