Pytorch上下采样函数--interpolate()

torch.nn.functional.interpolate实现插值和上采样

上采样:可以使你训练的图片分辨率变成你想要的更大的分辨率

将输入图片input image进行rescale到一个想要的尺寸,而且计算每个点的像素点,使用如双线性插值bilinear等插值方法对其余点进行插值。

torch.nn.functional.interpolate(input, size=None, scale_factor=None, mode='nearest', align_corners=None)

参数:

input (Tensor):输入张量

size (int or Tuple[int] or Tuple[int, int] or Tuple[int, int, int]) :输出大小.

scale_factor (float or Tuple[float]) :指定输出为输入的多少倍数。如果输入为tuple,其也要制定为tuple类型 ;  根据给定的size或scale_factor参数来对输入进行下/上采样

mode (str) : 可使用的上采样算法,有’nearest’, ‘linear’, ‘bilinear’, ‘bicubic’ , ‘trilinear’和’area’. 默认使用’nearest;  使用的插值算法取决于参数mode的设置

align_corners (booloptional) :

几何上,我们认为输入和输出的像素是正方形,而不是点。如果设置为True,则输入和输出张量由其角像素的中心点对齐,从而保留角像素处的值。如果设置为False,则输入和输出张量由它们的角像素的角点对齐,插值使用边界外值的边值填充;当scale_factor保持不变时,使该操作独立于输入大小。仅当使用的算法为'linear''bilinear', 'bilinear'or 'trilinear'时可以使用。默认设置为False

注意:

使用mode='bicubic'时,可能会导致overshoot问题,即它可以为图像生成负值或大于255的值。如果你想在显示图像时减少overshoot问题,可以显式地调用result.clamp(min=0,max=255)。

示例一:

import torch.nn.functional as tnf

up2=tnf.interpolate(x, scale_factor=(2, 2), mode='nearest')

解析:假设输入x.shape()为 torch.Size([1, 64, 40, 40])

scale_factor=(2,2)表示分辨率长宽都乘以2--------->>>[80,80]

使用的是nearest上采样的方法

最后经过上采样后:up2.shape()为torch.Size([1, 64, 80, 80])

示例二

import torch
from torch import nn
import torch.nn.functional as F
input = torch.arange(1, 5, dtype=torch.float32).view(1, 1, 2, 2)
print(input)

返回:input.size()  为torch.size([1,1,2,2])

tensor([[[[1., 2.],
          [3., 4.]]]])
x = F.interpolate(input, scale_factor=2, mode='nearest')
print(x)

返回:

tensor([[[[1., 1., 2., 2.],
          [1., 1., 2., 2.],
          [3., 3., 4., 4.],
          [3., 3., 4., 4.]]]])

Pytorch上下采样函数--interpolate()_第1张图片

示例三(size使张量变成你想要的分辨率)

import torch.nn.functional as tnf

print(P4in.size())                                            #torch.Size([1, 128, 38, 53])
print(P5in.size())                                            #torch.Size([1, 256, 19, 27])

P5in_P4m = tnf.interpolate(P5in, size=[P4in.size(2), P4in.size(3)], mode="nearest")  # 上采样

解析:

size=[38,53]:  代表将P5in的分辨率的张量[19,27 ]-------------->>>>>[38,53], 其余的维度不变

最后P5in_P4m.size() 为[1,256,38,53]

也提供了一些Upsample的方法:

torch.nn.functional.upsample(input, size=None, scale_factor=None, mode='nearest', align_corners=None)

torch.nn.functional.upsample_nearest(input, size=None, scale_factor=None)

torch.nn.functional.upsample_bilinear(input, size=None, scale_factor=None)

参考博客:

Pytorch关于torch.nn.functional.interpolate的用法的示例展示_比比兽卡卡的博客-CSDN博客

pytorch torch.nn.functional实现插值和上采样 - 慢行厚积 - 博客园

双线性插值(Bilinear Interpolation) - 马语者 - 博客园

torch.nn.functional.interpolate ‘bilinear‘ 图像理解_符号看象限_Wangerer的博客-CSDN博客

你可能感兴趣的:(函数用法,python,pytorch,深度学习,机器学习)