torch.nn.functional.interpolate
是 PyTorch 中用于对张量进行上采样或下采样的函数。它支持多种插值方法,例如双线性插值、最近邻插值等,广泛用于图像处理、特征图缩放等场景。
torch.nn.functional.interpolate(input, size=None, scale_factor=None, mode='nearest', align_corners=None, recompute_scale_factor=None, antialias=False)
scale_factor
将被忽略。'nearest'
, 'linear'
, 'bilinear'
, 'bicubic'
, 'trilinear'
, 'area'
。True
,输入和输出张量的角点将对齐。默认为 False
。scale_factor
的布尔值或 None
。如果设置为 True
,则基于计算的输出大小重新计算 scale_factor
。True
并且 mode 是 ‘bilinear’,‘bicubic’ 或 ‘trilinear’ 时,会应用抗锯齿滤波。默认为 False
。返回插值后的张量,大小和形状由 size
或 scale_factor
确定。
import torch
import torch.nn.functional as F
# 创建一个 2x2 的简单图像
x = torch.tensor([[[[1.0, 2.0], [3.0, 4.0]]]])
# 使用 F.interpolate 进行上采样
output = F.interpolate(x, scale_factor=2, mode='bilinear', align_corners=True)
print("输出:", output)
输出: tensor([[[[1.0000, 1.3333, 1.6667, 2.0000],
[1.6667, 2.0000, 2.3333, 2.6667],
[2.3333, 2.6667, 3.0000, 3.3333],
[3.0000, 3.3333, 3.6667, 4.0000]]]])
import torch
import torch.nn.functional as F
# 创建一个 4x4 的简单图像
x = torch.tensor([[[[1.0, 2.0, 3.0, 4.0],
[5.0, 6.0, 7.0, 8.0],
[9.0, 10.0, 11.0, 12.0],
[13.0, 14.0, 15.0, 16.0]]]])
# 使用 F.interpolate 进行下采样
output = F.interpolate(x, size=(2, 2), mode='area')
print("输出:", output)
输出: tensor([[[[ 3.5000, 5.5000],
[11.5000, 13.5000]]]])
align_corners
参数在使用双线性或三线性插值时非常重要。设置为 True
可以避免插值导致的边缘模糊,但在某些情况下可能会引入失真。scale_factor
和 size
参数是互斥的,只能选择一个进行指定。若同时设置了两个,size
将优先被使用。antialias
参数在进行下采样时尤为重要,它可以减少因为下采样带来的锯齿效应,使结果更加平滑。