卷积神经网络CNN学习笔记-MaxPool2D函数解析

目录

  • 1.函数签名:
  • 2.学习中的疑问
  • 3.代码

1.函数签名:

torch.nn.MaxPool2d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)
卷积神经网络CNN学习笔记-MaxPool2D函数解析_第1张图片

2.学习中的疑问

Q:使用MaxPool2D池化时,当卷积核移动到某位置,该卷积核覆盖区域超过了输入尺寸时,MaxPool2D会如何处理?
A:
当使用MaxPool2D池化层时,当卷积核移动到某个位置,如果该卷积核的覆盖区域超过了输入的尺寸,MaxPool2D会进行以下处理:

  1. 部分覆盖: 如果池化窗口(卷积核)的中心点位于输入的边界附近,以至于窗口的一部分超出了输入边界,MaxPool2D将仅考虑在输入内部的部分窗口。这意味着池化窗口的超出部分不会被考虑在内,不会对池化结果产生影响。

  2. Stride的作用: 池化层的stride参数决定了池化窗口在输入上移动的步幅。如果移动的步幅足够小,可以确保池化窗口在输入边界内的任何位置都能够被覆盖到。如果stride过大,可能导致某些位置被漏掉或者部分覆盖。

  3. 填充: 在某些情况下,可以使用池化层的填充参数,通常为"valid"或"same"。"valid"表示没有填充,"same"表示在输入的周围填充以确保输出的尺寸与输入的尺寸相同。填充可以帮助确保所有区域都被合理处理。

总之,MaxPool2D通常会在输入的边界附近部分覆盖或舍弃,而不会扩展到超出输入边界的区域。要确保在处理边界附近的特征时不会出现信息丢失,可以适当设置stride和填充参数,或者使用其他池化方法,如"same"填充或更复杂的边界处理策略。

3.代码

如下代码表明了MaxPool2D确实是只会考虑滤波器扫描到的输入数据里面的内容.

import torch
import torchvision

from torch.nn import Module,MaxPool2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

input = torch.tensor([[1,2,0,3,1],
                      [0,1,2,3,1],
                      [1,2,1,0,0],
                      [5,2,3,1,1],
                      [2,1,0,1,1]],dtype=torch.float32)

print("前",input.shape)      # torch.Size([5, 5]),不满足输入的条件,需要进行格式转换

input = torch.reshape(input,(-1,1,5,5))

print("后",input.shape)    # 后 torch.Size([1, 1, 5, 5]) 一个bach_size,

class ConNet(Module):
    def __init__(self):
        super(ConNet, self).__init__()
        # 池化层使用,设置卷积核为3*3,超出的部分保留数据
        self.maxpool = MaxPool2d(kernel_size=3,ceil_mode=True)

    def forward(self,input):
        output = self.maxpool(input)
        return output

# 实例化对象
Work = ConNet()

# 神经网络调用
output = Work(input)
print(output)

你可能感兴趣的:(pycharm,计算机视觉,cnn,MaxPool2D)