YoLo卷积神经网络各层计算,卷积层计算输入的图片大小是448*448*3输出224*224*64原因?

YoLo卷积神经网络各层计算,卷积层计算输入的图片大小是448*448*3输出224*224*64原因?_第1张图片
该部分卷积层计算输入的t图片大小是4484483的,第一层卷积层,卷积核大小是77的,步长是2,pad=1,filters=64,请问输出为什么为:224224*64?
回答:此处的pad应该类似于标志位,0或非0,不一定是1.即pad=1应该是指:pad为真

看一下源码,在yolo里面pad=1的含义并不是pad=1,而是在处理的时候判断pad是否等于1,如果等于1,那pad=kernelsize/2
所以224=1+(448-1)/2
向下同理。

  int height_col = (height - ksize) / stride + 1;
    int width_col = (width - ksize) / stride + 1;
    if (pad){
        height_col = 1 + (height-1) / stride;
        width_col = 1 + (width-1) / stride;
        pad = ksize/2;
    }
    int channels_col = channels * ksize * ksize;

yolo 卷积神经网络前九层计算:
YoLo卷积神经网络各层计算,卷积层计算输入的图片大小是448*448*3输出224*224*64原因?_第2张图片

你可能感兴趣的:(图像视觉)