有节操的正明君

darknet源码分析(二)：卷积层实现过程分析im2col部分

layer的内容很多，包括卷积层、反卷积层、池化层、shortcut层、损失函数层、全链接层等等……本文分析卷积层、反卷积、YOLO层、BN层

typedef enum {
    CONVOLUTIONAL,
    DECONVOLUTIONAL,
    CONNECTED,
    MAXPOOL,
    SOFTMAX,
    DETECTION,
    DROPOUT,
    CROP,
    ROUTE,
    COST,
    NORMALIZATION,
    AVGPOOL,
    LOCAL,
    SHORTCUT,
    ACTIVE,
    RNN,
    GRU,
    LSTM,
    CRNN,
    BATCHNORM,
    NETWORK,
    XNOR,
    REGION,
    YOLO,
    ISEG,
    REORG,
    UPSAMPLE,
    LOGXENT,
    L2NORM,
    BLANK
} LAYER_TYPE;

layer结构体定义

struct layer;
typedef struct layer layer;

struct layer{
    LAYER_TYPE type; /*指定layer的类型*/
    ACTIVATION activation;/*指定激活层激活函数的类型*/
    COST_TYPE cost_type;/*指定损失函数的类型，这通常是最后一层才用*/
    void (*forward)   (struct layer, struct network);
    void (*backward)  (struct layer, struct network);
    void (*update)    (struct layer, update_args);
    void (*forward_gpu)   (struct layer, struct network);
    void (*backward_gpu)  (struct layer, struct network);
    void (*update_gpu)    (struct layer, update_args);
    int batch_normalize;
    int shortcut;
    int batch;
    int forced;
    int flipped;
    int inputs;
    int outputs;
    int nweights;
    int nbiases;
    int extra;
   /* 根据region_layer.c判断，这个变量表示一张图片含有的真实值的个数，对于检测模型来说，一个真实的标签含有5个值，
    ** 包括类型对应的编号以及定位矩形框用到的w,h,x,y四个参数，且在darknet中，固定每张图片最大处理30个矩形框（可查看max_boxes参数），
    ** 因此，在region_layer.c的make_region_layer()函数中，赋值为30*5*/
    int truths;
    int h,w,c;
    int out_h, out_w, out_c;
    int n;
    int max_boxes;
    /*这个参数目前仅发现用在softmax_layer中，含义是将一张图片的数据分成几组，具体的值由网络配置文件指定，如未指定默认为1（见parse_softmax()）*/
    int groups;
    /*kernel size*/
    int size;
    int side;
    int stride;
    int reverse;
    int flatten;
    int spatial;
    int pad;
    int sqrt;
    int flip;
    int index;
    int binary;
    int xnor;
    int steps;
    int hidden;
    int truth;
    float smooth;
    float dot;
    float angle;
    float jitter;
    float saturation;
    float exposure;
    float shift;
    float ratio;
    float learning_rate_scale;
    float clip;
    int noloss;
    int softmax;
    int classes;/*基本适用于识别问题中，指物体类别种数*/
    int coords;/*用于检测任务，通常设为4指检测框要用的四个坐标*/
    int background;
    int rescore;
    int objectness;
    int joint;
    int noadjust;
    int reorg;
    int log;
    int tanh;
    int *mask;
    int total;

    float alpha;
    float beta;
    float kappa;

    float coord_scale;
    float object_scale;
    float noobject_scale;
    float mask_scale;
    float class_scale;
    int bias_match;
    int random;
    float ignore_thresh;
    float truth_thresh;
    float thresh;
    float focus;
    int classfix;
    int absolute;

    int onlyforward;
    int stopbackward;
    int dontload;
    int dontsave;
    int dontloadscales;
    int numload;

    float temperature;
    float probability;/*dropout的概率*/
    /*
     ** 比例因子，为保留概率的倒数
     ** 模型使用了dropout layer，训练的时候只有占比为 p 的隐藏层单元参与训练，那么在预测的时候，如果所有的隐藏层单元都需要参与进来，则得到的结果相比训练时平均要大 1/p ，
     ** 为了避免这种情况，就需要测试的时候将输出结果乘以 p 使下一层的输入规模保持不变。而利用inverted dropout，我们可以在训练的时候直接将dropout后留下的权重扩大1/p 倍
     ** 这样在预测的时候也不用做额外的操作了，更方便一些。
    */
    float scale;

    char  * cweights;
    int   * indexes;
    int   * input_layers;
    int   * input_sizes;
    int   * map;
    int   * counts;
    float ** sums;
    float * rand;
    float * cost;
    float * state;
    float * prev_state;
    float * forgot_state;
    float * forgot_delta;
    float * state_delta;
    float * combine_cpu;
    float * combine_delta_cpu;

    float * concat;
    float * concat_delta;

    float * binary_weights;

    float * biases;
    float * bias_updates;

    float * scales;
    float * scale_updates;


    float * weights;/*当前层所有权重系数（连接当前层和上一层的系数，但记在当前层上），对于卷积层，维度为l.n*l.c*l.size*l.size，即卷积核个数乘以卷积核尺寸再乘以输入通道数*/
    float * weight_updates;

    float * delta;
    float * output;
    float * loss;
    float * squared;
    float * norms;

    float * spatial_mean;
    float * mean;
    float * variance;

    float * mean_delta;
    float * variance_delta;

    float * rolling_mean;
    float * rolling_variance;

    float * x;
    float * x_norm;

    float * m;
    float * v;
    
    float * bias_m;
    float * bias_v;
    float * scale_m;
    float * scale_v;

    /*cpu参数*/
    float *z_cpu;
    float *r_cpu;
    float *h_cpu;
    float * prev_state_cpu;

    float *temp_cpu;
    float *temp2_cpu;
    float *temp3_cpu;

    float *dh_cpu;
    float *hh_cpu;
    float *prev_cell_cpu;
    float *cell_cpu;
    float *f_cpu;
    float *i_cpu;
    float *g_cpu;
    float *o_cpu;
    float *c_cpu;
    float *dc_cpu; 

    float * binary_input;

    struct layer *input_layer;
    struct layer *self_layer;
    struct layer *output_layer;

    struct layer *reset_layer;
    struct layer *update_layer;
    struct layer *state_layer;

    struct layer *input_gate_layer;
    struct layer *state_gate_layer;
    struct layer *input_save_layer;
    struct layer *state_save_layer;
    struct layer *input_state_layer;
    struct layer *state_state_layer;

    struct layer *input_z_layer;
    struct layer *state_z_layer;

    struct layer *input_r_layer;
    struct layer *state_r_layer;

    struct layer *input_h_layer;
    struct layer *state_h_layer;
	
    struct layer *wz;
    struct layer *uz;
    struct layer *wr;
    struct layer *ur;
    struct layer *wh;
    struct layer *uh;
    struct layer *uo;
    struct layer *wo;
    struct layer *uf;
    struct layer *wf;
    struct layer *ui;
    struct layer *wi;
    struct layer *ug;
    struct layer *wg;

    tree *softmax_tree;

    size_t workspace_size;

#ifdef GPU
    int *indexes_gpu;

    float *z_gpu;
    float *r_gpu;
    float *h_gpu;

    float *temp_gpu;
    float *temp2_gpu;
    float *temp3_gpu;

    float *dh_gpu;
    float *hh_gpu;
    float *prev_cell_gpu;
    float *cell_gpu;
    float *f_gpu;
    float *i_gpu;
    float *g_gpu;
    float *o_gpu;
    float *c_gpu;
    float *dc_gpu; 

    float *m_gpu;
    float *v_gpu;
    float *bias_m_gpu;
    float *scale_m_gpu;
    float *bias_v_gpu;
    float *scale_v_gpu;

    float * combine_gpu;
    float * combine_delta_gpu;

    float * prev_state_gpu;
    float * forgot_state_gpu;
    float * forgot_delta_gpu;
    float * state_gpu;
    float * state_delta_gpu;
    float * gate_gpu;
    float * gate_delta_gpu;
    float * save_gpu;
    float * save_delta_gpu;
    float * concat_gpu;
    float * concat_delta_gpu;

    float * binary_input_gpu;
    float * binary_weights_gpu;

    float * mean_gpu;
    float * variance_gpu;

    float * rolling_mean_gpu;
    float * rolling_variance_gpu;

    float * variance_delta_gpu;
    float * mean_delta_gpu;

    float * x_gpu;
    float * x_norm_gpu;
    float * weights_gpu;
    float * weight_updates_gpu;
    float * weight_change_gpu;

    float * biases_gpu;
    float * bias_updates_gpu;
    float * bias_change_gpu;

    float * scales_gpu;
    float * scale_updates_gpu;
    float * scale_change_gpu;

    float * output_gpu;
    float * loss_gpu;
    float * delta_gpu;
    float * rand_gpu;
    float * squared_gpu;
    float * norms_gpu;
#ifdef CUDNN
    cudnnTensorDescriptor_t srcTensorDesc, dstTensorDesc;
    cudnnTensorDescriptor_t dsrcTensorDesc, ddstTensorDesc;
    cudnnTensorDescriptor_t normTensorDesc;
    cudnnFilterDescriptor_t weightDesc;
    cudnnFilterDescriptor_t dweightDesc;
    cudnnConvolutionDescriptor_t convDesc;
    cudnnConvolutionFwdAlgo_t fw_algo;
    cudnnConvolutionBwdDataAlgo_t bd_algo;
    cudnnConvolutionBwdFilterAlgo_t bf_algo;
#endif
#endif
};

卷积层是怎样炼成的

首先，darknet的卷积与caffe的卷积相同，都是先使用im2col函数将输入的特征图转化为

（输入通道数卷积核高卷积核宽）* （输出单通道的特征图高*输出单通道的特征图宽）

而权重矩阵的大小为

（输出通道数）* （输入通道数卷积核高卷积核宽）

这样通过gemm函数进行矩阵乘法，权重矩阵转化后的特征图矩阵就得到了最后的输出，其大小为（输出通道数）（输出单通道的特征图高*输出单通道的特征图宽）

为了了解这个过程可以看看卷积层的前向传播过程forward_convolutional_layer(convolutional_layer l, network net)

/*卷积层的前向传播*/
void forward_convolutional_layer(convolutional_layer l, network net)
{
    int i, j;
    /*
    ** l.outputs即batch中一个输入对应的输出特征总元素的个数
    ** 此函数就是将一个batch中所有输入对应的输出特征都初始化为0
    */

    fill_cpu(l.outputs*l.batch, 0, l.output, 1);
    /*是否对权重与输入进行二值化，二值化是一种模型量化的方法，能够加快模型在硬件上的速度*/
    if(l.xnor){
        binarize_weights(l.weights, l.n, l.c/l.groups*l.size*l.size, l.binary_weights);
        swap_binary(&l);
        binarize_cpu(net.input, l.c*l.h*l.w*l.batch, l.binary_input);
        net.input = l.binary_input;
    }
  
    int m = l.n/l.groups; /*该卷积层卷积核的个数*/
    int k = l.size*l.size*l.c/l.groups; /*卷积核元素的个数*/
    int n = l.out_w*l.out_h; /*该层输出单通道的特征图的尺寸*/
    /*循环batch中的每个输入*/
    for(i = 0; i < l.batch; ++i){
        for(j = 0; j < l.groups; ++j){
            float *a = l.weights + j*l.nweights/l.groups; /*a是指向当前层所有卷积核的，大小为(l.n)*(l.c*l.size*l.size)*/
            float *b = net.workspace; /*用于存储经im2col转换后的输入特征矩阵*/
            float *c = l.output + (i*l.groups + j)*n*m; /*输出特征图个数*/
            float *im =  net.input + (i*l.groups + j)*l.c/l.groups*l.h*l.w;

            if (l.size == 1) {
                /*如果是1*1的卷积，那么不用对输入特征进行转化*/
                b = im;
            } else {
                im2col_cpu(im, l.c/l.groups, l.h, l.w, l.size, l.stride, l.pad, b); /*对输入特征进行转化*/
            }
            /*进行矩阵乘法得到最终输出*/
            gemm(0,0,m,n,k,1,a,k,b,n,1,c,n);
        }
    }

    if(l.batch_normalize){
        forward_batchnorm_layer(l, net);
    } else {
        add_bias(l.output, l.biases, l.batch, l.n, l.out_h*l.out_w);/**/
    }

    activate_array(l.output, l.outputs*l.batch, l.activation);
    if(l.binary || l.xnor) swap_binary(&l);
}

那么其实重点就是理解im2col与gemm如何实现

im2col

之所以要先用im2col来解决卷积计算，是因为这样能将卷积问题转换为一个矩阵乘法问题，这样会让卷积的实现更加的高效。

先来看 imcol的实现代码

/*
** 获得输入的特征图im的特定行、列、通道的数据
** im: 输入特征图的指针
** height: 输入特征图的高
** width: 输入特征图的宽
** channels: 输入特征图的通道数
** row: 指定的要提取的行
** col: 指定的要提取的列
** channel: 指定的要提取的通道
** pad: pad的大小，这个有影响到最后的结果
*/
float im2col_get_pixel(float *im, int height, int width, int channels,
                        int row, int col, int channel, int pad)
{
    /*因为当前给定的row和col是加了pad即补0之后的行列号，因此为了得到真正的行列号，我们需要分别减去pad
    ** 注意，我们做pad时并非真的是在输入特征图上补全0的行与列，而是在im2col转化的过程中假装输入特征图里面有0的行与列，之后在转化后的结构中插入0
    */
    row -= pad;
    col -= pad;
    /*若出现判断中的这四种情况，说明我们要取的数据在pad行或列中，最后输出一定是0*/
    if (row < 0 || col < 0 ||
        row >= height || col >= width) return 0;
    /*若要取得数据不在pad行或者pad列中，说明位于输入特征图中，因此直接取出对应位置的数据就可以*/
    /*首先定位到对应的通道即width*height*channel,之后定位具体位置，即再加上col+width*row*/
    return im[col + width*(row + height*channel)];
}

//From Berkeley Vision's Caffe!
//https://github.com/BVLC/caffe/blob/master/LICENSE

/*注意上面的注释，说明darknet的卷积操作是从caffe源码中卷积的操作原理是相同的，但我看了一下，虽然结果是相同的，但caffe的im2col明显实现的要更加复杂一些
** 因此想研究caffe卷积的可以从darknet的卷积开始了解，我个人认为caffe的实现并没有比darknet好
** 这里data_col就是转换后输入特征图的指针，我们最后的结果都保存到这
** ksize是指卷积核的大小
** stride 是卷积核每次移动的跨度
*/
void im2col_cpu(float* data_im,
     int channels,  int height,  int width,
     int ksize,  int stride, int pad, float* data_col) 
{
    int c,h,w;
    /*得到输出特征图的高和宽，其实这里是不用算的，因为在make_convolutional函数中已经算过，直接传到这里就好了*/
    int height_col = (height + 2*pad - ksize) / stride + 1;
    int width_col = (width + 2*pad - ksize) / stride + 1;
    /*我们知道卷积运算时，我们是要用卷积对特征图所有通道都作卷积运算，因此这里我们使用输入通道数乘卷积核的大小，从而代表针对特征图同一位置卷积运算要用到的卷积核元素个数
    * 同时该变量也是转换过后矩阵的行数
    */
    int channels_col = channels * ksize * ksize;
    /*以下三个循环决定了经过转换的特征图矩阵的最终形式*/
    /*第一个循环表示转换后矩阵的行数：输入通道数*卷积核高*卷积核宽*/
    for (c = 0; c < channels_col; ++c) {
        /*以下三个偏移的计算就是要算出当前行的第一个元素在卷积核上对应的位置*/
        int w_offset = c % ksize; /*计算列偏移：卷积核是一个二维矩阵，并按行存储在一维数组中，利用求余运算获取对应在卷积核中的列数*/
        int h_offset = (c / ksize) % ksize; /*计算行偏移*/
        int c_im = c / ksize / ksize;/*计算通道偏移*/
        /*接下来两个循环就是个表示转换后特征矩阵的列数，即输出特征图高*输出特征图宽*/
        for (h = 0; h < height_col; ++h) {
            for (w = 0; w < width_col; ++w) {
                int im_row = h_offset + h * stride; /*如果stride不为1，那么加上h*stride就是对对卷积核进行了移位操作*/
                int im_col = w_offset + w * stride;
                int col_index = (c * height_col + h) * width_col + w;/*转换后矩阵位置的索引*/
                data_col[col_index] = im2col_get_pixel(data_im, height, width, channels,
                        im_row, im_col, c_im, pad);
            }
        }
    }
}

通过画图直观的来看看im2col到底干了什么，假设我们的输入特征图是55单通道的，卷积核是33单通道的，这里使用单通道是为了方便讲解、画图，同时stride=2，那么我们经im2col转换后的特征图大小应该是（331）（22）即9*4

这个转换过程的就是由代码中三个循环来完成的，第一个循环体的大小为channelsksizeksize即9，由此可见第一个循环决定的是转换后矩阵的行数，后两个循环体的大小就是算出来的输出特征图的高*输出特征图的宽，由此可见后两个循环完成的是列的填充。

注意到在后两个循环前，我们还计算了三个偏移，分别是列偏移(w_offset)、行偏移(h_offset)、通道偏移(c_im)这三个偏移可以这样理解，这三个偏移是为了得到转换后特征图第c行的所有数据所用到的卷积核的索引。让我们分析以下转换后特征矩阵的第一行数据是怎么得到的。

经过第一个循环，当前c=0，意味着我们后两个循环是为了填充第一行的所有列，此时w_offset = 0%3 = 0, h_offet = (0/3) % 3 = 0, c_im = 0, 也就是说第一行的数据是由卷积核的第一行第一列第一个通道得到的，事实上由于我们的卷积核只有一个通道因此c_im一直为0.之后进入下面两个循环，我们可以发现在第3个循环后，又计算了两个变量，这两个变量分别代表了原输入特征图的索引，这两个变量在原先的偏移上分别加上hstride和wstride相当于就是在做卷积核的移位操作。由此经过im2col转换后的特征图矩阵的第一行实际上是每次卷积核移位后覆盖的输入特征图部分的（w_offeset, h_offset）位置的数据，因此第一个循环体完成第一个循环之后，我们得到了第一行的数据，如下图。

之后便进行第一个循环体的第二次循环，即要得到第二行的数据，此时我们可以计算出w_offset等于1，h_offset等于0，也就是说我们第二行的数据应该用的是每个卷积核第一行第二列在原特征矩阵上对应的数据，第二个循环体结束之后，我们便得到了第二行的数据

由此经过第一个循环体9次循环，我们便得到了最后的9*4的矩阵。我们注意到源码的注释里写道caffe的与源码地址，因此darknet的卷积实现过程实际上是借鉴了caffe的，但是如果看过caffe源码，会发现其实现和caffe还是有差别的，虽然都是先用ime2col转换输入特征矩阵，之后再用矩阵乘法解决，但是caffe的实现明显和这个不一样，darknet的实现过程更好理解一些，但是那个更加高效还不算很清楚，我想之后可以做个检测看看

这里需要注意一下就是我们最后转换出来的输入特征图是按行存储的且各通道的数据并成一行，是一维矩阵的形式，这个对于理解gemm的实现会有一定的帮助

Java 领域 MyBatis 与数据库连接池的搭配使用 Java技术栈实战 java mybatis 数据库 ai
Java领域MyBatis与数据库连接池的搭配使用关键词：MyBatis、数据库连接池、Java持久层、性能优化、Druid、HikariCP、Spring集成摘要：本文深入探讨Java领域中MyBatis框架与数据库连接池的搭配使用原理和实践。文章从基础概念入手，详细分析MyBatis的工作原理和数据库连接池的核心机制，重点讲解两者如何协同工作以提升应用性能。通过源码解析、性能对比和实际项目案例
RocketMQ 基础教程-应用篇-死信队列码炫课堂-码哥 rocketmq专题 rocketmq java
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析
OkHttp3源码解析--设计模式，android开发实习面试题
this.cache=builder.cache;}//构造者publicstaticfinalclassBuilder{Cachecache;…//构造cache属性值publicBuildercache(@NullableCachecache){this.cache=cache;returnthis;}//在build方法中真正创建OkHttpClient对象，并传入前面构造的属性值publi
OkHttp3源码解析--设计模式 2401_84413396 程序员设计模式
}//在创建OkHttpClient的时候OkHttpClientclient=newOkHttpClient.Builder().cache(/创建cache对象/).build();工厂模式====直接看代码：publicinterfaceCallextendsCloneable{Requestrequest();Responseexecute()throwsIOException;voide
HashMap的Get(),Put()源码解析 Ttang23 哈希算法散列表算法
1、什么是HashMap？HashMap是Java中用于存储键值对（Key-Value）的集合类，它实现了Map接口。其核心特点是：无序性：不保证元素的存储顺序，也不保证顺序恒定不变。唯一性：键（Key）不能重复，若插入重复键会覆盖原有值。允许null：允许一个null键和任意数量的null值。非线程安全：相比HashTable，HashMap不支持同步，性能更高。2.核心数据结构：哈希表（Has
FasterRCNN源码解析（一）-——跑通代码_霹雳巴拉wz的代码看不懂 2401_84140023 2024年程序员学习运维 linux 面试
为了做好运维面试路上的助攻手，特整理了上百道【运维技术栈面试题集锦】，让你面试不慌心不跳，高薪offer怀里抱！这次整理的面试题，小到shell、MySQL，大到K8s等云原生技术栈，不仅适合运维新人入行面试需要，还适用于想提升进阶跳槽加薪的运维朋友。本份面试集锦涵盖了174道运维工程师面试题128道k8s面试题108道shell脚本面试题200道Linux面试题51道docker面试题35道Je
DolphinScheduler 3.2.0 Master启动核心源码解析
目录1.手动调度工作流触发原理2.MasterServer启动入口与整体流程3.MasterRPC服务启动3.1启动RPCServer3.2启动RPCClient4.插件加载机制5.注册中心客户端初始化与心跳维护6.核心调度引擎启动6.1恢复Command6.2事件循环6.3任务派发7.事件处理服务8.故障转移线程8.1MasterFailover8.2WorkerFailover9.Quartz
目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶目标检测算法研究（续）林聪木目标检测 YOLO 深度学习
目录基于双蓝图卷积的轻量化自动驾驶目标检测算法5.1引言5.2DarkNet53网络冗余性分析5.3双蓝图卷积网络5.4实验结果及分析基于深度学习的自动驾驶目标检测算法研究与应用传统的目标检测算法目标检测基线算法性能对比与选择相关理论和算法基础2.1引言2.2人工神经网络2.3FCOS目标检测算法2.4复杂交通场景下的目标检测难点与FCOS改进方案基于FCOS的目标检测算法改进3.1引言3.2Re
Java 集合框架：ArrayList 深度剖析与进阶实践 2501_92631758 java 开发语言
一、ArrayList底层实现的演进与源码解析（JDK8-JDK21）（一）跨版本实现差异对比JDK版本初始化机制扩容策略性能优化点JDK8延迟初始化空数组，首次add扩容至10oldCapacity+(oldCapacity>>1)引入CopyOnWriteArrayListJDK11优化ensureCapacityInternal逻辑相同增强序列化性能JDK17新增数组copyOfRange优
文件系统数据持久化：C++实现中的日志结构与恢复算法源码分析～郭俊辉@ c++
在C++底层文件系统设计中，数据持久化是确保系统可靠性的核心环节。面对系统崩溃、断电等突发故障，文件系统需要保证数据的一致性和完整性。日志结构与恢复算法是实现数据持久化的重要手段，通过记录关键操作和恢复数据状态，使文件系统在故障后能快速恢复正常。本文将深入剖析C++文件系统中日志结构与恢复算法的设计理念，并结合源码解析其具体实现。一、数据持久化面临的挑战1.一致性问题：文件系统操作涉及多个步骤，如
《深入浅出 React 19：AI 视角下的源码解析与进阶》- JSX 与 React Element
如果你对React源码解析感兴趣，欢迎访问我的个人博客：深入浅出React19：AI视角下的源码解析与进阶或者我的微信公众号-前端小卒在我的博客和公众号中，你可以找到：完整的React源码解析电子书-从基础概念到高级实现，全面覆盖React18的核心机制系统化的学习路径-按照React的执行流程，循序渐进地深入每个模块实战案例分析-结合真实场景，理解React设计思想和最佳实践最新技术动态-持续更
ArrayList的扩容机制(源码解析) Exclusive_Cat ArrayList java 开发语言
我们会从ArrayList的源码进行讲起，一点点的解析各种细节，首先我们要在idea中创建一个ArrayList的集合，调用它的add方法，然后摁住CTRL键，鼠标点击add方法查看其中的源码部分。packagecollection;importjava.util.ArrayList;publicclassArrayListTest{publicstaticvoidmain(String[]arg
[netty5: WebSocketServerHandshaker & WebSocketServerHandshakerFactory]-源码分析 idolyXyz netty5-源码阅读 netty
在阅读这篇文章前，推荐先阅读以下内容：[netty5:WebSocketFrame]-源码分析[netty5:WebSocketFrameEncoder&WebSocketFrameDecoder]-源码解析WebSocketServerHandshakerFactoryWebSocketServerHandshakerFactory用于根据客户端请求中的WebSocket版本构造对应的WebSo
[netty5: WebSocketClientHandshaker & WebSocketClientHandshakerFactory]-源码分析
在阅读这篇文章前，推荐先阅读以下内容：[netty5:WebSocketFrame]-源码分析[netty5:WebSocketFrameEncoder&WebSocketFrameDecoder]-源码解析WebSocketClientHandshakerFactoryWebSocketClientHandshakerFactory是用于根据URI和协议版本创建对应WebSocket握手器（Ha
[netty5: FastThreadLocal]-源码解析
在解析FastThreadLocal之前，我们先了解一下ThreadLocal，它和Thread究竟什么关系。翻看Thread源码,我们可以知道，Thread类里维护了两个ThreadLocal.ThreadLocalMap，这两个字段由ThreadLocal类管理，用来实现线程局部变量的存储和传递。ThreadpublicclassThreadimplementsRunnable{//线程局部变
[netty5: ChannelPipeline & ChannelHandlerContext ]-源码分析 idolyXyz netty5-源码阅读 netty
在阅读该篇文章内容前，推荐先阅读：[netty5:Channel&ServerChannel]-创建流程[netty5:ChannelHandlerMask]-源码分析[netty5:ChannelHandler&ChannelHandlerAdapter]-源码解析从Channel源码来看，Channel将出站操作全部委托给了ChannelPipeline。这么做的原因是为了实现职责分离和灵活的
[netty5: HttpServerCodec & HttpClientCodec]-源码分析 idolyXyz netty5-源码阅读 netty
在阅读该篇文章之前，推荐先阅读以下内容：[netty5:ChannelHandler&ChannelHandlerAdapter]-源码解析[netty5:HttpObjectEncoder&HttpObjectDecoder]-源码解析HttpServerCodecHttpServerCodec是一个Netty编解码器，结合HttpRequestDecoder和HttpResponseEncod
[netty5: MessageAggregator & HttpObjectAggregator]-源码解析
在阅读这篇文章前，推荐先阅读[netty5:ByteToMessageCodec&MessageToByteEncoder&ByteToMessageDecoder]-源码分析[netty5:HttpObject]-源码解析100-continue100-continue是HTTP/1.1协议中的一种机制，用于客户端在发送大体积请求体（如文件上传）前，先向服务器发送一个带有Expect:100-c
鸿蒙设备开发OpenHarmony深度解读之设备认证：HiChain机制部分源码解析1（推荐模块之外）
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……一、概述H
Mybatis源码，从配置到 mappedStatement/mapper.xml 是如何被解析的？祁娥安 Java java mybatis
今天跟大家分享下Mybatis源码，从配置到mappedStatement/mapper.xml解析的知识。1从MybatisAutoConfiguration说开去，mapper文件是怎么扫描的？Ext1：本文源码解析基于mybatis-spring-boot-starter2.1.1，即mybatis3.5.3版本。Ext2：本文主要是对源码的讲解，着重点会是在源码上。我们知道配置SqlSes
使用TVM编译部署DarkNet模型：YOLO-V2和YOLO-V3实战指南周情津Raymond
使用TVM编译部署DarkNet模型：YOLO-V2和YOLO-V3实战指南tvm-cnTVMDocumentationinChineseSimplified/TVM中文文档项目地址:https://gitcode.com/gh_mirrors/tv/tvm-cn前言在深度学习模型部署领域，TVM作为一个高效的深度学习编译器栈，能够将训练好的模型优化并部署到各种硬件平台上。本文将详细介绍如何使用T
C#.NET员工考勤系统源码解析与探讨金融先生-Frank
本文还有配套的精品资源，点击获取简介：《C#.NET员工考勤系统源码解析与探讨》是一篇详细介绍C#.NET技术在构建员工考勤管理软件中的应用。文章涵盖了从基础知识点到高级功能实现的全面解析，并分享了源码，以便开发者能深入理解并运用C#.NET技术构建出高效的考勤系统。1.C#.NET基础应用1.1C#语言简介C#（发音为“看井”）是微软公司为了.NET平台创建的一种面向对象、类型安全的编程语言。它
flutter 绘制源码解析阿旭哟嘿 flutter
//绘制过程概述：在绘制过程中，渲染树会生成一个合成层树，这些层被上传到引擎并由合成器显示。//Layer是合成层树的一个切片,layer被排列成层次结构，每个节点都可能影响它下面的节点在绘制的时候，会把每个绘制节点保存到Layer上面，//最后合成树，创建一个SceneBuilder对象，根layer对象调用addToScene方法，SceneBuilder.build以获得一个Scene。然后
Python编程：requests 核心源码
requests是Python中最受欢迎的HTTP客户端库之一，其源码设计优雅且模块化，适合学习优秀的Python项目架构。以下是对requests库的核心源码解析，涵盖关键模块、设计模式和实现细节。源码结构概览requests的源码主要分为以下几个核心模块：requests/├──__init__.py#暴露主要API（如get,post）├──api.py#实现请求方法（get/post/pu
【Python爬虫实战】全面抓取网页资源（图片、JS、CSS等）——超详细教程与源码解析 Python爬虫项目 python 爬虫 javascript 新浪微博开发语言 css 旅游
前言在互联网时代，网页数据已经成为重要的信息来源。许多时候，我们不仅需要抓取网页中的文字信息，还需要将网页中的各种资源文件（如图片、CSS样式表、JavaScript脚本文件等）一起抓取并保存下来。这种需求广泛应用于网页备份、离线浏览、数据分析等场景。本篇文章将带你从零开始，系统讲解如何使用Python最新技术，一步步实现抓取网页中所有静态资源的完整流程，包括：页面结构分析爬虫基本架构搭建异步爬取
Nodejs源码解析之module leoleocs Javascript nodejs
module管理是Nodejs中比较有特色的部分，官方有详细的文档https://nodejs.org/api/modules.html哪里介绍了一些基本的使用规则，主要的内容如下，文件和模块之间是一一对应关系：使用方法就是require，后续源码解析中会详细介绍什么是require，以及如何实现的。文件的名字就是一个id，也就是标志符。如何访问和被确认为主模块：简单的说就是被nodejs启动的模
Muduo 定时器小白书舍 c++网络
TimeQueue定时器图片转载自:muduo网络库源码解析(4):TimerQueue定时机制_李兆龙的技术博客_51CTO博客添加新的定时器TimerIdTimerQueue::addTimer(TimerCallbackcb,//用户自定义回调Timestampwhen,//定时器的超时时刻doubleinterval)//重复触发间隔,小于0则不重复触发{Timer*timer=newTi
Tomcat 源码解析：深入理解 Tomcat 运行机制深山懒羊羊 tomcat java
Tomcat是Apache软件基金会的一个开源的Servlet容器和Web服务器，是JavaWeb开发中最常用的应用服务器之一。它实现了Servlet和JSP规范，广泛用于开发和部署JavaEEWeb应用程序。了解Tomcat的源码，能够帮助我们深入理解Web服务器的工作原理，以及如何优化和定制我们的JavaWeb环境。本文将对Tomcat的核心架构进行解析，重点关注Tomcat的启动过程、请求处
KITTI数据集可视化实用教程及源码解析国营窝窝乡蛮大人
本文还有配套的精品资源，点击获取简介：本文详细介绍如何使用源码实现KITTI数据集的可视化，强调数据集可视化在计算机视觉领域的关键作用。重点介绍如何加载、处理和融合KITTI数据集中的图像和激光雷达数据，并通过可视化手段分析结果，包括图像点云投影、坐标转换、颜色映射等技术。读者将通过学习源码深入理解数据结构、文件格式，并定制化工具以满足特定项目需求。1.计算机视觉数据集可视化的重要性在计算机视觉领
Promise源码解析天涯学馆 Web大前端全栈架构前端 javascript 开发语言
Promise核心原理Promise状态管理机制Promise的核心在于其三种不可变状态的管理：pending(等待态)：初始状态，既不是成功也不是失败fulfilled(成功态)：操作成功完成rejected(失败态)：操作失败状态转换规则：pending→fulfilled(只能转换一次)pending→rejected(只能转换一次)fulfilled/rejected状态不可再改变//简化
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

darknet源码分析(二)：卷积层实现过程分析im2col部分

layer的内容很多，包括卷积层、反卷积层、池化层、shortcut层、损失函数层、全链接层等等……本文分析卷积层、反卷积、YOLO层、BN层

layer结构体定义

卷积层是怎样炼成的

首先，darknet的卷积与caffe的卷积相同，都是先使用im2col函数将输入的特征图转化为

（输入通道数*卷积核高*卷积核宽）* （输出单通道的特征图高*输出单通道的特征图宽）

而权重矩阵的大小为

（输出通道数）* （输入通道数*卷积核高*卷积核宽）

这样通过gemm函数进行矩阵乘法，权重矩阵*转化后的特征图矩阵就得到了最后的输出，其大小为 （输出通道数）* （输出单通道的特征图高*输出单通道的特征图宽）

为了了解这个过程可以看看卷积层的前向传播过程forward_convolutional_layer(convolutional_layer l, network net)

那么其实重点就是理解im2col与gemm如何实现

im2col

之所以要先用im2col来解决卷积计算，是因为这样能将卷积问题转换为一个矩阵乘法问题，这样会让卷积的实现更加的高效。

先来看 imcol的实现代码

通过画图直观的来看看im2col到底干了什么，假设我们的输入特征图是5*5单通道的，卷积核是3*3单通道的，这里使用单通道是为了方便讲解、画图，同时stride=2，那么我们经im2col转换后的特征图大小应该是（3*3*1）*（2*2）即9*4

这里需要注意一下就是我们最后转换出来的输入特征图是按行存储的且各通道的数据并成一行，是一维矩阵的形式，这个对于理解gemm的实现会有一定的帮助

你可能感兴趣的:(darknet源码解析)

（输入通道数卷积核高卷积核宽）* （输出单通道的特征图高*输出单通道的特征图宽）

（输出通道数）* （输入通道数卷积核高卷积核宽）

这样通过gemm函数进行矩阵乘法，权重矩阵转化后的特征图矩阵就得到了最后的输出，其大小为（输出通道数）（输出单通道的特征图高*输出单通道的特征图宽）

通过画图直观的来看看im2col到底干了什么，假设我们的输入特征图是55单通道的，卷积核是33单通道的，这里使用单通道是为了方便讲解、画图，同时stride=2，那么我们经im2col转换后的特征图大小应该是（331）（22）即9*4