温度的心情

matlab有pytorch框架,图解Faster-RCNN的PyTorch实现

本文用图解的方式，分析Faster-RCNN的PyTorch实现，以便直观地了解各个模块之间的调用和依赖关系，以及对NMS和ROI Align的CUDA实现的解读。

下面我们以trainval_net.py为入口，解读一下Faster-RCNN的PyTorch实现过程。

我们采用的数据集是PASCAL VOC 2007，采用的CNN模型是ResNet-101。

数据读取

数据读取过程大致为：提前读取训练样本的包围框(后文用bounding box的简称bbox指代)，把bbox的坐标等信息保存在内存里。该步骤并不需要把训练集的图片存在内存里，但会对长宽比超过一定范围的bbox做一下筛选，同时也会根据需要产生水平翻转的bbox，便于在训练过程中增加模型的泛化能力。当需要用dataloader读取样本时，才从硬盘上读取图像数据，进行预处理，并缩放到所需的大小。

下面详细介绍数据读取的代码。

bbox的读取

下图描述了combined_roidb('voc_2007_trainval')函数内部的调用关系。(图片是在diagrams.net画的)

bbox的读取过程如下：

有的数据集可以利用两个或多个不同的子样本集合并成一个更大更丰富的训练集，子样本集之间用“+”分割，比如COCO的“coco_2014_train+coco_2014_valminusminival”。这里用roi_data_layer.roidb.combined_roidb.get_roidb()分别读取各个子样本集的bbox。具体来说：

get_roidb('voc_2007_trainval')用Lambda函数创建了一个lib.datasets.pascal_voc.pascal_voc类实例，而这个类是从lib.datasets.imdb.imdb继承来的。imdb这个类用来保存不同样本集的图片编号、bbox、类别信息等。pascal_voc('trainval', '2007')在初始化时会创建一个名为image_index的list，其中保存了所有样本图片的编号(比如“000005”)，根据这些编号就可以从硬盘读取图片。

用lib.datasets.imdb.imdb.set_proposal_method('gt')方法将lib.datasets.imdb.imdb.roidb_handler成员设置为在lib.datasets.pascal_voc.pascal_voc当中定义的gt_roidb()方法。这个方法是用来读取样本集的ground truth bbox的。另外，在lib.datasets.pascal_voc.pascal_voc中还定义了一个rpn_roidb()方法，就是用RPN网络选取bbox的实现。在这个过程中，真实的bbox是从PASCAL VOC数据集的Annotations文件夹中取得的(比如“000005.xml”)。最后得到一个dict，包含了“boxes”，“gt_classes”，“gt_ishard”，“overlaps”，“flipped”，“seg_areas”几个key，分别代表bbox坐标、bbox类别、是否为难样本、标记类别的one-hot稀疏矩阵、是否为水平翻转的图片、bbox面积。

用roi_data_layer.roidb.combined_roidb.get_training_roidb(imdb)对bbox做一下预处理。包括用lib.datasets.imdb.imdb.append_flipped_images()把所有bbox做一下水平翻转，同时把image_index增长为原来的两倍，然后用roi_data_layer.roidb.combined_roidb.prepare_roidb(imdb)预先计算一下后面训练过程中可能会用到的值。

把从各个子样本集得到的bbox的list合并成一个list。

过滤掉没有bbox的样本。

根据bbox的宽高比对样本排序。其中宽高比大于2或小于0.5的bbox会标记为“need_crop”，便于后面对这些样本做裁剪。

dataloader的实现

下图描述了传入torch.utils.data.DataLoader的roi_data_layer.roibatchLoader.roibatchLoader类的依赖关系，这个类用来创建兼容PyTorch的dataset对象，以便在训练和预测过程中被DataLoader调用，读取样本的mini-batch。

在roibatchLoader类初始化时，会根据之前得到的排好序的ratio_list和ratio_index产生一个长度等于总样本量的list，其中每连续batch_size个数值都是相同的。如果宽高比(后文用ratio指代)小于1，则选取最小的ratio作为这个batch的统一ratio；如果ratio大于1，则选取最大的ratio作为统一ratio值。这样是为了使同一个batch内的ratio保持相同。

DataLoader需要通过索引值从dataset里获取某一个样本，该过程靠__getitem__(self, index)来实现，具体过程如下：

根据index从前文得到的roidb里获取bbox信息。如果是训练模式，则通过ratio_index间接获取index。然后将包含bbox信息的dict存在一个长度为1名为“minibatch_db”的list中。

用roi_data_layer.minibatch.get_minibatch(minibatch_db, num_classes)读取图片并产生一个mini-batch。具体来说：

读取图片并构造batch主要是在roi_data_layer.minibatch._get_image_blob(roidb, 0)当中实现的，具体步骤包括

用imread读取图片。原repo用的是scipy.misc.imread，我这里改为调用imageio.imread，当然用OpenCV的cv2.imread也是可以的；

把图片的色彩空间从RGB转化为OpenCV默认的BGR。所以如果上一步用的是cv2.imread，那么这一步是不需要的；

如果该bbox被标记为“flipped”，则将图片水平翻转；

用lib.model.utils.blob.prep_im_for_blob()减去样本集的均值(这个均值对不同的CNN在训练和预测时都是同一组值)然后缩放到较短边为600的尺寸；

用lib.model.utils.blob.im_list_to_blob()创建一个尺寸为(1, max_h, max_w, 3)的张量，并按照左上角对齐的方式把图片矩阵拷贝进来。

以同样的比例缩放bbox，然后把样本的相关信息保存在一个dict当中(即blobs)。

最后，检查一下bbox是否因为宽高比超出范围需要裁剪，在较长边的方向上按照2倍的比例随机剪裁。

模型整体结构

基于ResNet-101的Faster-RCNN模型结构和数据传递过程如下图所示。

整个模型相当于把ResNet分成了两部分。第一部分包含ResNet的输入层和前3组residual blocks(图中表示为RCNN_base)，然后把此时产生的feature map(图中表示为名为base_feat的张量)传入RPN网络，进行一次初步筛选(这里用到了NMS)给出2000个bbox，同时也给出置信度最高的256个bbox(包括128个前景bbox和128个背景bbox)的分类交叉熵误差和坐标的smooth-L1误差。第二部分包含一个ROI Align层和ResNet的第4组residual block(图中表示为RCNN_top)，然后再根据此时产生的feature map(图中)得到置信度最高的128个bbox的分类误差和坐标误差。最后，把前面得到的4组误差值加起来，就是整个模型最终的误差。

输入数据的解释：

im_data。尺寸为[4, 3, 600, 800]的张量，是经过dataloader缩放过的样本图像，不同原始尺寸的图像都被缩放至短边长度为600，所以另一条边的长度不一定总是800。

im_info。尺寸为[4, 3]的张量，其中第一个维度的4代表batch size，第二个维度的3保存了每幅图像的高度、宽度和长宽比。因为im_data是按照这组batch中尺寸最大的那幅图像构造出来的，同一组batch中可能存在稍小一些的图像，所以图像的实际尺寸需要从im_info当中获取。值得注意的是，在目前的代码中，图像的实际长度和宽度信息只被用于对超过图像边界的bbox裁剪，另外长宽比这个值没有用到，是冗余的。

gt_boxes。尺寸为[4, 20, 5]的张量，其中第三个维度的5代表真实bbox(ground truth)的坐标和类标签(所以需要4+1个值)。类标签的维度其实有些冗余，因为类别信息本身可以从第二个维度的索引得到，这样设计应该是为了便于直接与网络的预测值(需要同时预测bbox的坐标和类标签)相比较。

num_boxes。尺寸为[4]的张量，原本是用来表示图像中存在的bbox数量，但这个张量在模型中没有用到，所以也不需要关心它的作用。

图中与ResNet网络有关的模块有2个：

RCNN_base。包含ResNet的输入层和前3个residual block：

self.RCNN_base = nn.Sequential(resnet.conv1, resnet.bn1,resnet.relu,

resnet.maxpool,resnet.layer1,resnet.layer2,resnet.layer3)

而且其中的所有conv层和bn层都不参与训练；

RCNN_top。包含ResNet的第4个residual block：

self.RCNN_top = nn.Sequential(resnet.layer4)

而且其中的所有bn层都不参与训练，但是conv层会被微调(fine-tuning)，以适应新的数据和误差函数。

模块和层的依赖关系

lib.model.faster_rcnn.faster_rcnn._fasterRCNN，定义了Faster-RCNN的基类。其中调用了：

lib.model.rpn.rpn._RPN，RPN网络，用来产生大量的bbox，然后对这些bbox做一次初步筛选，得到2000个bbox。在这个网络中，调用了：

lib.model.rpn.proposal_layer._ProposalLayer，用来根据事先定义好的9组anchor产生大量的bbox(比如为600*800的图像产生17100个bbox)，然后用NMS做一下粗筛，保留下2000个bbox。这里的NMS是利用CUDA在GPU上计算的。

lib.model.rpn.anchor_target_layer._AnchorTargetLayer，用来在经过ResNet前3个residual block处理得到的feature map上的每个像素处都产生9个bbox，并给出每个bbox的预测类标号和坐标，这些bbox会用来计算两组误差rpn_loss_cls和rpn_loss_bbox。

lib.model.rpn.proposal_target_layer_cascade._ProposalTargetLayer，在前一步筛选出的2000个bbox当中再做一次筛选，得到128个bbox。

lib.model.roi_layers.roi_align.ROIAlign，ROI Align层，用来把不同尺寸的feature map归一化到相同大小，方便最后的输出层产生长度相同的预测张量。这里的ROI Align是利用CUDA在GPU上计算的。

lib.model.faster_rcnn.resnet.resnet，继承自_fasterRCNN，定义了RCNN_base, RCNN_top等模块。

下面我们按照模型的计算顺序解释网络的各部分的具体作用和计算逻辑。

bbox的产生

在模型lib.model.faster_rcnn.resnet.resnet初始化的过程中，会在lib.model.rpn.rpn._RPN当中创建一个lib.model.rpn.proposal_layer._ProposalLayer层。在这个_ProposalLayer层初始化的时候，会调用lib.model.rpn.generate_anchors.generate_anchors()函数。这个函数是用来依据3种不同的长宽比(即0.5，1，2)和3种不同的尺寸比例(即8，16，32)产生9组基本的bbox坐标(被称为anchor)，这9组anchor用来在图像上(具体地说，是在经过卷积计算得到的feature map上)的不同位置产生大量的bbox。这些bbox就可以作为候选的目标框，经过后续步骤来筛选出最优的检测窗。

产生的9组anchors坐标如下图所示。

需要注意的是，由于计算过程中的浮点数取整规则的不同，实际得到的矩阵的某些值可能会有正负1的误差。如果你是在写论文的话，需要注意检查这个矩阵的值是否和论文作者给出的Matlab结果相同。

RPN的计算

RPN网络的计算过程如下图所示。

这里的feature map是从ResNet的前3个residual block计算得到的。尺寸为[4, 3, 600, 800]的原始样本张量被映射到一个尺寸为[4, 1024, 38, 50]的feature map。

这个feature map经过两次conv操作和softmax，通道数从1024减少到18。同时，另一组conv也给出了一个通道数为36的张量。这两个张量都被输入到_ProposalLayer。尺寸为[4, 18, 38, 50]的张量rpn_cls_prob可以理解为在38×50的feature map上的每个像素点都产生9个前景预测值和9个背景预测值，相当于以该像素为中心的9种不同的anchor恰好可以给出前景或背景目标的可能性(因为经过了softmax处理，所以可以直观地看成“可能性”)。类似地，尺寸为[4, 36, 38, 50]的张量rpn_cls_pred可以理解为9个bbox的坐标(4×9=36)在_ProposalLayer中，会根据前面9×4的anchor矩阵，一共会产生38×50=1900组bbox，每组相邻的bbox坐标之间实际上相隔16个像素的距离。每组bbox由9种anchor产生9个bbox，所以总的bbox数量为1900×9=17100个。

这些bbox的坐标4个值并不是直接产生x, y, w, h这样的数值，而是相对anchor的x, y方向的偏移量和缩放系数(bbox的长度和宽度是按照指数缩放的，既保证长宽都为正值，又能产生更大范围的数值)。这样前面的conv层只需要产生在1附近抖动的值，就可以映射为数值范围很大的bbox坐标和尺寸。这个从偏移量和缩放系数映射到实际bbox坐标的过程是在lib.model.rpn.bbox_transform.bbox_transform_inv()函数中完成的。映射完之后，还要调用lib.model.rpn.bbox_transform.clip_boxes()把超出feature map范围的bbox进行裁剪(于是这里就用到了im_info输入数据)。

然后，对这17100个bbox按照rpn_cls_prob值排序，取出前12000个bbox。再用NMS从这12000个bbox里选出与高置信度bbox重叠率比较高的(比如两个矩形的交的面积处以并的面积大于0.7)，选出重叠率最高的2000个bbox，输出为rois。

NMS的CUDA实现

我们知道Python支持调用C++实现的扩展，以更好地利用CPU性能。由于Python的GIL所限，Python所执行的多线程代码同一时间只能利用一个CPU核心，所以计算密集型任务始终不能提高CPU的利用率。改为C++扩展实现的话，很容易把CPU利用率提高到100%，提高算法的计算速度。类似地，在Faster-RCNN当中，虽然conv, bn等操作可以依靠PyTorch在GPU上计算，但没有被PyTorch实现的一些算法直接在CPU上计算还是有些慢。特别是像NMS这种可以并行化的算法，用CUDA C来实现，并编译成Python扩展可以显著地提高模型的训练速度。

现在PyTorch已经支持CPU和GPU端的NMS，ROI Pooling，ROI Align实现，接口在torchvision.ops当中：https://pytorch.org/docs/stable/torchvision/ops.html。现在可以直接用torchvision.ops.nms执行NMS的计算。但本着学习的目的，我们仍然采用repo里面所给的CUDA实现。另外，通过下面的介绍你也会发现这里的CUDA代码还有很大的优化空间(比如开辟了冗余的显存空间，频繁地在CPU和GPU之间传递数据等)。如果精力允许，可以再读一下PyTorch实现的NMS。

Python的NMS接口在lib.model.roi_layers.nms当中，然后从这里指向了C++模块_C.nms。这个C++函数声明位于lib/model/csrc/nms.h。可以看到，这个函数接受的输入参数和返回值都是在PyTorch C++ API的ATen中定义的Tensor。当CUDA可用时，输入的Tensor被传入lib/model/csrc/cuda/nms.cu文件中的nms_cuda函数：

at::Tensor nms_cuda(const at::Tensor boxes, float nms_overlap_thresh)

这12000个bbox可以分为若干个组，每组里分别用NMS筛选出一些最优bbox之后再把每组的结果合并，可以近似认为与对原始的12000个bbox整体做一次NMS的结果相同。可能会存在位于另一组的bbox和当前组最优bbox重叠度依然很高的情况，但是NMS的主要作用是筛掉不想要的bbox(即抑制掉不是局部极大值的元素)。所以用并行NMS给出多于2000个bbox，再串行地筛选出评分最高的2000个bbox，也是一个十分合理的策略。

在CUDA代码中，建立了一个二维的grid，包含188×188个block。每个block是一维的，包含64或32个thread(最后一个block包含32个thread)。这样，在grid的x或y方向上都包含187×64+32=12000个thread，每个thread都用来计算一个bbox与该block当中最优bbox的重叠率(overlap)。对于重叠率大于0.7的bbox，会在一段连续的内存mask当中以bit为0/1的方式对该bbox是否保留进行标记。由于所有的bbox已经在Python中按照评分排好了序，所以每个block内的各个bbox只需要与该block内的第一个bbox计算重叠率就好。单个bbox的重叠率的计算是在nms_kernel函数中完成的，调用方式如下：

nms_kernel<<>>(boxes_num,

nms_overlap_thresh,

boxes_dev,

mask_dev);

<<<...>>>是CUDA C特有的语法，用来从宿主端(即CPU端)调用CUDA的global函数。这里bbox数据已经从Tensor转换为float数组。

nms_kernel函数格式如下：

__global__ void nms_kernel(const int n_boxes, const float nms_overlap_thresh,

const float *dev_boxes, unsigned long long *dev_mask)

其中又调用了一个device函数来计算两个bbox的重叠率：

__device__ inline float devIoU(float const * const a, float const * const b)

CUDA的global函数(__global__)是运行在设备端(即GPU端)，可以通过<<<...>>>语法从宿主端调用的函数，例如在nms_cuda函数中调用nms_kernel；device函数(__device__)是运行在设备端，只能被其他device函数或global函数调用的函数，例如在nms_kernel函数中调用devIoU。global函数一般被称为“kernel”，是并行化后的单个计算单元，在其内部可以通过blockIdx，threadIdx等来获取当前的kernel在整个计算任务当中所处的位置。其实可以理解为kernel是一个2层或多层for循环最里层的循环体，而blockIdx，threadIdx就是那几层for循环的索引变量。

这188*188个block可以看成是一个对称矩阵，矩阵元素(i, j)和(j, i)都表示第i个bbox和第j个bbox之间的重叠率。所以这种计算方式其实浪费了很多的空间和时间。

RPN误差的计算

前面得到的尺寸为[4, 18, 38, 50]的张量rpn_cls_score被传入_AnchorTargetLayer，用于计算RPN网络的误差。在_AnchorTargetLayer当中，用了和_ProposalLayer相同的方法以网格的形式产生了17100个bbox。然后抛弃掉范围超出38×50的feature map的bbox。

比方说现在还剩下5944个落在feature map范围内的有效bbox。调用lib.model.rpn.bbox_transform.bbox_overlaps_batch()函数计算每个bbox与ground truth的重叠率。在这个过程中，如果bbox和某一类的ground truth bbox的重叠率大于0.7，则把标签的预测值标为1(表示前景)；如果重叠率小于0.3，则标签预测值标为0(表示背景)。所有的bbox处理完之后，如果标为1的bbox数量超过了128，就随机选出一些bbox，将其对应标签改为-1(表示既不是前景，也不是背景)；同样地，如果标为-1的bbox多于128个，也随机地将一部分对应标签改为-1。这样，就保证了现在的5944个bbox的类别预测值当中，刚好有128个前景和128个背景，其余的bbox则全部为-1。

然后，调用lib.model.rpn.bbox_transform.bbox_transform_batch()函数把ground truth bbox映射到与RPN网络预测值相同的格式，即x, y坐标经过平移，长度和宽度经log缩放。

这样，我们就得到了RPN网络的预测bbox类别标签和坐标，以及真实bbox的类标签和坐标。由于类标签是离散值(-1, 0, 1)，坐标值是连续值，类标签的预测用交叉熵(cross entropy)作为误差函数按照分类问题进行优化，坐标值用smooth L1误差函数按照回归问题进行优化。cross entropy的输入是重叠率最高的4×(128+128)个bbox(目的在于人为地调整正负样本的比例，避免大量的-1和0类别影响RPN网络对前景目标的识别正确率)，而smooth L1的输入是所有的bbox坐标。

smooth L1误差定义如下所示：

代码中还手动设置了两组参数rpn_bbox_inside_ws和rpn_bbox_outside_ws来调整公式中x的系数。但这里两组系数是相同的，都是均匀地初始化。

第二次bbox筛选

在前面的步骤里，RPN网络根据预先定义好的9种anchor以网格的形式产生了17100个bbox(假设输入图像大小是600×800)，然后用NMS做初步筛选，保留了2000个bbox，这2000个bbox被保存在张量rois当中，传递给_ProposalTargetLayer，做进一步的筛选。

在_ProposalTargetLayer当中，关键在于lib.model.rpn.proposal_target_layer_cascade._ProposalTargetLayer._sample_rois_pytorch函数。在这个函数里，所有的候选bbox会与每个ground truth bbox计算重叠率，重叠率大于等于0.5的bbox认为是前景，并且把其对应的类别预测值标记为重叠率最高的那个类。如果一幅图像最终得到的前景bbox多于32个，则随机抛弃一些bbox，只保留32个前景bbox。同时，与ground truth bbox重叠率小于0.5的认为是背景，被保留的背景bbox数量要保证每幅图像产生的前景+背景bbox的总数是128。

这128个bbox的坐标也会经过类似于RPN网络当中的过程进行变换，以便于回归优化。

ROI Align

ROI Pooling的作用是把前面得到的4×128个尺寸不一的bbox(假设batch size为4)归一化到同样的大小，便于后面的conv层继续处理。

与ROI Pooling相比，ROI Align对于feature map无法被目标尺寸整除时，有明显的优势。原因在于ROI Align会用双线性内插的方法在不规则大小的feature map当中寻找极值。

ROI Align也是可以并行化的。所以代码中ROI Align也是用CUDA来实现的。这里默认为ROI Align的输出张量维度为[512, 1024, 7, 7]，其中1024来自于ResNet第3组residual block的输出，512刚等于4×128，可以一次性处理完4幅输入图像的128个预测bbox。输出张量的第一个维度512也说明了从ROI Align这里开始即把每个预测bbox当作一个单独的样本来对待。

Python的ROI Align API定义在lib.model.roi_layers.roi_align当中，然后指向了C++扩展_C.roi_align_forward和_C.roi_align_backward(分别为正向计算和反向求导)，对应的C++头文件为lib/model/csrc/ROIAlign.h。

以前向计算为例，在CUDA可用时，函数的实现位于lib/model/csrc/cuda/ROIAlign_cuda.cu：

at::Tensor ROIAlign_forward_cuda(const at::Tensor& input,

const at::Tensor& rois,

const float spatial_scale,

const int pooled_height,

const int pooled_width,

const int sampling_ratio)

这里依然是传入了at::Tensor，并创建了一个大小为4096的grid(理想情况下可以建立一个大小为1024×7×7的grid，使得每个block对应输出张量的一个元素)，每个grid包含512个thread，对应于输出张量的样本维度。

同样地，这里用<<<...>>>的方式调用global函数RoIAlignForward：

template

__global__ void RoIAlignForward(const int nthreads, const T* bottom_data,

const T spatial_scale, const int channels,

const int height, const int width,

const int pooled_height, const int pooled_width,

const int sampling_ratio,

const T* bottom_rois, T* top_data)

这里的模板类类型T被设置为float，这样就可以计算次像素(sub-pixel)级的坐标了。比如，在一个2×2的方格内，取(0.5, 0.5), (0.5, 1.5), (1.5, 0.5), (1.5, 1.5)四个点来进行双线性内插，得到局部极大的像素值。

内插函数定义在一个device函数bilinear_interpolate中：

template

__device__ T bilinear_interpolate(const T* bottom_data,

const int height, const int width,

T y, T x,

const int index /* index for debug only*/)

bbox的最终分类

由ROI Align产生的[512, 1024, 7, 7]张量被传入ResNet的第4组residual block，得到一个维度为[512, 2048]的张量。注意，这些residual block中的bn层没有参与训练，但conv层是参与新样本训练的。

这个大小为[512, 2048]的张量经过RCNN_bbox_pred层(是一个linear层)产生一个[512, 4]张量，表示对4×128个bbox的坐标预测值bbox_pred。

同时，[512, 2048]的张量也会经过RCNN_cls_score层(也是一个linear层)产生一个[512, 21]张量，表示对4×128个bbox的类别预测值(20个正类+1个负类)cls_score。

然后，cls_score由交叉熵误差函数计算分类误差RCNN_loss_cls，bbox_pred由smooth L1误差函数计算坐标回归误差RCNN_loss_bbox。

最后，RPN的两组误差和此处产生的两组误差加在一起，构成模型的最终误差：

loss = rpn_loss_cls.mean() + rpn_loss_box.mean() \

+ RCNN_loss_cls.mean() + RCNN_loss_bbox.mean()

模型的训练

原始repo的README并没有给出所有训练网络所需的准备工作，这里进行一些补充。

安装COCO API

需要最少修改的方法是把COCO API安装在代码目录下的data文件夹里：

cd data && git clone https://github.com/cocodataset/cocoapi.git && cd cocoapi/PythonAPI && make

额外的COCO样本子集

训练脚本

修改好lib/model/faster_rcnn/resnet.py文件中的self.model_path与lib/model/utils/config.py文件中的__C.DATA_DIR之后，用下面的命令编译CUDA代码(别忘了安装requirements.txt里面列出来的依赖包)：

cd lib

python setup.py build develop

用下面的命令开始训练：

python trainval_net.py --dataset pascal_voc --net res101 --bs 4 --nw 8 --lr 4e-3 --lr_decay_step 8 --epochs 10 --cuda

在RTX 2080Ti上，训练PASCAL VOC 2007大约耗时130分钟，显存占用约为9309MB，内存占用约为2709MB。

模型的预测

用以下命令用测试集验证模型的性能：

python test_net.py --dataset pascal_voc --net res101 --checksession 1 --checkepoch 10 --checkpoint 2504 --cuda --load_dir models

mAP=0.7573

总结

总结起来，Faster-RCNN的过程是：提前定义好9种anchor，RPN网络根据这9种anchor以网格的形式产生大量的bbox，然后用NMS做初步筛选，保留2000个bbox。在筛选2000个bbox的过程中，没有用到ground truth信息，只是利用了RPN网络给出的bbox属于前景/背景的预测值。但是计算RPN网络的误差时用到了ground truth，其中bbox的类别是用分类方法优化的，坐标值是用回归方法优化的。然后从这2000个bbox里根据与ground truth的匹配程度再做一次筛选，产生128个bbox，再计算这些bbox的具体分类误差(如果训练集包含20类，则需要预测21个类别，多加的那一类表示背景类)和坐标误差，并分别用分类和回归方法进行优化。

把这篇文章分享给你的朋友：

你可能感兴趣的:(matlab有pytorch框架,图解Faster-RCNN的PyTorch实现)

MySQL：报错1130-host ... is not allowed to connect to this MySql server m0_74824823 mysql adb android
报错:1130-host…isnotallowedtoconnecttothisMySqlserver1、改表法可能是你的帐号不允许从远程登陆，只能在localhost。这个时候只要在localhost的那台电脑，登入mysql后，更改“mysql”数据库里的“user”表里的“host”项，从"localhost"改称"%"mysql-uroot-pvmwaremysql>usemysql;my
篡改猴脚本已安装但使用不了解决方法梅羽落经验分享脚本
在扩展权限中选择允许访问文件URL具体脚本如何安装使用可看博主之前的文章如何使用插件(刷课,游戏等)-CSDN博客有问题还可以评论哦~~
【gin】gin中使用protbuf消息传输go案例 {⌐■_■} gin golang 开发语言
在Gin中使用Protobuf进行高效消息传输Protobuf（ProtocolBuffers）是一种高效的二进制序列化协议，广泛用于高性能场景的数据传输。相比JSON，Protobuf具有更小的体积和更快的解析速度，非常适合服务间通信或前后端交互。为什么选择Protobuf？特性JSONProtobuf体积大小较大（文本格式）较小（二进制格式）解析速度较慢较快跨语言支持较弱强（支持多种语言）定义
IDM下载软件：加速下载体验虫语者开源软件
在互联网时代，下载速度和管理效率对用户体验至关重要。InternetDownloadManager（IDM）是一款广受欢迎的下载管理工具，它以其卓越的性能和丰富的功能赢得了全球用户的青睐。本文将深入探讨IDM下载软件的特点、优势以及使用方法。IDM的核心功能下载加速：IDM通过动态文件分割和多线程下载技术，显著提升下载速度。它能够将一个文件分成多个部分并同时下载，从而最大限度地利用带宽资源。断点续
你能读懂微服务架构深度解析：架构设计背后的哲学吗？写代码的珏秒秒程序员 Java 编程 java 架构程序人生后端微服务
架构设计哲学如果说软件开发的本质是不断挖掘问题领域中隐藏的错综复杂性，那么架构解决的问题就是如何管理这些复杂性。而在软件领域，最为复杂的软件实体莫过于软件操作系统。从数以千计的工程师参与开发的UNIX操作系统到Linux开源系统的成功，越来越多的人开始关注和思考UNIX技术背后隐藏的设计哲学。UNIX设计哲学概括为一句话就是“小而专注”。可以说，微服务架构理念和UNIX设计哲学一脉相承，微服务将U
批量将.doc文件转换为.docx文件的Python脚本优化袁公白 python c#microsoft
在本篇博客中，我将分享如何使用Python编写一个脚本，可以批量将一个文件夹中的所有.doc文件转换为.docx文件。这个脚本利用了Python的win32com库来操作Word应用程序进行文件格式转换，并通过tkinter库中的filedialog模块实现文件夹选择对话框，让用户选择需要转换的文件夹路径。首先，我们定义了两个函数：doc_to_docx用于将单个.doc文件转换为.docx文件，
客户订单管理的微服务例子自由鬼 Java程序微服务架构云原生
下述代码实现了一个客户基本信息管理的微服务，包含以下功能：1、用户认证：使用SpringSecurity和OAuth2进行认证。配置了角色和权限控制。2、角色授权：通过@PreAuthorize注解实现角色授权，只有管理员可以执行某些操作。3、调用其他微服务：使用FeignClient调用用户管理微服务，从中获取用户数据。此示例具备扩展性，可以轻松增加其他功能，例如更多的RESTAPI或与其他微服
我的创作纪念日自由鬼行业发展纪念
机缘生命的旅程中，机缘如同一束微光，指引着我在困顿中寻找前行的方向。机缘说来就来，不可言语。收获没有想到，在2024年12月13日正式通过csdn.net发布博客到目前就有了1358个粉丝、97994阅读量、1734收藏，能够得到认同非常高兴。日常我的日常生活虽忙碌，却充满意义。除了工作和研究，我常反思自身与外界的关系，思考如何让IT这一生产力能够发挥更大的作用。成就尽管前行的道路上仍充满挑战，我
35. IP地址的组成 MineGi #网络基础网络
IP地址的组成IP地址（InternetProtocolAddress）是用于在Internet上唯一标识一个设备（如计算机、路由器、服务器等）的数字标签。它遵循特定的格式和规则，以确保全球范围内的唯一性和可路由性。IP地址的组成通常分为两部分：网络部分（NetworkID）：这部分标识了设备所在的网络。在IPv4中，网络部分可能占用IP地址的前几位到几十位不等，具体取决于所使用的子网掩码（Sub
Android实战技巧之五十：App的系统签名全速前行 Android Android实战技巧系统签名 sign
这件事困扰我们多时了。我们一直想用非源码编译的方式解决此事，按如下步骤。这种获取系统签名的方法如下：1、apk中需要使用android:sharedUserId=”android.uid.system”这个属性。在Manifest文件修改，如下：2、将app做无签名编译（AndroidStudio）用命令行编译Windows:gradlew.batassembleReleaseMac/linux:
Nginx UI：一款开源的Nginx可视化管理界面，让你轻松管理nginx的配置小华同学ai nginx ui 开源
嗨，大家好，我是小华同学，关注我们获得“最新、最全、最优质”开源项目和工作学习方法NginxUI是由0xJacky和Hintay共同开发的一款Nginx网络管理界面。它旨在为Nginx提供一个易于使用的图形界面，让用户可以在线查看服务器状态、编辑配置文件、管理网站和证书等。想要一睹为快？访问https://demo.nginxui.com/使用以下凭据登录：用户名：admin密码：admin特色功
vue+Element实现搜索关键字高亮功能 hsany330
本文实例为大家分享了vueelementUI表格关键字筛选高亮的具体代码，供大家参考，具体内容如下代码：1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787
数学：机器学习的理论基石每天五分钟玩转人工智能机器学习人工智能
一、数学：机器学习的理论基石机器学习是一种通过数据学习模式和规律的科学。其核心目标是从数据中提取有用的信息，以便对未知数据进行预测和分类。为了实现这一目标，机器学习需要一种数学框架来描述和解决问题。数学在机器学习中起着至关重要的作用，它提供了一种数学模型来描述数据和模式，以及一种数学方法来优化模型。数学在机器学习中的应用非常广泛，涵盖了线性代数、概率论、统计学、微积分、优化等多个领域。这些数学方法
差分进化算法DE DroidMind 智能算法与机器学习差分进化算法
差分进化算法DE属于进化算法，这里算法还包括依次遗传算法、进化策略、进化规划。差分进化算法包括三个基本的操作：变异操作、交叉（重组）操作和选择操作。一、算法建模：1、假设我们希望得到函数f(x)的最优解，这个函数有D个解。2、为函数f(x)设置一个解的组数N，N至少为4。3、这样我们就得到了N组并且每组解的个数为D的集合，它可以使用N个D维参数向量来表示。因为它类似于遗传算法进化一样，是一代一代的
【AUTOSAR】VCU开发实际项目讲解（二）----VCU软件与结构描述大道生单片机嵌入式硬件 AUTOSAR 26262 VCU 汽车
VCU软件描述VCU软件架构主要分为底层软件驱动和应用层控制策略，其中应用层控制策略通过基于模型的开发，自动生成代码并可与底层驱动软件实现无缝连接。VCU软件通过BOOTLOADER和CAN总线进行更新刷写。标定及诊断支持CCP/XCP标定协议支持UDS诊断协议及SAEJ1939诊断协议故障存储：128KIIC外扩EEPROM提供程序刷新Bootloader软件工具基于CAN总线的控制器刷新工具支
掌握未来游戏开发：Unreal Engine 5与C++的完美结合金文依
掌握未来游戏开发：UnrealEngine5与C++的完美结合【下载地址】UnrealEngine5游戏开发教程-使用C脚本分享UnrealEngine5游戏开发教程-使用C++脚本欢迎来到“UnrealEngine5GameDevelopmentwithC++Scripting”资源下载页项目地址:https://gitcode.com/Open-source-documentation-tut
推荐开源项目：EPPlus.Core——.NET Core下的Excel处理库纪亚钧
推荐开源项目：EPPlus.Core——.NETCore下的Excel处理库项目地址:https://gitcode.com/gh_mirrors/ep/EPPlus.Core1、项目介绍在数据处理的日常工作中，对Excel文件的操作是一项常见的需求。而EPPlus.Core正是为此而生的一个.NETCore版本的Excel处理库。作为一个非官方的EPPlus库移植版，它允许你在跨平台的.NETC
在 Python 中等待 5 秒迹忆客 Python 实用技巧 python java 前端
Python具有各种功能和库来创建交互式应用程序，用户可以在其中提供输入和响应。我们可以创建需要暂停应用程序执行的情况。本篇文章将讨论如何在Python中等待5秒。在Python中使用time.sleep()函数等待5秒Python的time模块提供了存储和操作时间的功能和对象。该库中的sleep()函数增加了执行延迟；该函数接受以秒为单位的时间。例如，importtimeprint("Befor
使用npm创建three.js项目 ShawnWeasley npm javascript arcgis 前端 node.js
1.安装Node.js和npm首先，需要在您的计算机上安装Node.js和npm。Node.js是一个JavaScript运行环境，而npm是一个JavaScript包管理器。npm会随Node.js一起安装，因此只需要安装Node.js即可。从Node.js的官方网站(https://nodejs.org)下载并安装适合您操作系统的版本。2.创建一个新的项目在您希望创建项目的目录下，手动创建一个
os模块 datbgd1130 python
os.getcwd()获取当前工作目录，即当前python脚本工作的目录路径os.path.abspath(path)返回path规范化的绝对路径os.path.split(path)将path分割成目录和文件名二元组返回os.path.dirname(path)返回path的目录。其实就是os.path.split(path)的第一个元素os.path.basename(path)返回path最
C#的学习方法和思路，全部整理在这了！编程乐趣 c#学习方法开发语言
大家好，我是编程乐趣。今天梳理下，我从写公众号以来，发表过的有关学习编程的自学方法、架构、学习路线、重构、编程经验等内容，希望对大家有点启发。一、自学编程的方法用这个方法学习C#的，一年后都变成高级工程师了！自学C#，要懂得善用MSDN自学C#，要懂得用好对象浏览器C#自学建议：避开新手易犯的错误一个很简单却能让你快速掌握C#的方法二、学习架构的思考DDD与三层架构，一定就是DDD好？程序员，真有
python 快速拆分含有多种分隔符的字符串风陵苑主 python
importres='ab;cd|efghij,lmn;opq,rst,uvwx\yz're.split(r'[,;\\|]+',s)
华为OD机试 -TLV解码（Java & Python& JS & C++ & C ）算法大师最新华为OD机试 c++java 华为od 华为华为od机试 python javascript
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述TLV编码是按[TagLengthValue]格式进行编码的，一段码流中的信元用Tag标识，Tag在码流中唯一不重复，Length表示信元Value的长度，Value表示信元的值。码流以某信元的Tag开头，Tag固定占一个字节，Length固定占两个字节，字节序为小端序。现给定TLV格式编码的码流，以及需要解码的信元T
Android 应用添加系统签名权限介绍佳哥的技术分享 android
一、前言Android应用添加系统签名就能获取到系统权限调用一些系统接口，添加系统签名的方式主要包括：在AndroidStudio中配置签名文件生成apk和在源码目录编译添加系统签名生成apk。本文介绍的都是一些基础的签名知识，后续延伸介绍相关权限内容。有兴趣的可以进行了解。二、Android应用添加系统签名权限的几种方式介绍1、在AndroidStudio添加系统签名文件对应需要签名的modul
无需插件，OmniGen 凭文本指令读懂图像，多样生成随心掌控算家云模型构建 python 开发语言 AI模型图像生成文字转图像人工智能 OmniGen
一、介绍OmniGen是一个统一的图像生成模型，可用于执行各种任务，包括但不限于文本到图像生成、主题驱动生成、身份保留生成、图像编辑和图像条件生成。OmniGen不需要额外的插件或操作，它可以根据文本提示自动识别输入图像中的特征（例如，所需的对象、人体姿势、深度映射）可以通过OmniGen灵活地控制图像生成：引用表达式生成：你可以输入多个图像，并使用简单的通用语言来引用这些图像中的对象。OmniG
2025 年热门AI 应用——AI 编程会如何发展？算家云话题文章人工智能算家云 AI编程 AI应用 AIGC
2024年，代码领域的AI应用层出不穷。作为最热门的AI应用之一，AI编程的未来将会如何呢？快跟着小编一起看看吧~2024年可谓是AI应用大年，除了视频生成、AI推理等领域，代码领域的AI应用也是层出不穷。GithubCopilot、Claude3.5Artifacts......这些名字，你肯定见过。就在2024年底，Cursor以26亿美元估值完成了1亿美元融资，四个月内估值涨了6.5倍！可见
股票量化交易进阶：构建回测框架backtrader InUnix python 开发语言
在量化交易领域，回测是一个重要的环节。回测框架可以帮助我们验证投资策略的有效性，并评估其在历史数据上的表现。backtrader是一个功能强大且灵活的Python回测框架，它为量化交易提供了丰富的工具和功能。本文将介绍如何使用backtrader构建一个简单的回测系统，并给出相应的源代码示例。首先，我们需要安装backtrader库。可以使用pip命令进行安装：pipinstallbacktrad
Python延时函数详解及实例代码 HackDyno python java 前端 Python
Python延时函数详解及实例代码在Python编程中，有时我们需要在程序中添加延时，以便在执行特定操作之前等待一段时间。延时函数允许我们在代码中创建一个暂停的时间间隔。本文将详细介绍Python中的延时函数，并提供一些实例代码供参考。Python中的延时函数可以通过time模块来实现。time模块是Python标准库中的一部分，提供了与时间相关的函数和方法。我们可以使用time.sleep()函
Python中删除文件和目录湫兮之风 python java 开发语言
python中分别提供os包下的os.remove()与shutil包下的shutil.rmtree()函数，其中os.remove(）的主要作用是删除一个具体的文件，shutil.rmtree()主要作用是删除一个具体的目录。os.remove()这个函数需要一个参数，即要删除的文件的路径。importosfile_path="/path/to/your/file.txt"#将此处的路径替换为你
python os.path.basename()方法 Arthur-Ji python
返回path最后的文件名。如果path以／或\结尾，那么就会返回空值。即os.path.split(path)的第二个元素。?12345>>>importos>>>path='/Users/beazley/Data/data.csv'>>>#Getthelastcomponentofthepath>>>os.path.basename(path)'data.csv'
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla