KK_THREESTEP

Faster R-CNN代码理解(二)之build_whole_network.py

上一次说到train.py中

final_bbox, final_scores, final_category, loss_dict = faster_rcnn.build_whole_detection_network(
            input_img_batch=img_batch,
            gtboxes_batch=gtboxes_and_label)

现在我们看看build_whole_detection_network()这个函数，emmm,在build_whole_network.py中。pycharm对这个函数ctrl+B定位一下。嗯，慢慢讲：

if self.is_training:
     # 确保形状是[-1,5],-1表示电脑自动计算行数
     #tf.cast代表数据转换为tf.float32
     gtboxes_batch = tf.reshape(gtboxes_batch, [-1, 5])
     gtboxes_batch = tf.cast(gtboxes_batch, tf.float32)
 #图像的shape:(1,H,W,C)这是形状啦，不是每一行的具体数据
img_shape = tf.shape(input_img_batch)

########################################

1.构建基础网络

P_list = self.build_base_network(input_img_batch)  # [P2的特征图, P3的特征图, P4……, P5……, P6……]

具体点，需要看到：

def  build_base_network(self, input_img_batch):
     #string.startswith（X）——检查string是否与X相同，返回一个bool值
     if self.base_network_name.startswith('resnet_v1'):
     #构建了resnet网络并利用了FPN思想得到P2~6，并返回一个dict，字典里面是一个个的conv2d的特征图
        return resnet.resnet_base(input_img_batch, scope_name=self.base_network_name, is_training=self.is_training)
     elif self.base_network_name.startswith('MobilenetV2'):
         return mobilenet_v2.mobilenetv2_base(input_img_batch, is_training=self.is_training)
     else:
         raise ValueError('Sry, we only support resnet or mobilenet_v2')

重点在这一句代码

return resnet.resnet_base(input_img_batch, scope_name=self.base_network_name, is_training=self.is_training)

定位到resnet.py中
拆开看：

def resnet_base(img_batch, scope_name, is_training=True):
    '''
    this code is derived from light-head rcnn.
    https://github.com/zengarden/light_head_rcnn

    It is convenient to freeze blocks. So we adapt this mode.
    '''
    if scope_name == 'resnet_v1_50':
        middle_num_units = 6
    elif scope_name == 'resnet_v1_101':
        middle_num_units = 23
    else:
        raise NotImplementedError('We only support resnet_v1_50 or resnet_v1_101. Check your network name....yjr')

这边表示能用什么形式

blocks = [resnet_v1_block('block1', base_depth=64, num_units=3, stride=2),
              resnet_v1_block('block2', base_depth=128, num_units=4, stride=2),
              resnet_v1_block('block3', base_depth=256, num_units=middle_num_units, stride=2),
              resnet_v1_block('block4', base_depth=512, num_units=3, stride=1)]
    # when use fpn . stride list is [1, 2, 2]

这边我没怎么看彻底，有点绕的，大概的意思就是构建了一个resnet_v1_50这杨一个基础结构

 with slim.arg_scope(resnet_arg_scope(is_training=False)):
        with tf.variable_scope(scope_name, scope_name):
            # Do the first few layers manually, because 'SAME' padding can behave inconsistently
            # for images of different sizes: sometimes 0, sometimes 1
            #做卷积操作
            net = resnet_utils.conv2d_same(
                img_batch, 64, 7, stride=2, scope='conv1')
            #pad就是填充0，同时[0,0]表示在该维度不做处理

            net = tf.pad(net, [[0, 0], [1, 1], [1, 1], [0, 0]])
            net = slim.max_pool2d(
                net, [3, 3], stride=2, padding='VALID', scope='pool1')

对图像进行卷积，变为64通道的，然后进行padding,最后进行最大池化。
关于tf.pad,用下面的代码测一下大概就知道得到什么了

import tensorflow as tf
t=tf.constant([[[1,2], [2,3],[2,1]],
               [[1,2],  [2,3],[2,1]]])
print(t)
a=tf.pad(t,[[1,1], [2,0],[1,0]])
with tf.Session() as sess:
    print("----------------------------------")
    a = sess.run(a)
    print(a)
    print(a.shape)

接着：

#在建立base网络时，根据网络定义 not_freezed 确定，是否对特征提取网络进行再训练
not_freezed = [False] * cfgs.FIXED_BLOCKS + (4-cfgs.FIXED_BLOCKS)*[True]

cfgs.FIXED_BLOCKS=0,所以输出[True,True,True,True]

with slim.arg_scope(resnet_arg_scope(is_training=(is_training and not_freezed[0]))):
    C2, end_points_C2 = resnet_v1.resnet_v1(net,
                                            blocks[0:1],
                                            global_pool=False,
                                            include_root_block=False,
                                            scope=scope_name)

类似的就是做卷积，得到C2~C5层特征图

feature_dict = {'C2': end_points_C2['{}/block1/unit_2/bottleneck_v1'.format(scope_name)],
                   'C3': end_points_C3['{}/block2/unit_3/bottleneck_v1'.format(scope_name)],
                   'C4': end_points_C4['{}/block3/unit_{}/bottleneck_v1'.format(scope_name, middle_num_units - 1)],
                   'C5': end_points_C5['{}/block4/unit_3/bottleneck_v1'.format(scope_name)],
                   # 'C5': end_points_C5['{}/block4'.format(scope_name)],
                    }

将其每一层变为一个字典形式

接下在是构建特征图的金字塔结构

pyramid_dict = {} #定义一个空字典
with tf.variable_scope('build_pyramid'):
    with slim.arg_scope([slim.conv2d], weights_regularizer=slim.l2_regularizer(cfgs.WEIGHT_DECAY),
                        activation_fn=None, normalizer_fn=None):

        P5 = slim.conv2d(C5,
                         num_outputs=256,
                         kernel_size=[1, 1],
                         stride=1, scope='build_P5')
        if "P6" in cfgs.LEVLES:
            P6 = slim.max_pool2d(P5, kernel_size=[1, 1], stride=2, scope='build_P6')
            pyramid_dict['P6'] = P6

        pyramid_dict['P5'] = P5

此时构建了顶层P6、P5别用maxpool和conv2d进行构建

for level in range(4, 1, -1):  # build [P4, P3, P2]
#[]里面的是key,=后面是进行内容
         pyramid_dict['P%d' % level] = fusion_two_layer(C_i=feature_dict["C%d" % level],
                                                        P_j=pyramid_dict["P%d" % (level+1)],
                                                        scope='build_P%d' % level)

FPN的横向连接思想，就是上一层特征图进行双线性插值放大一倍与同层的C_x进行像素级融合比例0.5,0.5。此时得到了P4, P3，P2三个特征层

for level in range(4, 1, -1):
    pyramid_dict['P%d' % level] = slim.conv2d(
    			pyramid_dict['P%d' % level],
       			num_outputs=256, kernel_size=[3, 3],
       			padding="SAME",stride=1, scope="fuse_P%d" % level)

每个特征层进行用3*3的卷即可进行卷积，步长是1，都输出256层，可以看做是统一输出吧，并减小重叠可能性。

return [pyramid_dict[level_name] for level_name in cfgs.LEVLES]

最终在resnet.py的resnet_base函数返回的是一个列表[P2,P3,P4,P5,P6]每个Px都是一个特征层

返回到build_whloe_network.py上

P_list = self.build_base_network(input_img_batch)

这句话就是返回一个P_list的列表，列表中每个元素是一个特征层
#############################

2.构建RPN结构

 with tf.variable_scope('build_rpn',
	 regularizer=slim.l2_regularizer(cfgs.WEIGHT_DECAY)):

     fpn_cls_score =[]
     fpn_box_pred = []
     for level_name, p in zip(cfgs.LEVLES, P_list): #对应关系
     	if cfgs.SHARE_HEADS:
     		reuse_flag = None if level_name==cfgs.LEVLES[0] else True
     	#赋 每一层需要的变量
        scope_list=['rpn_conv/3x3',  'rpn_cls_score', 'rpn_bbox_pred'] 
        else:
    		 reuse_flag = None
     		scope_list= ['rpn_conv/3x3_%s' % level_name, 'rpn_cls_score_%s' % level_name, 'rpn_bbox_pred_%s' % level_name]

下面的代码就是RPN的重点首先将特征图输入到3*3的卷积后再进行位置偏差提取和区别前景/背景

#进行3*3的卷积
rpn_conv3x3 = slim.conv2d(
                    p, 512, [3, 3],
                    trainable=self.is_training, weights_initializer=cfgs.INITIALIZER, padding="SAME",
                    activation_fn=tf.nn.relu,
                    scope=scope_list[0],
                    reuse=reuse_flag)
#得到每个RPN的信息得分
rpn_cls_score = slim.conv2d(rpn_conv3x3, self.num_anchors_per_location*2, [1, 1], stride=1,
                                            trainable=self.is_training, weights_initializer=cfgs.INITIALIZER,
                                            activation_fn=None, padding="VALID",
                                            scope=scope_list[1],
                                            reuse=reuse_flag)
#位置偏差                                            
rpn_box_pred = slim.conv2d(rpn_conv3x3, self.num_anchors_per_location*4, [1, 1], stride=1,
                                           trainable=self.is_training, weights_initializer=cfgs.BBOX_INITIALIZER,
                                           activation_fn=None, padding="VALID",
                                           scope=scope_list[2],
                                           reuse=reuse_flag)
#将得分(锚点的前景、背景的score)一行行的写，位置偏差（dx，dy,dw,dh）
rpn_box_pred = tf.reshape(rpn_box_pred, [-1, 4])
rpn_cls_score = tf.reshape(rpn_cls_score, [-1, 2])

#通过for循环，得到了一串大列表fpn_cls_score, fpn_box_pred，每个里面可能就是6个大元素，每个元素的shape是[-1,4]
fpn_cls_score.append(rpn_cls_score) #【[[1,2],][1,2]],[……],[……]】
fpn_box_pred.append(rpn_box_pred)

fpn_cls_score = tf.concat(fpn_cls_score, axis=0, name='fpn_cls_score') #shape[-1,2]
fpn_box_pred = tf.concat(fpn_box_pred, axis=0, name='fpn_box_pred') #shape[-1,4]
fpn_cls_prob = slim.softmax(fpn_cls_score, scope='fpn_cls_prob')

总结：上述是为了进行rpn的粗分类与位置偏差的，最后得到fpn_cls_prob:shape(-1,4) 与 fpn_box_prob: shape(-1,2)
#######################################################

3.生成anchors

all_anchors = []
for i in range(len(cfgs.LEVLES)):
    #p_h是一个矩阵
    level_name, p = cfgs.LEVLES[i], P_list[i]

    p_h, p_w = tf.shape(p)[1], tf.shape(p)[2]
    featuremap_height = tf.cast(p_h, tf.float32)
    featuremap_width = tf.cast(p_w, tf.float32)
    anchors = anchor_utils.make_anchors(base_anchor_size=cfgs.BASE_ANCHOR_SIZE_LIST[i],
                                                anchor_scales=cfgs.ANCHOR_SCALES,
                                                anchor_ratios=cfgs.ANCHOR_RATIOS,
                                                featuremap_height=featuremap_height,
                                                featuremap_width=featuremap_width,
                                                stride=cfgs.ANCHOR_STRIDE_LIST[i],
                                                name="make_anchors_for%s" % level_name)

anchor_utils.make_anchors函数定位在anchor_utils.py文件中

def make_anchors(base_anchor_size, anchor_scales, anchor_ratios,
                 featuremap_height, featuremap_width,
                 stride, name='make_anchors'):
    with tf.variable_scope(name):
        base_anchor = tf.constant([0, 0, base_anchor_size, base_anchor_size], tf.float32)  # [x_center, y_center, w, h]
        #得到ws与hs的各种可能,用列表的形式显示
        ws, hs = enum_ratios(enum_scales(base_anchor, anchor_scales),
                             anchor_ratios)  # per locations ws and hs
        #！！！！！！！！！！！！！！！！！！！！！！！！！！！！
        #这儿表示每个特征点在原图上对应的anchor的中心。
        x_centers = tf.range(featuremap_width, dtype=tf.float32) * stride
        y_centers = tf.range(featuremap_height, dtype=tf.float32) * stride

        if cfgs.USE_CENTER_OFFSET:
            x_centers = x_centers + stride/2.
            y_centers = y_centers + stride/2.

        #这边不是很明白，可能真的数学不大好吧 
        x_centers, y_centers = tf.meshgrid(x_centers, y_centers)
        ws, x_centers = tf.meshgrid(ws, x_centers)
        hs, y_centers = tf.meshgrid(hs, y_centers)
		#合称为一个个坐标点,shape[1,N,2]
        anchor_centers = tf.stack([x_centers, y_centers], 2)
        #转变维度，变为[-1,2]
        anchor_centers = tf.reshape(anchor_centers, [-1, 2])

        box_sizes = tf.stack([ ws,hs], axis=2)
        box_sizes = tf.reshape(box_sizes, [-1, 2])
        print(box_sizes)
		#这边就是生成各种anchor的坐标了
        anchors = tf.concat([anchor_centers - 0.5*box_sizes,
                             anchor_centers + 0.5*box_sizes], axis=1)
        return anchors

回到build_whole_network.py中，上述函数就是在原图像上得到各个特征层的特征点在原图上对应的anchor框的坐标

all_anchors.append(anchors) 
all_anchors = tf.concat(all_anchors, axis=0, name='all_anchors_of_FPN')

跟之前的fpn_cls_prob类似的操作，变为一个个组数据后再转为行数据【维度变换】，此时可以看做是对原图像进行密集采样
#################################################

4.postprocess rpn proposals. such as: decode, clip, NMS

rois, roi_scores = postprocess_rpn_proposals(rpn_bbox_pred=fpn_box_pred,
                                             rpn_cls_prob=fpn_cls_prob,
                                             img_shape=img_shape,
                                             anchors=all_anchors,
                                             is_training=self.is_training)

postprocess_rpn_proposals的输出参数是RPN的预测偏差，预测类别（前/背景），图像的shape,锚点框

定位postprocess_rpn_proposals在proposal_opr.py中
大致思路是这样的：

选取概率较大的12000个anchor
利用回归的位置参数，修正这12000个anchor的位置，得到RoIs
利用非极大值（(Non-maximum suppression, NMS）抑制，选出概率最大的2000个RoIs

#得到anchor映射框与rpn得到的预测框对比得到回归
decode_boxes = encode_and_decode.decode_boxes(encoded_boxes=rpn_bbox_pred,
                                              reference_boxes=anchors,
                                              scale_factors=cfgs.ANCHOR_SCALE_FACTORS)

#将anchor的采样框进行剪枝,
#有的框超过了边界，将其约束住
decode_boxes = boxes_utils.clip_boxes_to_img_boundaries(decode_boxes=decode_boxes,
                                                        img_shape=img_shape)

if pre_nms_topN > 0:
    #比较12000与采样框进行比较，取小的数
    pre_nms_topN = tf.minimum(pre_nms_topN, tf.shape(decode_boxes)[0], name='avoid_unenough_boxes')
    #cls_prob是一个shape= [:,2]，在第二维是一个bool类型的矩阵
    #cls_prob是tensor,类型与cls_prob类型相同，大小是12000
    #top_k_indices,是对应的索引位置
    cls_prob, top_k_indices = tf.nn.top_k(cls_prob, k=pre_nms_topN)
    #通过top_k_indices的索引，用tf.gather对decode_boxes进行筛选然后进行排序，得到排序后的anchor的筛选框
    decode_boxes = tf.gather(decode_boxes, top_k_indices)

   # 4. NMS
   #进行NMS,返回的是形状为[M]的一维整数Tensor,表示从box张量中选择的指数,其中M <= max_output_
    keep = tf.image.non_max_suppression(
        boxes=decode_boxes,
        scores=cls_prob,
        max_output_size=post_nms_topN,
        iou_threshold=nms_thresh)
    #得到最终的box
    final_boxes = tf.gather(decode_boxes, keep)
    final_probs = tf.gather(cls_prob, keep)
    #返回筛选后的box和prob(对anchor与rpn)
    return final_boxes, final_probs

以上就是对proposal_opr.py的注释=-=，意思就是对anchor与rpn当时产生的框进行回归，剪枝，NMS。这边可以看到基本有roi兴趣区域了，相当于初步筛选结束啦！！！！！！！！！！！！！！！

返回到build_whole_network.py中

if self.is_training:
    with tf.variable_scope('sample_anchors_minibatch'):
        #tf.py_func(fun,input of func, output of func)
        #这代码就是选取了256个样本，返回筛选后的rpn的标签fpn_labels和回归框fpn_bbox_targets
        fpn_labels, fpn_bbox_targets = \
            tf.py_func(
                anchor_target_layer,
                [gtboxes_batch, img_shape, all_anchors],
                [tf.float32, tf.float32])
        fpn_bbox_targets = tf.reshape(fpn_bbox_targets, [-1, 4])
        fpn_labels = tf.to_int32(fpn_labels, name="to_int32")
        fpn_labels = tf.reshape(fpn_labels, [-1])
        #画正负样本的img
        self.add_anchor_img_smry(input_img_batch, all_anchors, fpn_labels)

tf.py_func()将是相当于可以自定义一个函数，anchor_targe_layer是函数名，[gtboxes_batch, img_shape, all_anchors是函数的输入变量，tf.float32, tf.float32是函数的输出格式。

定位anchor_target_layer函数anchor_target_layer_without_boxweight.py中。
这边建议看这个链接：https://blog.csdn.net/u014380165/article/details/80379812
强力推荐
这边我做些摘抄上去注释，别喷我=-=，AI大神真的讲的挺详细的

def anchor_target_layer(gt_boxes, img_shape, all_anchors, is_restrict_bg=False):
    total_anchors = all_anchors.shape[0] #总的anchor个数
    img_h, img_w = img_shape[1], img_shape[2] #图像的长宽
    gt_boxes = gt_boxes[:, :-1]  #(x1,y1,x2,y2)
	
	_allowed_border = 0
	#inds_inside表示anchor的4个点坐标都在图像内部的anchor的index
   if cfgs.IS_FILTER_OUTSIDE_BOXES:
      inds_inside = np.where(
          (all_anchors[:, 0] >= -_allowed_border) &
          (all_anchors[:, 1] >= -_allowed_border) &
          (all_anchors[:, 2] < img_w + _allowed_border) &  # width
          (all_anchors[:, 3] < img_h + _allowed_border)  # height
      )[0]
  else:
      inds_inside = range(all_anchors.shape[0]) #做顺序列表

  #过滤掉不完全在图像内部的anchor框
  anchors = all_anchors[inds_inside, :]
  #先将labels置空，全部填充-1
  labels = np.empty((len(inds_inside),), dtype=np.float32)
  labels.fill(-1)

重点来了，这是大神帮了我

#这里得出的是一个表？元素是anchor与GT的IOU
overlaps = bbox_overlaps(
        np.ascontiguousarray(anchors, dtype=np.float),
        np.ascontiguousarray(gt_boxes, dtype=np.float))
#每一行最大IOU的索引，shape(n,1),返回的是对应的gt的标签值
argmax_overlaps = overlaps.argmax(axis=1) 
#max_overlaps是具体的IOU值。
max_overlaps = overlaps[np.arange(len(inds_inside)), argmax_overlaps]

#计算出每一列的最大值的索引，一共有ground truth 目标数目个列(每一个ground truth与哪一个Anchor重叠最大）
gt_argmax_overlaps = overlaps.argmax(axis=0)
#取出与ground truth最大重叠的Anchor
gt_max_overlaps = overlaps[ gt_argmax_overlaps, np.arange(overlaps.shape[1])]
#IOU最大的那些anchor都捞出来。
gt_argmax_overlaps = np.where(overlaps == gt_max_overlaps)[0]

if not cfgs.TRAIN_RPN_CLOOBER_POSITIVES:
	#如果某一行最大的anchor的IOU都小于0.3，那直接定义为背景
    labels[max_overlaps < cfgs.RPN_IOU_NEGATIVE_THRESHOLD] = 0
    #前景标签定义2种：1，object对应的IOU最大的那个，2.某个anchor与object的IOU>0.7的情况
    labels[gt_argmax_overlaps] = 1
    labels[max_overlaps >= cfgs.RPN_IOU_POSITIVE_THRESHOLD] = 1
	#背景定义：某个anchor与每个object中最大的IOU都小于0.3
	labels[max_overlaps < cfgs.RPN_IOU_NEGATIVE_THRESHOLD] = 0
	'''
	0.1  0.2  0.1  0.1
	0.2  0.1  0.5  0.4
	0.7  0.1  0.6  0.6  
	上述的x[1,1]是最大，在正样本时被选为了1，但是同时<0.3,所以有一种可能就是该anchor是负样本
	'''

#欠样本处理
#前景的个数=128
num_fg = int(cfgs.RPN_MINIBATCH_SIZE * cfgs.RPN_POSITIVE_RATE)
#取正样本的索引
fg_inds = np.where(labels == 1)[0]
#如果正样本个数大于>128,就随机将多余的正样本的标签变为-1（不关注）
if len(fg_inds) > num_fg:
        disable_inds = npr.choice(
            fg_inds, size=(len(fg_inds) - num_fg), replace=False)
        labels[disable_inds] = -1

#负样本的个数 = 128 或者  256-正样本个数（正样本个数<128）
#若果负样本个数>规定个数，同样随机将多余的标签改为-1
num_bg = cfgs.RPN_MINIBATCH_SIZE - np.sum(labels == 1)
    if is_restrict_bg:
        num_bg = max(num_bg, num_fg * 1.5)
    bg_inds = np.where(labels == 0)[0]
    if len(bg_inds) > num_bg:
        disable_inds = npr.choice(
            bg_inds, size=(len(bg_inds) - num_bg), replace=False)
        labels[disable_inds] = -1
#此时得到了每个anchor关于样本的标签了 (还只是各class的前景和背景)
	
	#_compute_targets是计算关于anchor与真实的gt框IOU最大的object 之间的缩放因子（t_xcenter, t_ycenter, t_w, t_h）
	bbox_targets = _compute_targets(anchors, gt_boxes[argmax_overlaps, :])
	
	#因为一直在计算中都是针对于所有在图像内的框进行运算，
	#并没有考虑到在图像外的框，但是在最终的计算中，
	#针对的是所有的anchor，因此需要将处理过的与原始的进行融合
	labels = _unmap(labels, total_anchors, inds_inside, fill=-1)
    bbox_targets = _unmap(bbox_targets, total_anchors, inds_inside, fill=0)
	
	rpn_labels = labels.reshape((-1, 1)) #得到所有的标签了 
	bbox_targets = bbox_targets.reshape((-1, 4))
    rpn_bbox_targets = bbox_targets
    #此时 rpn_bbox_targets代表了所有的anchor框，但是是处理好的
	
	return rpn_labels, rpn_bbox_targets #返回rpn_labels的标签，和rpn_targets的偏转位置（t因子）

上述做啥了？简单叙述下：

过滤下anchor框超出变换后的图像的情况，并统计个数
统计gt_boxes的个数，做过滤后的anchor与gt_boxes的overlaps–IOU
计算IOU贴正负和不关注样本标签
欠采样处理
计算IOU最大的anchor与gt_boxes之间的尺尺度因子
将这些特殊经过欠采样得到的标签和尺度因子放回到整个anchor中

回到build_whole_network.py中
刚才的设计都是针对于RPN网络的，并没有设计到真正的类别信息，以下则采用RCNN部分获得其相关的roi，target等信息句
那么fpn_labels, fpn_bbox_targets = rpn_labels, rpn_bbox_targets
然后是一些画图啊计算ACC什么的不管他了，还算是好理解
接下来是这个代码，和上面的with是统一层次的

with tf.control_dependencies([fpn_labels]):
      with tf.variable_scope('sample_RCNN_minibatch'):
          rois, labels, bbox_targets = \
          tf.py_func(proposal_target_layer,
                     [rois, gtboxes_batch],
                     [tf.float32, tf.float32, tf.float32])
          rois = tf.reshape(rois, [-1, 4])
          labels = tf.to_int32(labels)
          labels = tf.reshape(labels, [-1])
          #回归框标记shape(-1,4*(21))存储的是roi对应每个类的坐标信息。
          bbox_targets = tf.reshape(bbox_targets, [-1, 4*(cfgs.CLASS_NUM+1)])
          self.add_roi_batch_img_smry(input_img_batch, rois, labels)

定位proposal_target_layer在proposal_target_layer.py中，注意一下=-=这里的anchor就是rois。哇，想到这里我就哭了，看成了all_anchor了，佰忙活了一个上午查资料

def proposal_target_layer(rpn_rois, gt_boxes):
    """
    Assign object detection proposals to ground-truth targets. Produces proposal
    classification labels and bounding-box regression targets.
    """
    # Proposal ROIs (x1, y1, x2, y2) coming from RPN
    # gt_boxes (x1, y1, x2, y2, label)

    if cfgs.ADD_GTBOXES_TO_TRAIN:
    #gt_boxes[:,:-1]表示不取最后一列
    #每一行水平放置
        all_rois = np.vstack((rpn_rois, gt_boxes[:, :-1]))
    else:
        all_rois = rpn_rois

    #若cfgs.FAST_RCNN_MINIBATCH_SIZE == -1 则rois_per_image = np.inf，
    #否则rois_per_image = cfgs.FAST_RCNN_MINIBATCH_SIZE = 256
    #设置每张图上的roi个数
    rois_per_image = np.inf if cfgs.FAST_RCNN_MINIBATCH_SIZE == -1 else cfgs.FAST_RCNN_MINIBATCH_SIZE
    #fg_rois_per_image=64
    #每张图的roi个数为256*0.25
    fg_rois_per_image = np.round(cfgs.FAST_RCNN_POSITIVE_RATE * rois_per_image)

    #带有分类标签和边界框回归的样本rois_sample_rois选择进行分类训练的框，
    # 并求取他们类别和坐标的ground truth和计算边框损失loss时需要的
    #对roi进行再次筛选，并分具体的标签，不再是二分类了
    #注意bbox_targets shape (-1,num[含背景]*4),num*4中，只有4个数是有值的，其他都是0
    bbox_inside_weights
    labels, rois, bbox_targets = _sample_rois(all_rois, gt_boxes, fg_rois_per_image,
                                              rois_per_image, cfgs.CLASS_NUM+1)

    rois = rois.reshape(-1, 4)
    labels = labels.reshape(-1)
    bbox_targets = bbox_targets.reshape(-1, (cfgs.CLASS_NUM+1) * 4)

    return rois, labels, bbox_target

最后返回rois（进过两次筛选啦）与labels和bbox_targets(坐标框)
回到 build_whloe_network.py中

上面这段我会重读=-=，感觉看的不是很顺利

 if self.is_training:
     rois_list, labels, bbox_targets = self.assign_levels(all_rois=rois,
                                                          labels=labels,
                                                          bbox_targets=bbox_targets)
 else:
     #每个Px返回的rois 不是很清楚啦
     rois_list = self.assign_levels(all_rois=rois)  # rois_list: [P2_rois, P3_rois, P

##########################################
5.构建Fast R-CNN

bbox_pred, cls_score = self.build_fastrcnn(P_list=P_list, rois_list=rois_list,
                                                   img_shape=img_shape)
cls_prob = slim.softmax(cls_score, 'cls_prob')#softmax得到概率
##以下是build_fastrcnn函数的代码
def build_fastrcnn(self, P_list, rois_list, img_shape):
    with tf.variable_scope('Fast-RCNN'):
        # 5. ROI Pooling
        with tf.variable_scope('rois_pooling'):
            pooled_features_list = []
            for level_name, p, rois in zip(cfgs.LEVLES, P_list, rois_list):  # exclude P6_rois
                #对每个roi进行roi pooling
                #该函数调用了tf.image.crop_and_resize函数，其中box_ind=tf.zeros(shape=[N, ],表示做能用到第batch=0这张图上，就是本张的意思，每张roi变成14*14，之后进行3*3的卷积，返回roi_features
                                                                                          dtype=tf.int32
                pooled_features = self.roi_pooling(feature_maps=p, rois=rois, img_shape=img_shape,
                                                   scope=level_name)
				# pooled_features_list把每层都添加进来
                pooled_features_list.append(pooled_features)
			#变为shape(1,H,W,C)
            pooled_features = tf.concat(pooled_features_list, axis=0)

        # 6. inferecne rois in Fast-RCNN to obtain fc_flatten features
        if self.base_network_name.startswith('resnet'):
        	#进行两次全连接
            fc_flatten = resnet.restnet_head(inputs=pooled_features,
                                             is_training=self.is_training,
                                             scope_name=self.base_network_name)
        elif self.base_network_name.startswith('Mobile'):
            fc_flatten = mobilenet_v2.mobilenetv2_head(inputs=pooled_features,
                                                       is_training=self.is_training)
        else:
            raise NotImplementedError('only support resnet and mobilenet')

        # 7. cls and reg in Fast-RCNN
        with slim.arg_scope([slim.fully_connected], weights_regularizer=slim.l2_regularizer(cfgs.WEIGHT_DECAY)):
            #d得到分类得分
            #shape(128,(20+1))
            cls_score = slim.fully_connected(fc_flatten,
                                             num_outputs=cfgs.CLASS_NUM+1,
                                             weights_initializer=cfgs.INITIALIZER,
                                             activation_fn=None, trainable=self.is_training,
                                             scope='cls_fc')
            #回归框位置
            #shape(128,4*(20+1))
            bbox_pred = slim.fully_connected(fc_flatten,
                                             num_outputs=(cfgs.CLASS_NUM+1)*4,
                                             weights_initializer=cfgs.BBOX_INITIALIZER,
                                             activation_fn=None, trainable=self.is_training,
                                             scope='reg_fc')
            # for convient. It also produce (cls_num +1) bboxes

            cls_score = tf.reshape(cls_score, [-1, cfgs.CLASS_NUM+1])
            bbox_pred = tf.reshape(bbox_pred, [-1, 4*(cfgs.CLASS_NUM+1)])
            #返回得分，返回位置
            return bbox_pred, cls_score

接下来是build_whloe_network函数的最后一部分-loss

 loss_dict = self.build_loss(rpn_box_pred=fpn_box_pred,
                                        rpn_bbox_targets=fpn_bbox_targets,
                                        rpn_cls_score=fpn_cls_score,
                                        rpn_labels=fpn_labels,
                                        bbox_pred=bbox_pred,
                                        bbox_targets=bbox_targets,
                                        cls_score=cls_score,
                                        labels=labels)

            final_bbox, final_scores, final_category = self.postprocess_fastrcnn(rois=rois,
                                                                                 bbox_ppred=bbox_pred,
                                                                                 scores=cls_prob,
                                                                                 img_shape=img_shape)
            return final_bbox, final_scores, final_category, loss_dict

这个放在后面讲吧，感觉看了好多

你可能感兴趣的:(深度学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
深度学习：怎么看pth文件的参数奥利给少年深度学习人工智能
.pth文件是PyTorch模型的权重文件，它通常包含了训练好的模型的参数。要查看或使用这个文件，你可以按照以下步骤操作：1.确保你有模型的定义你需要有创建这个.pth文件时所用的模型的代码。这意味着你需要有模型的类定义和架构。2.加载模型权重使用PyTorch的load_state_dict方法来加载权重。这里是如何操作的：importtorchimporttorch.nnasnn#定义模型结构
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
深度学习驱动的车牌识别：技术演进与未来挑战逼子歌深度学习车牌识别神经网络字符识别 YOLO 卷积神经网络
一、引言1.1研究背景在当今社会，智能交通系统的发展日益重要，而车牌识别作为其关键组成部分，发挥着至关重要的作用。车牌识别技术广泛应用于交通管理、停车场管理、安防监控等领域。在交通管理中，它可以用于车辆识别、交通违法监控和车流统计等，提高交通管理的效率和准确性。在停车场管理中，实现车辆的自动识别和收费，提升管理和服务水平。在安防监控领域，可用于追踪嫌疑人及犯罪行为。深度学习的出现为车牌识别带来了重
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程牙牙要健康深度学习 onnx onnxruntime 深度学习 python 人工智能
【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程提示:博主取舍了很多大佬的博文并亲测有效,分享笔记邀大家共同学习讨论文章目录【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程前言模型转换--pytorch转onnxWindows平台搭建依赖环境onnxruntime调用onnx模型ONNXRuntime推理核
基于深度学习的多模态信息检索 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的多模态信息检索（MultimodalInformationRetrieval,MMIR）是指利用深度学习技术，从包含多种模态（如文本、图像、视频、音频等）的数据集中检索出满足用户查询意图的相关信息。这种方法不仅可以处理单一模态的数据，还可以在多种模态之间建立关联，从而更准确地满足用户需求。1.多模态信息检索的挑战异构数据表示：多模态数据通常具有不同的特征和表示形式（如文本的词嵌入与图
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d