cv_lhp

李沐动手学深度学习v2-目标检测中的锚框和代码实现

一.目标检测中的锚框

前提：

本节锚框代码实现，使用了很多Pytorch内置函数，如果有对应函数看不懂的地方，可以查看前面博客对相应函数的具体解释，如下链接所示：

Pytorch中torch.meshgrid（）函数解析
Pytorch中torch.stack() 函数解析
Pytorch中torch.cat()函数解析
Pytorch中tensor.T（torch.T）解析
Pytorch中torch.repeat()函数解析
Pytorch中torch.repeat_interleave（）函数解析
Pytorch中torch.unsqueeze()和torch.squeeze()函数解析
Pytorch中torch.sort()和torch.argsort()函数解析
Pytorch中torch.max()函数解析
Pytorch中[:,None]的用法解析
Pytorch中torch.argmax()函数解析
Pytorch中torch.nonzero()函数解析
Pytorch中torch.full()，torch.ones()和torch.zeros()函数解析
Pytorch中torch.numel()，torch.shape，torch.size()和torch.reshape()函数解析
Pytorch中的广播机制（Broadcast）
Pytorch中的广播机制（Broadcast）

1. 概念

目标检测算法通常会在输入图像中采样大量的区域，然后判断这些区域中是否包含我们感兴趣的目标，并调整区域边界从而更准确地预测目标的真实边界框（ground-truth bounding box）。不同的模型使用的区域采样方法可能不同。这里介绍其中的一种方法：以每个像素为中心，生成多个缩放比和宽高比（aspect ratio）不同的边界框，这些边界框被称为锚框（anchor box）。

2. 生成多个不同形状的锚框

2.1 假设输入图像的高度为 $h$ ，宽度为 $w$ ，以图像的每个像素为中心生成不同形状的锚框：缩放比为 $s\in (0, 1]$ ，宽高比为 $r > 0$ 。那么锚框的宽度和高度分别是 $ws\sqrt{r}$ 和 $hs/\sqrt{r}$ 。注意当锚框中心位置给定时，已知宽和高的锚框是确定的。
2.2 要生成多个不同形状的锚框，需要设置许多缩放比（scale）取值 $s_1,\ldots, s_n$ 和许多宽高比（aspect ratio）取值 $r_1,\ldots, r_m$ 。当使用这些比例和长宽比的所有组合以每个像素为中心时，输入图像将总共有 $w h n m$ 个锚框。尽管这些锚框可能会覆盖所有真实边界框，但计算复杂性很容易过高。在实践中，只考虑包含 $s_1$ 或 $r_1$ 的组合：
( $(s_1, r_1), (s_1, r_2), \ldots, (s_1, r_m), (s_2, r_1), (s_3, r_1), \ldots, (s_n, r_1).$ )
也即是以同一像素为中心的锚框的数量是 $n + m - 1$ 。对于整个输入图像，我们将共生成 $w h (n + m - 1)$ 个锚框。
上述生成锚框的方法在下面的multibox_prior（）函数中实现，指定输入图像、尺寸列表和宽高比列表，然后此函数将返回所有像素的锚框。

import torch
import d2l.torch
torch.set_printoptions(2) # 精简输出精度
"""生成以每个像素为中心具有不同形状的锚框"""
def multibox_prior(data,sizes,ratios):
    #图片的高和宽
    in_height,in_width=data.shape[-2:]
    device,num_sizes,num_ratios = data.device,len(sizes),len(ratios)
    tensor_sizes,tensor_ratios = torch.tensor(sizes,device=device),torch.tensor(ratios,device=device)
    #每个像素点pixel的锚框数
    boxes_per_pixel = (num_sizes+num_ratios-1)
    # 为了将锚点移动到像素的中心，需要设置偏移量。
    # 因为一个像素的的高为1且宽为1，我们选择偏移我们的中心0.5
    offset_w,offset_h = 0.5,0.5
    #把图片高和宽归一化（缩放）到1
    steps_h,steps_w = 1.0/in_height,1.0/in_width # 在y轴上缩放步长,在x轴上缩放步长
    '''生成锚框的所有中心点'''
    #生成0.5/in_height到(in_height+0.5)/in_height之间高度的刻度值,代表y轴
    center_h = (torch.arange(in_height,device=device)+offset_h) * steps_h
    #生成0.5/in_width到（in_width+0.5）/in_width之间宽度的刻度值，代表x轴
    center_w = (torch.arange(in_width,device=device)+offset_w) * steps_w
    #生成网格，shift_y中行相等，列不等，shift_x中行不等，列相等，行的个数为center_h的元素个数，列的个数为center_w的元素个数
    shift_y,shift_x = torch.meshgrid(center_h,center_w,indexing='ij')
    #shift_y,shift_x都reshape成一维，维数为：in_height*in_width
    shift_y = shift_y.reshape(-1)
    shift_x = shift_x.reshape(-1)
    '''每个中心点都将有“boxes_per_pixel”个锚框，所以生成含所有锚框中心的网格，重复了“boxes_per_pixel”次'''
    # 取(shift_x,shift_y,shift_x,shift_y)相应元素组成一行，因此一行有四个元素，然后将这一行直接复制boxes_per_pixel次，表示一个像素点的坐标（4维，因为用于后面计算左上右下的坐标）复制boxes_per_pixel次（因为需要生成boxes_per_pixel）锚框,out_grid.size=(561x728x5,4)
    out_grid = torch.stack((shift_x,shift_y,shift_x,shift_y),dim=1).repeat_interleave(boxes_per_pixel,dim=0)
    '''生成“boxes_per_pixel”个高和宽，之后用于创建锚框的四角坐标(x_min,y_min,x_max,y_max)'''
    #生成锚框的w,有boxes_per_pixel个锚框，因此有boxes_per_pixel个锚框的宽
    anchors_w = torch.cat((tensor_sizes*torch.sqrt(tensor_ratios[0]),tensor_sizes[0]*torch.sqrt(tensor_ratios[1:])))*in_height/in_width
    #生成锚框的h,有boxes_per_pixel个锚框，因此有boxes_per_pixel个锚框的高
    anchors_h = torch.cat((tensor_sizes/torch.sqrt(tensor_ratios[0]),tensor_sizes[0]/torch.sqrt(tensor_ratios[1:])))
    #每一行代表一个像素点的锚框的高和宽，因为一个像素点有boxes_per_pixel个锚框，因此每boxes_per_pixel行代表一个像素的所有锚框。因为所有像素点的锚框个数和高宽都是一样的，因此需要复制in_height*in_width次，所以anchor_manipulations.size=(5x561x728,4)
    anchor_manipulations = torch.stack((-anchors_w,-anchors_h,anchors_w,anchors_h)).T.repeat(in_height*in_width,1)/2 #除以2来获得半高和半宽
    #因此out_grid与anchor_manipulations相加得到一个像素点中一个锚框的左上，右下的坐标，因此每boxes_per_pixel行代表一个像素点的所有锚框的左上，右下坐标值，也相当于生成所有像素点的所有锚框
    output = out_grid+anchor_manipulations
    #output新增一个维度
    return output.unsqueeze(0)

multibox_prior()函数里面一些变量如下图所示，可以用于理解。注意size指的是图像长宽的缩放比例而非图像面积的缩放比例，ratio是指锚框的宽高比，指的是将原图像归一化为正方形后截取的锚框的宽高比，或者说是在原图像的宽高比基础上乘以ratio，才是真正的锚框的宽高比。上面代码中计算anchors_w时为什么需要再乘以(in_height/in_width)，原因参考下面链接：

计算anchors_w乘以(in_height/in_width)原因
计算anchors_w乘以(in_height/in_width)原因

2.3 返回的锚框变量output的形状是（批量大小，锚框的数量，4）。

img = d2l.torch.plt.imread('../images/catdog.jpg')
h,w = img.shape[:2]
data = torch.rand(size=(1,3,h,w))
output = multibox_prior(data,sizes=[0.75,0.5,0.25],ratios=[1,2,0.5])
#返回的锚框变量output的形状是（批量大小，锚框的数量，4）。
print(output.shape)
print(h,w)

输出结果如下：
torch.Size([1, 2042040, 4])
561 728

2.4 将锚框变量Y的形状更改为(图像高度,图像宽度,以同一像素为中心的锚框的数量,4)后，可以获得以指定像素的位置为中心的所有锚框，访问以（250,250,0,:）为中心的第一个锚框，它有四个元素：锚框左上角的 (,) 轴坐标和右下角的 (,) 轴坐标，将两个轴的坐标各分别除以图像的宽度和高度后，所得的值介于0和1之间。

boxes = output.reshape(h,w,5,4)
boxes[250,250,0,:]

输出结果如下：
tensor([0.06, 0.07, 0.63, 0.82])

2.5 show_bboxes()函数用来显示以图像中某个像素为中心的所有锚框

def show_bboxes(axes,bboxs,labels=None,colors=None):
    def _make_list(obj,default_values=None):
        if obj is None:
            obj = default_values
        elif not isinstance(obj,(list,tuple)):
            obj = [obj]
        return obj
    labels = _make_list(labels)
    colors = _make_list(colors,['b','g','r','m','c'])
    for i,bbox in enumerate(bboxs):
        color = colors[i % len(colors)]
        rect = d2l.torch.bbox_to_rect(bbox.detach().numpy(),color)
        axes.add_patch(rect)
        if labels and len(labels)>i:
            test_color = 'k' if color=='w' else 'w'
            axes.text(rect.xy[0],rect.xy[1],labels[i],va='center',ha='center',
                      fontsize=9,color=test_color,bbox=dict(facecolor=color,lw=0))

2.6 变量boxes中轴和轴的坐标值已分别除以图像的宽度和高度，绘制锚框时，需要恢复它们原始的坐标，因此下面定义了变量bbox_scale，下面代码可以绘制出图像中所有以(250,250)为中心的锚框。

d2l.torch.set_figsize()
bbox_scale = torch.tensor((w,h,w,h))
fig = d2l.torch.plt.imshow(img)
show_bboxes(axes=fig.axes,bboxs=boxes[250,250,:,:]*bbox_scale,labels=['s=0.75, r=1', 's=0.5, r=1', 's=0.25, r=1', 's=0.75, r=2',
             's=0.75, r=0.5'])

3.交并比（IoU）

如果已知目标的真实边界框，使用杰卡德系数（Jaccard）衡量锚框和真实边界框之间的相似性。给定集合 $\mathcal{A}$ 和 $\mathcal{B}$ ，他们的杰卡德系数是他们交集的大小除以他们并集的大小：
$J(\mathcal{A},\mathcal{B}) = \frac{\left|\mathcal{A} \cap \mathcal{B}\right|}{\left| \mathcal{A} \cup \mathcal{B}\right|}.$
对于两个边界框，我们通常将它们的杰卡德系数称为交并比（intersection over union，IoU），即两个边界框相交面积与相并面积之比，如下图所示。交并比的取值范围在0和1之间：0表示两个边界框无重合像素，1表示两个边界框完全重合。后面使用交并比来衡量锚框和真实边界框之间、以及不同锚框之间的相似度。

给定两个锚框或边界框的列表，以下boxes_iou函数将在这两个列表中计算它们成对的交并比。

"""计算两个锚框或边界框列表中成对的交并比"""
def boxes_iou(boxes1,boxes2):
    box_area = lambda boxes : (boxes[:,2]-boxes[:,0])*(boxes[:,3]-boxes[:,1])
    '''
    boxes1,boxes2,areas1,areas2的形状:
    boxes1：(boxes1的数量,4),
    boxes2：(boxes2的数量,4),
    areas1：(boxes1的数量,),
    areas2：(boxes2的数量,)
    '''
    areas1 = box_area(boxes1)
    areas2 = box_area(boxes2)
    '''
    inter_upperlefts,inter_lowerrights,inters的形状:
    (boxes1的数量,boxes2的数量,2)
    '''
    #计算相交面积中的左上点的坐标
    inner_upperlefts = torch.max(boxes1[:,None,:2],boxes2[:,:2])
    #计算相交面积中的右下点的坐标
    inner_lowrights = torch.min(boxes1[:,None,2:],boxes2[:,2:])
    #求出相交面积的宽和高,并且宽和高最小值必须大于0，因此加上clamp(min=0)函数表示将两个锚框不相交的宽和高赋值为0
    inners = (inner_lowrights-inner_upperlefts).clamp(min=0)
    '''
    inter_areas和union_areas的形状:(boxes1的数量,boxes2的数量)
    '''
    #求出相交部分的面积，不相交面积为0
    inner_areas = inners[:,:,0]*inners[:,:,1]
    #求出两个锚框面积的并集
    union_areas = areas1[:,None]+areas2-inner_areas
    #求出面积的交并比
    return inner_areas/union_areas

4. 在训练数据中标注锚框

在训练集中，将每个锚框视为一个训练样本。为了训练目标检测模型，需要每个锚框的类别（class）和偏移量（offset）标签，其中前者是与锚框相关的对象的类别，后者是真实边界框相对于锚框的偏移量。
在预测时，为每个图像生成多个锚框，预测所有锚框的类别和偏移量，根据预测的偏移量调整它们的位置以获得预测的边界框，最后只输出符合特定条件的预测边界框。
目标检测训练集是带有“真实边界框”的位置及其包围物体类别的标签。要标记任何生成的锚框，可以参考分配到的最接近此锚框的真实边界框的位置和类别标签。在下面算法中，它能够把最接近的真实边界框分配给锚框。

5.将真实边界框分配给锚框

给定图像，假设锚框是 $A_1, A_2, \ldots, A_{n_a}$ ，真实边界框是 $B_1, B_2, \ldots, B_{n_b}$ ，其中 $n_a \geq n_b$ 。定义一个矩阵 $\mathbf{X} \in \mathbb{R}^{n_a \times n_b}$ ，其中第 $i$ 行、第 $j$ 列的元素 $x_{ij}$ 是锚框 $A_i$ 和真实边界框 $B_j$ 的IoU。该算法包含以下步骤：

在矩阵 $\mathbf{X}$ 中找到最大的元素，并将它的行索引和列索引分别表示为 $i_1$ 和 $j_1$ 。然后将真实边界框 $B_{j_1}$ 分配给锚框 $A_{i_1}$ 。因为 $A_{i_1}$ 和 $B_{j_1}$ 是所有锚框和真实边界框配对中最相近的。在第一个分配完成后，丢弃矩阵中 ${i_1}^\mathrm{th}$ 行和 ${j_1}^\mathrm{th}$ 列中的所有元素。
在矩阵 $\mathbf{X}$ 中找到剩余元素中最大的元素，并将它的行索引和列索引分别表示为 $i_2$ 和 $j_2$ 。将真实边界框 $B_{j_2}$ 分配给锚框 $A_{i_2}$ ，并丢弃矩阵中 ${i_2}^\mathrm{th}$ 行和 ${j_2}^\mathrm{th}$ 列中的所有元素。
此时，矩阵 $\mathbf{X}$ 中两行和两列中的元素已被丢弃。继续上面过程，直到丢弃掉矩阵 $\mathbf{X}$ 中 $n_b$ 列中的所有元素。此时已经为这 $n_b$ 个锚框各自分配了一个真实边界框。
只遍历剩下的 $n_a - n_b$ 个锚框。例如，给定任何锚框 $A_i$ ，在矩阵 $\mathbf{X}$ 的第 $i^\mathrm{th}$ 行中找到与 $A_i$ 的IoU最大的真实边界框 $B_j$ ，只有当此IoU大于预定义的阈值时，才将 $B_j$ 分配给 $A_i$ 。

下面用一个具体的例子来说明上述算法。
如下图（左）所示，第一步：假设矩阵 $\mathbf{X}$ 中的最大值为 $x_{23}$ ，将真实边界框 $B_3$ 分配给锚框 $A_2$ ，然后丢弃矩阵第2行和第3列中的所有元素。第二步：在剩余元素（阴影区域）中找到最大的 $x_{71}$ ，然后将真实边界框 $B_1$ 分配给锚框 $A_7$ 。第三步：如下图（中）所示，丢弃矩阵第7行和第1列中的所有元素，在剩余元素（阴影区域）中找到最大的 $x_{54}$ ，然后将真实边界框 $B_4$ 分配给锚框 $A_5$ 。第四步：如下图（右）所示，丢弃矩阵第5行和第4列中的所有元素，在剩余元素（阴影区域）中找到最大的 $x_{92}$ ，然后将真实边界框 $B_2$ 分配给锚框 $A_9$ 。最后：只需要遍历剩余的锚框 $A_1, A_3, A_4, A_6, A_8$ ，然后根据阈值确定是否为它们分配真实边界框。

此算法在下面的assign_anchors_to_boxes（）函数中实现：

def assign_anchors_to_boxes(anchors,ground_truth,device,iou_threshold=0.5):
    """将最接近的真实边界框分配给锚框"""
    num_anchors,num_gt_boxes = anchors.shape[0],ground_truth.shape[0]
    # 对于每个锚框，分配的真实边界框的张量
    anchors_bboxes_map = torch.full((num_anchors,),fill_value=-1,device=device,dtype=torch.long)
    # 位于第i行和第j列的元素x_ij是锚框i和真实边界框j的IoU
    jaccard = boxes_iou(anchors,ground_truth)
    #计算出每行IOU最大值,然后将这个值对应的真实边界框的索引分配给这个当前的锚框
    max_iou,indexing = torch.max(jaccard,dim=1)
    # 根据阈值，决定是否分配真实边界框
    anchors_i = torch.nonzero(max_iou>=iou_threshold).reshape(-1)
    box_indices = indexing[max_iou>=iou_threshold]
    anchors_bboxes_map[anchors_i] = box_indices
    column_discard = torch.full((num_anchors,),fill_value=-1)
    row_discard = torch.full((num_gt_boxes,),fill_value=-1)
    for _ in range(num_gt_boxes):
        #计算矩阵中IOU最大值的元素所在行和列索引，行代表锚框的索引，列代表真实边界框的索引，然后将真实边界框分配给这个锚框
        maxiou_index = torch.argmax(jaccard)
        maxiou_i = (maxiou_index/num_gt_boxes).long()
        maxiou_j = (maxiou_index%num_gt_boxes).long()
        anchors_bboxes_map[maxiou_i] = maxiou_j
        #将真实边界框分配给锚框后所在的行和列都丢弃，赋值为-1
        jaccard[maxiou_i,:] = row_discard
        jaccard[:,maxiou_j] = column_discard
    return anchors_bboxes_map

6. 标记类别和偏移量

6.1 下面为每个锚框标记类别和偏移量。假设一个锚框 $A$ 被分配了一个真实边界框 $B$ 。一方面，锚框 $A$ 的类别将被标记为与 $B$ 相同；另一方面，锚框 $A$ 的偏移量将根据 $B$ 和 $A$ 中心坐标的相对位置以及这两个框的相对大小进行标记。鉴于数据集内不同的框的位置和大小不同，我们可以对那些相对位置和大小应用变换，使其获得分布更均匀且易于拟合的偏移量。下面介绍一种常见的变换：
给定框 $A$ 和 $B$ ，中心坐标分别为 $x_a, y_a)$ 和 $x_b, y_b)$ ，宽度分别为 $w_a$ 和 $w_b$ ，高度分别为 $h_a$ 和 $h_b$ ，将 $A$ 的偏移量标记为：

$\left( \frac{ \frac{x_b - x_a}{w_a} - \mu_x }{\sigma_x}, \frac{ \frac{y_b - y_a}{h_a} - \mu_y }{\sigma_y}, \frac{ \log \frac{w_b}{w_a} - \mu_w }{\sigma_w}, \frac{ \log \frac{h_b}{h_a} - \mu_h }{\sigma_h}\right),$

其中常量的默认值为 $\mu_x = \mu_y = \mu_w = \mu_h = 0, \sigma_x=\sigma_y=0.1$ ， $\sigma_w=\sigma_h=0.2$ 。
这种转换在下面的 offset_boxes（）函数中实现。

def offset_boxes(anchors,assign_bboxes,eps = 1e-6):
    """对锚框偏移量的转换,计算分配的真实边界框与对应的锚框的偏移量"""
    anchors_center = d2l.torch.box_corner_to_center(anchors)
    assign_bboxes_center = d2l.torch.box_corner_to_center(assign_bboxes)
    offset_xy = 10*(assign_bboxes_center[:,:2]-anchors_center[:,:2])/anchors_center[:,2:]
    offset_wh = 5*torch.log(eps+assign_bboxes_center[:,2:]/anchors_center[:,2:])
    offset = torch.cat((offset_xy,offset_wh),dim=1)
    print('offset.shape = ',offset.shape)
    return offset

6.2 如果一个锚框没有被分配真实边界框，需将该锚框的类别标记为“背景类”。背景类别的锚框通常被称为“负类”锚框，其余的被称为“正类”锚框。下面使用真实边界框（labels参数）实现multibox_target（）函数，来标记锚框的类别和偏移量（anchors参数），此函数将背景类别的索引设置为零，然后将新类别的整数索引递增一。

def multibox_target(anchors,labels):
    batch_size,anchors = labels.shape[0],anchors.squeeze(0)
    num_anchors,device = anchors.shape[0],anchors.device
    batch_mask,batch_offset,batch_class_labels = [],[],[]
    for i in range(batch_size):
        label = labels[i,:,:]
        anchors_bboxes_map = assign_anchors_to_boxes(anchors,label[:,1:],device)
        # 初始化锚框和真实边界框之间偏移量的掩码，因为偏移量每行有四个元素，因此掩码每一行有四个元素，初始化为0或1,0代表这个锚框没有分配给任何一个真实边界框，1代表这个锚框已经分配给了一个真实边界框
        anchors_mask = ((anchors_bboxes_map>=0).float().unsqueeze(-1)).repeat(1,4)
        # 将类标签和分配的边界框坐标初始化为零
        class_label = torch.zeros(num_anchors,device=device,dtype=torch.long)
        assign_bb = torch.zeros(size=(num_anchors,4),device=device,dtype=torch.float32)
        '''
        使用真实边界框来标记锚框的类别。
        如果一个锚框没有被分配，我们标记其为背景（值为零）
        '''
        anchors_idx = torch.nonzero(anchors_bboxes_map>=0).reshape(-1)
        bbox_idx = anchors_bboxes_map[anchors_idx]
        class_label[anchors_idx] = label[bbox_idx,0].long()+1
        assign_bb[anchors_idx] = label[bbox_idx,1:]
        # 计算真实边界框和锚框的偏移量，没有分配真实边界框的锚框的偏移量为0
        anchors_offset = offset_boxes(anchors,assign_bb)*anchors_mask
        batch_mask.append(anchors_mask.reshape(-1))
        batch_offset.append(anchors_offset.reshape(-1))
        batch_class_labels.append(class_label)
    bboxes_mask = torch.stack(batch_mask)
    bboxes_class_label = torch.stack(batch_class_labels)
    bboxes_offset = torch.stack(batch_offset)
    return (bboxes_offset,bboxes_mask,bboxes_class_label)

7. 一个例子来实现对锚框的分类和偏移量标注

7.1 我们已经为加载图像中的狗和猫定义了真实边界框，其中第一个元素是类别（0代表狗，1代表猫），其余四个元素是左上角和右下角的 (,) 轴坐标（范围介于0和1之间），并且构建了五个锚框，用左上角和右下角的坐标进行标记： 0,…,4 （索引从0开始），然后在图像中绘制这些真实边界框和锚框，如下图结果所示。

ground_truth = torch.tensor([[0, 0.1, 0.08, 0.52, 0.92],
                         [1, 0.55, 0.2, 0.9, 0.88]])
anchors = torch.tensor([[0, 0.1, 0.2, 0.3], [0.15, 0.2, 0.4, 0.4],
                    [0.63, 0.05, 0.88, 0.98], [0.66, 0.45, 0.8, 0.8],
                    [0.57, 0.3, 0.92, 0.9]])
bbox_scale = torch.tensor([w,h,w,h])
fig = d2l.torch.plt.imshow(img)
show_bboxes(axes=fig.axes,bboxs=ground_truth[:,1:]*bbox_scale,labels=['dog','cat'],colors='k')
#因为真实Img图片并没有进行高和宽缩放，因此需要将已经缩放的锚框的高和宽重新进行扩展
show_bboxes(axes=fig.axes,bboxs=anchors*bbox_scale,labels=['0','1','2','3','4'])

7.2 使用上面定义的multibox_target函数，可以根据狗和猫的真实边界框，标注这些锚框的分类和偏移量，在上面例子中，背景、狗和猫的类索引分别为0、1和2。

labels = multibox_target(anchors=anchors.unsqueeze(0),labels=ground_truth.unsqueeze(0))

7.3 返回的结果中有三个元素，第三个元素包含标记的输入锚框的类别。下面根据图像中的锚框和真实边界框的位置来分析下面返回的类别标签。首先，在所有的锚框和真实边界框配对中，锚框 4 与猫的真实边界框的IoU是最大的。因此4 的类别被标记为猫，去除包含 4 或猫的真实边界框的配对，在剩下的配对中，锚框 1 和狗的真实边界框有最大的IoU，因此1 的类别被标记为狗。接下来，需要遍历剩下的三个未标记的锚框： 0 、 2 和 3 。对于 0 ，与其拥有最大IoU的真实边界框的类别是狗，但IoU低于预定义的阈值（0.5），因此该类别被标记为背景；对于 2 ，与其拥有最大IoU的真实边界框的类别是猫，IoU超过阈值，所以类别被标记为猫；对于 3 ，与其拥有最大IoU的真实边界框的类别是猫，但值低于阈值，因此该类别被标记为背景。

labels[2]

输出结果如下：
tensor([[0, 1, 2, 0, 2]])

7.4 返回的第二个元素是掩码（mask）变量，形状为（批量大小，锚框数的四倍）。掩码变量中的元素与每个锚框的4个偏移量一一对应。由于我们不关心对背景的检测，负类的偏移量不应影响目标函数，通过矩阵元素乘法，掩码变量中的零将在计算目标函数之前过滤掉负类偏移量。

labels[1]

输出结果如下：
tensor([[0., 0., 0., 0., 1., 1., 1., 1., 1., 1., 1., 1., 0., 0., 0., 0., 1., 1.,
         1., 1.]])

7.5 返回的第一个元素包含了为每个锚框标记的四个偏移值，注意负类锚框的偏移量被标记为零。

labels[0]

输出结果如下：
tensor([[-0.00e+00, -0.00e+00, -0.00e+00, -0.00e+00,  1.40e+00,  1.00e+01,
          2.59e+00,  7.18e+00, -1.20e+00,  2.69e-01,  1.68e+00, -1.57e+00,
         -0.00e+00, -0.00e+00, -0.00e+00, -0.00e+00, -5.71e-01, -1.00e+00,
          4.17e-06,  6.26e-01]])

8. 使用非极大值抑制预测边界框

8.1 在预测时，先为图像生成多个锚框，再为这些锚框一一预测类别和偏移量。一个“预测好的边界框”则根据其中某个带有预测偏移量的锚框而生成，下面实现了offset_inverse函数，该函数将锚框和偏移量预测作为输入，并应用逆偏移变换来返回预测的边界框坐标。
注意：非极大值抑制是一种贪心算法，它通过移除来抑制预测的边界框。

def offset_inverse(anchors,offset_preds):
    """根据带有预测偏移量的锚框来预测边界框，应用逆偏移变换来返回预测的边界框坐标"""
    anchors = d2l.torch.box_corner_to_center(anchors)
    predict_bbox_xy = (offset_preds[:,:2]*anchors[:,2:])/10+anchors[:,:2]
    predict_bbox_wh = torch.exp(offset_preds[:,2:]/5)*anchors[:,2:]
    predict_bbox = torch.cat((predict_bbox_xy,predict_bbox_wh),dim=1)
    predict_bbox_corner = d2l.torch.box_center_to_corner(predict_bbox)
    return predict_bbox_corner

8.2 当有许多锚框时，可能会输出许多相似的具有明显重叠的预测边界框，都围绕着同一目标。为了简化输出，使用非极大值抑制（non-maximum suppression，NMS）合并属于同一目标的类似的预测边界框。下面是非极大值抑制的工作原理：
对于一个预测边界框 $B$ ，目标检测模型会计算每个类别的预测概率。假设最大的预测概率为 $p$ ，则该概率所对应的类别 $B$ 即为预测的类别。具体来说，我们将 $p$ 称为预测边界框 $B$ 的置信度（confidence）。在同一张图像中，所有预测的非背景边界框都按置信度降序排序，以生成列表 $L$ 。然后通过以下步骤操作排序列表 $L$ ：

从 $L$ 中选取置信度最高的预测边界框 $B_1$ 作为基准，然后将所有与 $B_1$ 的IoU超过预定阈值 $\epsilon$ 的非基准预测边界框从 $L$ 中移除。这时， $L$ 保留了置信度最高的预测边界框，去除了与其太过相似的其他预测边界框。简而言之，那些具有非极大值置信度的边界框被抑制了。
从 $L$ 中选取置信度第二高的预测边界框 $B_2$ 作为又一个基准，然后将所有与 $B_2$ 的IoU大于 $\epsilon$ 的非基准预测边界框从 $L$ 中移除。
重复上述过程，直到 $L$ 中的所有预测边界框都曾被用作基准。此时， $L$ 中任意一对预测边界框的IoU都小于阈值 $\epsilon$ ；因此，没有一对边界框过于相似。
输出列表 $L$ 中的所有预测边界框。

下面nms函数按降序对置信度进行排序并返回其索引：

#nms相当于去掉预测真实边界框重复率比较大的一些预测真实边界框
def nms(boxes,scores,iou_threshold):
    """对预测边界框的置信度进行排序"""
    #从大到小排序，得到排序后的元素在排序前的索引值
    B = torch.argsort(scores,dim=-1,descending=True)
    #保存预测真实边界框的索引
    keep = []
    while B.numel()>0:
        i = B[0]
        keep.append(i)
        if B.numel() == 1 :break
        #计算当前预测类别置信度最大的对应的预测真实边界框与剩下所有预测真实边界框进行求IOU,如果超过一定阈值，说明这两个预测真实边界框重合部分比较多，因此去掉这个预测真实边界框，否则保留这个预测真实边界框
        box_iou = boxes_iou(boxes1=boxes[i,:].reshape(-1,4),boxes2=boxes[B[1:],:].reshape(-1,4)).reshape(-1)
        box_iou_idx = torch.nonzero(box_iou<=iou_threshold).reshape(-1)
        B = B[box_iou_idx+1]
    return torch.tensor(keep,device=boxes.device)

8.3 下面multibox_detection（）函数来将非极大值抑制应用于预测边界框。

"""使用非极大值抑制来预测边界框"""
def multibox_detection(cls_probs,offset_preds,anchors,nms_threshold=0.5,pos_threshold=0.009999999):
    device,batch_size = cls_probs.device,cls_probs.shape[0]
    anchors = anchors.squeeze(0)
    num_classes,num_anchors = cls_probs.shape[1],cls_probs.shape[2]
    #存储批量样本中预测的一些信息
    out = []
    for i in range(batch_size):
        cls_prob = cls_probs[i]
        offset_pred = offset_preds[i].reshape(-1,4)
        conf,class_id = torch.max(cls_prob[1:],dim=0)
        #根据anchors和锚框偏移量得到预测真实边界框的值
        predict_bb = offset_inverse(anchors,offset_pred)
        #根据nms去除一些重合比较大的预测真实边界框，保留重合率不大的预测真实边界框
        keep = nms(predict_bb,conf,nms_threshold)
        # 找到所有的non_keep索引，并将类设置为背景-1
        anchors_idx = torch.arange(num_anchors,device=device,dtype=torch.long)
        idx = torch.cat((keep,anchors_idx))
        uniques,counts = idx.unique(return_counts=True)
        non_keep = uniques[counts==1]
        class_id[non_keep] = -1
        anchors_all_id = torch.cat((keep,non_keep))
        # pos_threshold是一个用于非背景预测的阈值，将低于pos_threshold阈值的预测真实边界框的类别设置为背景类-1
        below_min_idx = (conf<pos_threshold)
        class_id[below_min_idx] = -1
        conf[below_min_idx] = 1-conf[below_min_idx]
        #对class_id,conf,predict_bb按照anchors_all_id索引列表重复排列
        class_id = class_id[anchors_all_id]
        conf = conf[anchors_all_id]
        predict_bb = predict_bb[anchors_all_id]
        predict_info = torch.cat((class_id.unsqueeze(1),conf.unsqueeze(1),predict_bb),dim=1)
        out.append(predict_info)
    return torch.stack(out)

8.4 将上述算法应用到一个带有四个锚框的具体示例中，为简单起见假设预测的偏移量都是零，这意味着预测的边界框即是锚框，对于背景、狗和猫其中的每个类，手动给出了它们的预测概率。

anchors = torch.tensor([[0.1, 0.08, 0.52, 0.92], [0.08, 0.2, 0.56, 0.95],
                      [0.15, 0.3, 0.62, 0.91], [0.55, 0.2, 0.9, 0.88]])
offset_preds = torch.tensor([0]*anchors.numel())
cls_probs = torch.tensor([[0] * 4,  # 背景的预测概率
                      [0.9, 0.8, 0.7, 0.1],  # 狗的预测概率
                      [0.1, 0.2, 0.3, 0.9]])  # 猫的预测概率

8.5 在图像上绘制这些预测边界框和置信度，如下图结果所示：

fig = d2l.torch.plt.imshow(img)
show_bboxes(fig.axes,anchors*bbox_scale,labels=['dog=0.9', 'dog=0.8', 'dog=0.7', 'cat=0.9'])

8.6 调用multibox_detection（）函数来使用非极大值抑制，其中阈值设置为0.5，可以看到返回结果的形状是（批量大小，锚框的数量，6）。最内层维度中的六个元素提供了同一预测边界框的输出信息，第一个元素是预测的类索引，从0开始（0代表狗，1代表猫），值-1表示背景或在非极大值抑制中被移除了；第二个元素是预测的边界框的置信度；其余四个元素分别是预测边界框左上角和右下角的 (,) 轴坐标（范围介于0和1之间）。

out = multibox_detection(cls_probs.unsqueeze(0),offset_preds.unsqueeze(0),anchors.unsqueeze(0),nms_threshold=0.5)
print(out)

输出结果如下所示：
tensor([[[ 0.00,  0.90,  0.10,  0.08,  0.52,  0.92],
         [ 1.00,  0.90,  0.55,  0.20,  0.90,  0.88],
         [-1.00,  0.80,  0.08,  0.20,  0.56,  0.95],
         [-1.00,  0.70,  0.15,  0.30,  0.62,  0.91]]])

8.7 删除-1类别（背景）的预测边界框后，可以输出由非极大值抑制保存的最终预测边界框，如下图结果所示。

fig = d2l.torch.plt.imshow(img)
for i in out[0].detach().numpy():
    #当类别是背景类-1时不需要在图片中将预测真实边界框展示出来
    if i[0] == -1:
        continue
    label = ('dog=','cat=')[int(i[0])]+str(i[1])
    show_bboxes(fig.axes,[torch.tensor(i[2:])*bbox_scale],label)

实践中，在执行非极大值抑制前，我们甚至可以将置信度较低的预测边界框移除，从而减少此算法中的计算量，或者也可以对非极大值抑制的输出结果进行后处理，例如只保留置信度较高的结果作为最终输出。

9.小结

以图像的每个像素为中心生成不同形状的锚框。
交并比（IoU）也被称为杰卡德系数，用于衡量两个边界框的相似性。它是相交面积与相并面积的比率。
在训练集中，需要给每个锚框两种类型的标签。一个是与锚框中目标检测的类别，另一个是锚框真实相对于边界框的偏移量。
在预测期间，使用非极大值抑制（NMS）来移除类似的预测边界框，从而简化输出。
本节锚框实现过程：以图像的每个像素为中心生成不同形状的锚框–>使用IOU给每个锚框分配真实边界框（物体类别号和真实边界框的左上右下坐标），然后锚框真实相对于边界框的偏移量–>在预测期间，使用非极大值抑制（NMS）来移除类似重合度高的预测边界框–>输出去重后的最终预测边界框。
虽然锚框生成过程，预测真实边界框的思想很简单，但是却使用了大量tensor矩阵运算，从而导致实现比较复杂，主要原因是锚框（目标检测）是需要在GPU上面运行，矩阵元素在GPU上面运算效率比较高，因此锚框整个过程使用了大量的矩阵tensor运算。

二.全部代码

import torch
import d2l.torch

torch.set_printoptions(2)  # 精简输出精度
"""生成以每个像素为中心具有不同形状的锚框"""


def multibox_prior(data, sizes, ratios):
    #图片的高和宽
    in_height, in_width = data.shape[-2:]
    device, num_sizes, num_ratios = data.device, len(sizes), len(ratios)
    tensor_sizes, tensor_ratios = torch.tensor(sizes, device=device), torch.tensor(ratios, device=device)
    #每个像素点pixel的锚框数
    boxes_per_pixel = (num_sizes + num_ratios - 1)
    # 为了将锚点移动到像素的中心，需要设置偏移量。
    # 因为一个像素的的高为1且宽为1，我们选择偏移我们的中心0.5
    offset_w, offset_h = 0.5, 0.5
    #把图片高和宽归一化（缩放）到1
    steps_h, steps_w = 1.0 / in_height, 1.0 / in_width  # 在y轴上缩放步长,在x轴上缩放步长
    '''生成锚框的所有中心点'''
    #生成0.5/in_height到(in_height+0.5)/in_height之间高度的刻度值,代表y轴
    center_h = (torch.arange(in_height, device=device) + offset_h) * steps_h
    #生成0.5/in_width到（in_width+0.5）/in_width之间宽度的刻度值，代表x轴
    center_w = (torch.arange(in_width, device=device) + offset_w) * steps_w
    #生成网格，shift_y中行相等，列不等，shift_x中行不等，列相等，行的个数为center_h的元素个数，列的个数为center_w的元素个数
    shift_y, shift_x = torch.meshgrid(center_h, center_w, indexing='ij')
    #shift_y,shift_x都reshape成一维，维数为：in_height*in_width
    shift_y = shift_y.reshape(-1)
    shift_x = shift_x.reshape(-1)
    '''每个中心点都将有“boxes_per_pixel”个锚框，所以生成含所有锚框中心的网格，重复了“boxes_per_pixel”次'''
    # 取(shift_x,shift_y,shift_x,shift_y)相应元素组成一行，因此一行有四个元素，然后将这一行直接复制boxes_per_pixel次，表示一个像素点的坐标（4维，因为用于后面计算左上右下的坐标）复制boxes_per_pixel次（因为需要生成boxes_per_pixel）锚框,out_grid.size=(561x728x5,4)
    out_grid = torch.stack((shift_x, shift_y, shift_x, shift_y), dim=1).repeat_interleave(boxes_per_pixel, dim=0)
    '''生成“boxes_per_pixel”个高和宽，之后用于创建锚框的四角坐标(x_min,y_min,x_max,y_max)'''
    #生成锚框的w,有boxes_per_pixel个锚框，因此有boxes_per_pixel个锚框的宽
    anchors_w = torch.cat((tensor_sizes * torch.sqrt(tensor_ratios[0]),
                           tensor_sizes[0] * torch.sqrt(tensor_ratios[1:]))) * in_height / in_width
    #生成锚框的h,有boxes_per_pixel个锚框，因此有boxes_per_pixel个锚框的高
    anchors_h = torch.cat(
        (tensor_sizes / torch.sqrt(tensor_ratios[0]), tensor_sizes[0] / torch.sqrt(tensor_ratios[1:])))
    #每一行代表一个像素点的锚框的高和宽，因为一个像素点有boxes_per_pixel个锚框，因此每boxes_per_pixel行代表一个像素的所有锚框。因为所有像素点的锚框个数和高宽都是一样的，因此需要复制in_height*in_width次，所以anchor_manipulations.size=(5x561x728,4)
    anchor_manipulations = torch.stack((-anchors_w, -anchors_h, anchors_w, anchors_h)).T.repeat(in_height * in_width,
                                                                                                1) / 2  #除以2来获得半高和半宽
    #因此out_grid与anchor_manipulations相加得到一个像素点中一个锚框的左上，右下的坐标，因此每boxes_per_pixel行代表一个像素点的所有锚框的左上，右下坐标值，也相当于生成所有像素点的所有锚框
    output = out_grid + anchor_manipulations
    #output新增一个维度
    return output.unsqueeze(0)


img = d2l.torch.plt.imread('../images/catdog.jpg')
h, w = img.shape[:2]
data = torch.rand(size=(1, 3, h, w))
output = multibox_prior(data, sizes=[0.75, 0.5, 0.25], ratios=[1, 2, 0.5])
print(output.shape)
print(h, w)
boxes = output.reshape(h, w, 5, 4)
boxes[250, 250, 0, :]


def show_bboxes(axes, bboxs, labels=None, colors=None):
    def _make_list(obj, default_values=None):
        if obj is None:
            obj = default_values
        elif not isinstance(obj, (list, tuple)):
            obj = [obj]
        return obj

    labels = _make_list(labels)
    colors = _make_list(colors, ['b', 'g', 'r', 'm', 'c'])
    for i, bbox in enumerate(bboxs):
        color = colors[i % len(colors)]
        rect = d2l.torch.bbox_to_rect(bbox.detach().numpy(), color)
        axes.add_patch(rect)
        if labels and len(labels) > i:
            test_color = 'k' if color == 'w' else 'w'
            axes.text(rect.xy[0], rect.xy[1], labels[i], va='center', ha='center',
                      fontsize=9, color=test_color, bbox=dict(facecolor=color, lw=0))


d2l.torch.set_figsize()
bbox_scale = torch.tensor((w, h, w, h))
fig = d2l.torch.plt.imshow(img)
# show_bboxes(axes=fig.axes, bboxs=boxes[250, 250, :, :] * bbox_scale,
#             labels=['s=0.75, r=1', 's=0.5, r=1', 's=0.25, r=1', 's=0.75, r=2',
#                     's=0.75, r=0.5'])

"""计算两个锚框或边界框列表中成对的交并比"""
def boxes_iou(boxes1, boxes2):
    box_area = lambda boxes: (boxes[:, 2] - boxes[:, 0]) * (boxes[:, 3] - boxes[:, 1])
    '''
    boxes1,boxes2,areas1,areas2的形状:
    boxes1：(boxes1的数量,4),
    boxes2：(boxes2的数量,4),
    areas1：(boxes1的数量,),
    areas2：(boxes2的数量,)
    '''
    areas1 = box_area(boxes1)
    areas2 = box_area(boxes2)
    '''
    inter_upperlefts,inter_lowerrights,inters的形状:
    (boxes1的数量,boxes2的数量,2)
    '''
    #计算相交面积中的左上点的坐标
    inner_upperlefts = torch.max(boxes1[:, None, :2], boxes2[:, :2])
    #计算相交面积中的右下点的坐标
    inner_lowrights = torch.min(boxes1[:, None, 2:], boxes2[:, 2:])
    #求出相交面积的宽和高,并且宽和高最小值必须大于0，因此加上clamp(min=0)函数表示将两个锚框不相交的宽和高赋值为0
    inners = (inner_lowrights - inner_upperlefts).clamp(min=0)
    '''
    inter_areas和union_areas的形状:(boxes1的数量,boxes2的数量)
    '''
    #求出相交部分的面积，不相交面积为0
    inner_areas = inners[:, :, 0] * inners[:, :, 1]
    #求出两个锚框面积的并集
    union_areas = areas1[:, None] + areas2 - inner_areas
    #求出面积的交并比
    return inner_areas / union_areas


def assign_anchors_to_boxes(anchors, ground_truth, device, iou_threshold=0.5):
    """将最接近的真实边界框分配给锚框"""
    num_anchors, num_gt_boxes = anchors.shape[0], ground_truth.shape[0]
    # 对于每个锚框，分配的真实边界框的张量
    anchors_bboxes_map = torch.full((num_anchors,), fill_value=-1, device=device, dtype=torch.long)
    # 位于第i行和第j列的元素x_ij是锚框i和真实边界框j的IoU
    jaccard = boxes_iou(anchors, ground_truth)
    #计算出每行IOU最大值,然后将这个值对应的真实边界框的索引分配给这个当前的锚框
    max_iou, indexing = torch.max(jaccard, dim=1)
    # 根据阈值，决定是否分配真实边界框
    anchors_i = torch.nonzero(max_iou >= iou_threshold).reshape(-1)
    box_indices = indexing[max_iou >= iou_threshold]
    anchors_bboxes_map[anchors_i] = box_indices
    column_discard = torch.full((num_anchors,), fill_value=-1)
    row_discard = torch.full((num_gt_boxes,), fill_value=-1)
    for _ in range(num_gt_boxes):
        #计算矩阵中IOU最大值的元素所在行和列索引，行代表锚框的索引，列代表真实边界框的索引，然后将真实边界框分配给这个锚框
        maxiou_index = torch.argmax(jaccard)
        maxiou_i = (maxiou_index / num_gt_boxes).long()
        maxiou_j = (maxiou_index % num_gt_boxes).long()
        anchors_bboxes_map[maxiou_i] = maxiou_j
        #将真实边界框分配给锚框后所在的行和列都丢弃，赋值为-1
        jaccard[maxiou_i, :] = row_discard
        jaccard[:, maxiou_j] = column_discard
    return anchors_bboxes_map


def offset_boxes(anchors, assign_bboxes, eps=1e-6):
    """对锚框偏移量的转换,计算分配的真实边界框与对应的锚框的偏移量"""
    anchors_center = d2l.torch.box_corner_to_center(anchors)
    assign_bboxes_center = d2l.torch.box_corner_to_center(assign_bboxes)
    offset_xy = 10 * (assign_bboxes_center[:, :2] - anchors_center[:, :2]) / anchors_center[:, 2:]
    offset_wh = 5 * torch.log(eps + assign_bboxes_center[:, 2:] / anchors_center[:, 2:])
    offset = torch.cat((offset_xy, offset_wh), dim=1)
    print('offset.shape = ', offset.shape)
    return offset


def multibox_target(anchors, labels):
    batch_size, anchors = labels.shape[0], anchors.squeeze(0)
    num_anchors, device = anchors.shape[0], anchors.device
    batch_mask, batch_offset, batch_class_labels = [], [], []
    for i in range(batch_size):
        label = labels[i, :, :]
        anchors_bboxes_map = assign_anchors_to_boxes(anchors, label[:, 1:], device)
        # 初始化锚框和真实边界框之间偏移量的掩码，因为偏移量每行有四个元素，因此掩码每一行有四个元素，初始化为0或1,0代表这个锚框没有分配给任何一个真实边界框，1代表这个锚框已经分配给了一个真实边界框
        anchors_mask = ((anchors_bboxes_map >= 0).float().unsqueeze(-1)).repeat(1, 4)
        # 将类标签和分配的边界框坐标初始化为零
        class_label = torch.zeros(num_anchors, device=device, dtype=torch.long)
        assign_bb = torch.zeros(size=(num_anchors, 4), device=device, dtype=torch.float32)
        '''
        使用真实边界框来标记锚框的类别。
        如果一个锚框没有被分配，我们标记其为背景（值为零）
        '''
        anchors_idx = torch.nonzero(anchors_bboxes_map >= 0).reshape(-1)
        bbox_idx = anchors_bboxes_map[anchors_idx]
        class_label[anchors_idx] = label[bbox_idx, 0].long() + 1
        assign_bb[anchors_idx] = label[bbox_idx, 1:]
        # 计算真实边界框和锚框的偏移量，没有分配真实边界框的锚框的偏移量为0
        anchors_offset = offset_boxes(anchors, assign_bb) * anchors_mask
        batch_mask.append(anchors_mask.reshape(-1))
        batch_offset.append(anchors_offset.reshape(-1))
        batch_class_labels.append(class_label)
    bboxes_mask = torch.stack(batch_mask)
    bboxes_class_label = torch.stack(batch_class_labels)
    bboxes_offset = torch.stack(batch_offset)
    return (bboxes_offset, bboxes_mask, bboxes_class_label)


ground_truth = torch.tensor([[0, 0.1, 0.08, 0.52, 0.92],
                             [1, 0.55, 0.2, 0.9, 0.88]])
anchors = torch.tensor([[0, 0.1, 0.2, 0.3], [0.15, 0.2, 0.4, 0.4],
                        [0.63, 0.05, 0.88, 0.98], [0.66, 0.45, 0.8, 0.8],
                        [0.57, 0.3, 0.92, 0.9]])
bbox_scale = torch.tensor([w, h, w, h])
fig = d2l.torch.plt.imshow(img)
show_bboxes(axes=fig.axes, bboxs=ground_truth[:, 1:] * bbox_scale, labels=['dog', 'cat'], colors='k')
#因为真实Img图片并没有进行高和宽缩放，因此需要将已经缩放的锚框的高和宽重新进行扩展
# show_bboxes(axes=fig.axes, bboxs=anchors * bbox_scale, labels=['0', '1', '2', '3', '4'])
# labels = multibox_target(anchors=anchors.unsqueeze(0), labels=ground_truth.unsqueeze(0))
# labels[2]
# labels[1]
# labels[0]


def offset_inverse(anchors, offset_preds):
    """根据带有预测偏移量的锚框来预测边界框，应用逆偏移变换来返回预测的边界框坐标"""
    anchors = d2l.torch.box_corner_to_center(anchors)
    predict_bbox_xy = (offset_preds[:, :2] * anchors[:, 2:]) / 10 + anchors[:, :2]
    predict_bbox_wh = torch.exp(offset_preds[:, 2:] / 5) * anchors[:, 2:]
    predict_bbox = torch.cat((predict_bbox_xy, predict_bbox_wh), dim=1)
    predict_bbox_corner = d2l.torch.box_center_to_corner(predict_bbox)
    return predict_bbox_corner


#nms相当于去掉预测真实边界框重复率比较大的一些预测真实边界框
def nms(boxes, scores, iou_threshold):
    """对预测边界框的置信度进行排序"""
    #从大到小排序，得到排序后的元素在排序前的索引值
    B = torch.argsort(scores, dim=-1, descending=True)
    #保存预测真实边界框的索引
    keep = []
    while B.numel() > 0:
        i = B[0]
        keep.append(i)
        if B.numel() == 1: break
        #计算当前预测类别置信度最大的对应的预测真实边界框与剩下所有预测真实边界框进行求IOU,如果超过一定阈值，说明这两个预测真实边界框重合部分比较多，因此去掉这个预测真实边界框，否则保留这个预测真实边界框
        box_iou = boxes_iou(boxes1=boxes[i, :].reshape(-1, 4), boxes2=boxes[B[1:], :].reshape(-1, 4)).reshape(-1)
        box_iou_idx = torch.nonzero(box_iou <= iou_threshold).reshape(-1)
        B = B[box_iou_idx + 1]
    return torch.tensor(keep, device=boxes.device)


"""使用非极大值抑制来预测边界框"""


def multibox_detection(cls_probs, offset_preds, anchors, nms_threshold=0.5, pos_threshold=0.009999999):
    device, batch_size = cls_probs.device, cls_probs.shape[0]
    anchors = anchors.squeeze(0)
    num_classes, num_anchors = cls_probs.shape[1], cls_probs.shape[2]
    #存储批量样本中预测的一些信息
    out = []
    for i in range(batch_size):
        cls_prob = cls_probs[i]
        offset_pred = offset_preds[i].reshape(-1, 4)
        conf, class_id = torch.max(cls_prob[1:], dim=0)
        #根据anchors和锚框偏移量得到预测真实边界框的值
        predict_bb = offset_inverse(anchors, offset_pred)
        #根据nms去除一些重合比较大的预测真实边界框，保留重合率不大的预测真实边界框
        keep = nms(predict_bb, conf, nms_threshold)
        # 找到所有的non_keep索引，并将类设置为背景-1
        anchors_idx = torch.arange(num_anchors, device=device, dtype=torch.long)
        idx = torch.cat((keep, anchors_idx))
        uniques, counts = idx.unique(return_counts=True)
        non_keep = uniques[counts == 1]
        class_id[non_keep] = -1
        anchors_all_id = torch.cat((keep, non_keep))
        # pos_threshold是一个用于非背景预测的阈值，将低于pos_threshold阈值的预测真实边界框的类别设置为背景类-1
        below_min_idx = (conf < pos_threshold)
        class_id[below_min_idx] = -1
        conf[below_min_idx] = 1 - conf[below_min_idx]
        #对class_id,conf,predict_bb按照anchors_all_id索引列表重复排列
        class_id = class_id[anchors_all_id]
        conf = conf[anchors_all_id]
        predict_bb = predict_bb[anchors_all_id]
        predict_info = torch.cat((class_id.unsqueeze(1), conf.unsqueeze(1), predict_bb), dim=1)
        out.append(predict_info)
    return torch.stack(out)


anchors = torch.tensor([[0.1, 0.08, 0.52, 0.92], [0.08, 0.2, 0.56, 0.95],
                        [0.15, 0.3, 0.62, 0.91], [0.55, 0.2, 0.9, 0.88]])
offset_preds = torch.tensor([0] * anchors.numel())
cls_probs = torch.tensor([[0] * 4,  # 背景的预测概率
                          [0.9, 0.8, 0.7, 0.1],  # 狗的预测概率
                          [0.1, 0.2, 0.3, 0.9]])  # 猫的预测概率
fig = d2l.torch.plt.imshow(img)
#show_bboxes(fig.axes, anchors * bbox_scale, labels=['dog=0.9', 'dog=0.8', 'dog=0.7', 'cat=0.9'])
out = multibox_detection(cls_probs.unsqueeze(0), offset_preds.unsqueeze(0), anchors.unsqueeze(0), nms_threshold=0.5)
out
fig = d2l.torch.plt.imshow(img)
for i in out[0].detach().numpy():
    #当类别是背景类-1时不需要在图片中将预测真实边界框展示出来
    if i[0] == -1:
        continue
    label = ('dog=', 'cat=')[int(i[0])] + str(i[1])
    show_bboxes(fig.axes, [torch.tensor(i[2:]) * bbox_scale], label)

你可能感兴趣的:(Pytorch基础,深度学习,目标检测,pytorch,python,神经网络)

《Java前端开发全栈指南：从Servlet到现代框架实战》
前言在当今Web开发领域，Java依然是后端开发的主力语言，而随着前后端分离架构的普及，Java开发者也需要掌握前端技术栈。本文将全面介绍JavaWeb前端开发的核心技术，包括传统Servlet/JSP体系、现代前端框架集成方案，以及全栈开发的最佳实践。通过本文，您将了解如何构建现代化的JavaWeb应用前端界面。一、JavaWeb前端技术演进1.1传统技术栈Servlet：JavaWeb基础，处
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
javaSE面试题---语法基础、面向对象、常用类、集合、多线程、文件和IO yang_xiao_wu_ java 面试开发语言 javase java基础多线程文件和IO
目录语法基础1.jdkjrejvm区别2.基本数据类型3.引用数据类型4.自动类型转换、强制类型转换5.常见的运算符6.&和&&区别7.++--在前和在后的区别8.+=有什么作用9.switch..case中switch支持哪些数据类型10.break和continue区别11.while和dowhile区别12.如何生成一个取值范围在[min,max]之间的随机数13.数组的长度如何获取？数组下
【unity编辑器开发与拓展EditorGUILayoyt和GUILayoyt】死也不注释 Unity编辑器开发与拓展笔记 unity 编辑器游戏引擎
EditorGUILayout与GUILayout的核心区别及使用场景详解一、对比表特性GUILayoutEditorGUILayout命名空间UnityEngineUnityEditor使用场景运行时UI+编辑器扩展仅限编辑器扩展控件风格基础游戏风格（无编辑器优化）原生Unity编辑器风格布局复杂度基础流式布局高级自动布局（带标签对齐/间距优化）序列化支持❌不支持✅直接支持SerializedP
【证明】对极几何：本质矩阵内在性质 Powerful_QI slam 线性代数矩阵
--这是目录--1.本质矩阵内在性质表述2.预备知识2.1线性代数基础2.1.1奇异值与特征值的关系2.1.2矩阵加减单位阵后特征值的变化2.2引理：一个常用的矩阵变换3.证明1.本质矩阵内在性质表述本质矩阵(EssentialMatrix)EEE是一个3阶方阵，满足E=t∧RE=t^{\land}RE=t∧R其中RRR为旋转矩阵，ttt为平移量，t∧t^{\land}t∧运算定义如下（参考了
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法深度学习人工智能
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？在大语言模型（LLM）中，最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息，这是由LLM的核心架构（以Transformer为基础）决定的，具体可以从以下角度理解：1.核心机制：自注意力（Self-Attention）的作用现代LLM（如GPT系列、Qwen等）均基于Transformer架构，其核心是自注意力机制。在
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
Flutter基础（前端教程⑥-按钮切换） aaiier Flutter flutter 前端状态模式
1.假设你已有的两个表单组件（示例）//手机号注册表单（示例）classPhoneRegisterFormextendsStatelessWidget{@overrideWidgetbuild(BuildContextcontext){returnColumn(children:[TextField(decoration:InputDecoration(labelText:'手机号')),Text
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
苦练Python第8天：while 循环之妙用 python后端前端人工智能
苦练Python第8天：while循环之妙用原文链接：https://dev.to/therahul_gupta/day-9100-while-loops-with-real-world-examples-528f作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众
苦练Python第5天：字符串从入门到格式化 python后端人工智能前端
苦练Python第5天：字符串从入门到格式化原文链接：https://dev.to/therahul_gupta/day-5100-working-with-strings-basics-to-formatting-2kkn作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我
JVM与Spring Boot核心解析 AIHacksCash Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
flutter知识点 ZhDan91 flutter
#时隔4年了#4年前用flutter开发海外项目和医疗项目。绘制界面的语法与html还是较类似的。把这些封印的记忆和技术回顾一下，最开始是开发Android出身的，所以开发起flutter来依旧是用的androidstudio开发工具。整理下用到的知识点：整理来源：flutter面试题——基础篇（1）-CSDN博客1、Dart是单线程的。在单线程中以消息循环来运行的。其中敖汉两个任务队列。一个是微
Java中的Tomcat，开启Web应用腾飞【基础版】
目录一、Tomcat初登场：揭开神秘面纱（一）啥是Tomcat（二）为啥要有Tomcat二、Tomcat的安装与启动：开启第一步（一）下载Tomcat（二）启动Tomcat三、Tomcat的目录结构：探秘内部布局（一）核心目录介绍（二）目录间的协同工作四、部署JavaWeb应用到Tomcat：让应用上线（一）打包Web应用为WAR文件（二）部署WAR文件到Tomcat五、Tomcat的配置优化：让
c++ 编译链接时报错找不到某个函数，如何排查? sun007700 c++chrome 开发语言
在C++开发中，链接时出现“undefinedreferenceto”错误是常见问题，以下是系统化的排查流程和解决方案：1.确认基础问题（30秒检查）#检查函数声明是否存在grep"function_name"include/*.hsrc/*.cpp#检查是否包含实现文件ls-lsrc/#确认包含实现的.cpp文件在编译列表中2.签名匹配检查（最常见问题）//头文件声明-voidprocess_d
C++STL-set s15335 C++STL c++开发语言
一.基础概念set也是一种容器，像vector,string这样，但它是树形容器。在物理结构上是二叉搜索树，逻辑上还是线性结构。set容器内元素不可重复，multiset内容器元素可以重复；这两个容器，插入的元素都是有序排列。二.基础用法1.set对象创建1.默认构造函数sets1;2.初始化列表sets2_1={9,8,7,6,5};//56789sets2_2({9,8,7,7,6,5});/
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
JavaScript之DOM操作与事件处理详解 AA-代码批发V哥 JavaScript javascript
JavaScript之DOM操作与事件处理详解一、DOM基础：理解文档对象模型二、DOM元素的获取与访问2.1基础获取方法2.2集合的区别与注意事项三、DOM元素的创建与修改3.1创建与插入元素3.2修改元素属性与样式3.2.1属性操作3.2.2样式操作3.3元素内容的修改四、DOM元素的删除与替换4.1删除元素4.2替换元素五、事件处理：实现页面交互5.1事件绑定的三种方式5.1.1HTML属性
requests的使用
一·概念requests作为爬虫的基础库，在我们快速爬取和反爬破解中起到很重要的作用，其中的知识点大概有以下几个方面：二·内容一，request：1-requests.get…get请求获取数据2-requests.post…post请求获取数据二，response:1-response.text.响应体str类型2-response.encoding从HTTPheader中获取响应内容的编码方式
V少JS基础班之第五弹 V少在逆向 JS基础班 javascript 开发语言 ecmascript
文章目录一、前言二、本节涉及知识点三、重点内容1-函数的定义2-函数的构成1.函数参数详解1）参数个数不固定2）默认参数3）arguments对象（类数组）4）剩余参数（Rest参数）5）函数参数是按值传递的6）解构参数传递7）参数校验技巧（JavaScript没有类型限制，需要手动校验）2.函数返回值详解3-函数的分类1-函数声明式：2-函数表达式：3-箭头函数：4-构造函数：5-IIFE：6-
python相关内容二湫默 python 开发语言
1.技术面试题（1）详细描述单调栈的工作原理和应用场景答：工作原理：维护一个栈结构，栈中元素保持单调递增或单调递减的顺序。遍历数据时，新元素入栈前，弹出栈顶所有不满足单调关系的元素，再将新元素入栈，确保栈的单调性。应用场景：解决下一个元素更大的问题，如数组中后面一个元素比前面一个入栈的元素大，则需要上一个元素出栈，然后大的那个元素入栈。（2）详细描述单调队列的工作原理和应用场景答：工作原理：维护队
Python爬虫实战：利用最新技术爬取B站直播数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 html 百度
1.B站直播数据爬取概述B站(哔哩哔哩)是中国最大的年轻人文化社区和视频平台之一，其直播业务近年来发展迅速。爬取B站直播数据可以帮助我们分析直播市场趋势、热门主播排行、观众喜好等有价值的信息。常见的B站直播数据类型包括：直播间基本信息(标题、分类、主播信息)实时观看人数与弹幕数据礼物打赏数据直播历史记录分区热门直播数据本文将重点介绍如何获取直播间基本信息和分区热门直播数据。2.环境准备与工具选择2
基于Python的智能公示信息监控爬虫系统开发实战 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言音视频搜索引擎 scrapy
摘要本文详细介绍了如何使用Python构建一个高效的公示信息监控爬虫系统。系统采用最新技术栈，包括异步爬取、智能解析、反反爬策略等，能够自动监控各类政府网站、企业公示平台的更新信息。文章从系统设计到具体实现，提供了完整的代码示例和详细的技术解析，帮助读者掌握大规模公示信息采集的核心技术。关键词：Python爬虫、公示监控、信息采集、异步爬取、智能解析1.引言在数字化时代，各类公示信息（如政府采购、
基于Python的Google Scholar学术论文爬虫实战：最新技术与完整代码解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言学习 scrapy
摘要本文详细介绍如何使用Python构建一个高效的GoogleScholar爬虫系统，包括代理设置、反反爬策略、数据解析与存储等核心技术。文章涵盖最新Python爬虫技术栈（如Playwright、异步IO等），提供完整可运行的代码示例，并讨论学术爬虫的伦理与法律问题。通过本教程，读者将掌握从GoogleScholar批量获取学术论文信息的高级爬虫技术。关键词：Python爬虫、GoogleSch
ZooKeeper架构及应用场景详解走过冬季学习笔记 zookeeper 架构分布式
ZooKeeper是一个开源的分布式协调服务，由Apache软件基金会维护。它旨在为分布式应用提供高性能、高可用、强一致性的基础服务，解决分布式系统中常见的协调难题（如配置管理、命名服务、分布式锁、服务发现、领导者选举等）。核心软件架构ZooKeeper的架构设计围绕其核心目标（协调）而优化，主要包含以下关键组件：集群模式(Ensemble):ZooKeeper通常部署为集群（称为ensemble
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在