TMZT

YOLO V1 算法详解与PyTorch复现

[本文中的代码有部分是描述性代码，如需完整项目请参考github地址-见本文底部，另外，该复现版本还在测试优化中~]

1. YOLO v1概述

Two-stage目标检测算法将目标检测与识别的过程分为候选区域提取与目标识别两个步骤来做，由于在做具体分类识别和位置回归前多了一步候选区域提取，因此Two-stage目标检测算法的识别率和候选框精确度是比较高的，但对性能的消耗是非常巨大的。而YOLO v1作为YOLO系列算法的开山之作，创造性地提出不再预先进行候选区域(Proposal Region)的提取，而是直接将输入图片以网格的方式进行划分，由每个网格负责预测中心点落在它内部的物体。不过也正是因为缺少了Proposal Region的提取，所以相对来说回归精度要低一些。Yolo v1是端到端的，直接做预测，而不是通过候选区域提取，将目标检测问题转换为一个分类问题。

**one-stage vs two-stage**
One-stage	Two-stage
优点	优点
推理速度快、训练快	精度高
背景误检率低	目标定位精度高、检出率高
缺点	缺点
目标定位精度低、检出率低	推理速度慢、训练慢
小物体检测效果差	背景误检率高

2.YOLO v1网络结构

作者实现的YOLO v1版本中，输入图像的尺寸固定为448*448，在经过了24个卷积层和2个全连接层后，最后输出7*7*1024的特征图(feature map)，对应了作者将原图划分为S*S个格子的思想，feature map上的每一个张量都包含了后续预测任务时所需要的高层抽象语意信息。

如图，YOLO v1将一张图片划分为S*S个格子，作者称之为栅格(grid cell)。对于一张大小为448*448的图像，经卷积层提取特征后，输出大小为7*7*1024的特征图(feature map)，feature map上的每一个1*1*1024的张量就对应着原图中的一个grid cell所提取出的特征，不同的通道对应着不同的抽象语意信息。每个grid cell预测两个物体边界框(Bounding Box)以及grid cell预测的物体类别，最后通过一个NSM算法去除冗余的Bounding Box，生成检测结果。

如图, YOLO v1的网络架构为24个卷积层、4个最大池化层、2个全连接层组成，卷积和池化层部分用于特征的提取，全连接层用于预测。全连接层输出7*7*30，7*7代表原图被划分成的7*7的grid cell。

Yolo_v1_model.py：

import torch.nn as nn

class Convention(nn.Module):
    def __init__(self,in_channels,out_channels,conv_size,conv_stride,padding):
        super(Convention,self).__init__()
        self.Conv = nn.Sequential(
            nn.Conv2d(in_channels, out_channels, conv_size, conv_stride, padding),
            nn.BatchNorm2d(out_channels),
            nn.LeakyReLU()
        )

    def forward(self, x):
        return self.Conv(x)

class YOLO_V1(nn.Module):

    def __init__(self,B=2,Classes_Num=20):
        super(YOLO_V1,self).__init__()
        self.B = B
        self.Classes_Num = Classes_Num

        self.Conv_448 = nn.Sequential(
            Convention(3, 64, 7, 2, 3),
            nn.MaxPool2d(2,2),
        )

        self.Conv_112 = nn.Sequential(
            Convention(64, 192, 3, 1, 1),
            nn.MaxPool2d(2, 2),
        )

        self.Conv_56 = nn.Sequential(
            Convention(192, 128, 1, 1, 0),
            Convention(128, 256, 3, 1, 1),
            Convention(256, 256, 1, 1, 0),
            Convention(256, 512, 3, 1, 1),
            nn.MaxPool2d(2, 2),
        )

        self.Conv_28 = nn.Sequential(
            Convention(512, 256, 1, 1, 0),
            Convention(256, 512, 3, 1, 1),
            Convention(512, 256, 1, 1, 0),
            Convention(256, 512, 3, 1, 1),
            Convention(512, 256, 1, 1, 0),
            Convention(256, 512, 3, 1, 1),
            Convention(512, 256, 1, 1, 0),
            Convention(256, 512, 3, 1, 1),
            Convention(512,512,1,1,0),
            Convention(512,1024,3,1,1),
            nn.MaxPool2d(2, 2),
        )

        self.Conv_14 = nn.Sequential(
            Convention(1024,512,1,1,0),
            Convention(512,1024,3,1,1),
            Convention(1024, 512, 1, 1, 0),
            Convention(512, 1024, 3, 1, 1),
            Convention(1024, 1024, 3, 1, 1),
            Convention(1024, 1024, 3, 2, 1),
        )

        self.Conv_7 = nn.Sequential(
            Convention(1024,1024,3,1,1),
            Convention(1024, 1024, 3, 1, 1),
        )

        self.Fc = nn.Sequential(
            nn.Dropout(0.5),
            nn.Linear(7*7*1024,4096),
            nn.ReLU(),
            nn.Dropout(0.5),
            nn.Linear(4096,7 * 7 * (B*5 + Classes_Num)),
            nn.Sigmoid()
        )

    def forward(self, x):
        x = self.Conv_448(x)
        x = self.Conv_112(x)
        x = self.Conv_56(x)
        x = self.Conv_28(x)
        x = self.Conv_14(x)
        x = self.Conv_7(x)
        # batch_size * channel * height * weight -> batch_size * height * weight * channel
        x = x.permute(0,2,3,1).contiguous()
        x = x.view(-1,7*7*1024)
        x = self.Fc(x)
        x = x.view((-1,7,7,(self.B*5 + self.Classes_Num)))
        return x

3.YOLO v1输出结果

如图，由于作者使用了VOC数据集(20个类别)来测试并测试YOLO v1，所以预测输出的张量中，前面两个5维分别表示两个Bounding Box的物体置信度以及两个box各自的中心坐标及宽高，后面的20维对应了20种类别各自的概率。

IOU：（区域交并比）

在目标检测领域，IoU是一个重要指标，通过两个box的交集和并集的面积值比值来衡量两个boxes的接近程度(重叠程度)。

矩形交集计算：https://blog.csdn.net/qq_39304630/article/details/112759739

def iou(self, box1, box2):  # 计算两个box的IoU值
    # box: lx-左上x ly-左上y rx-右下x ry-右下y 图像向右为y 向下为x
    # 1. 获取交集的矩形左上和右下坐标
    interLX = max(box1[0],box2[0])
    interLY = max(box1[1],box2[1])
    interRX = min(box1[2],box2[2])
    interRY = min(box1[3],box2[3])

    # 2. 计算两个矩形各自的面积
    Area1 = (box1[2] - box1[0]) * (box1[3] - box1[1])
    Area2 = (box2[2] - box2[0]) * (box2[3] - box2[1])

    # 3. 不存在交集
    if interRX < interLX or interRY < interLY:
        return 0

    # 4. 计算IOU
    interSection = (interRX - interLX) * (interRY - interLY)
    return interSection / (Area1 + Area2 - interSection)

置信度：作者采用了同时考虑有无物体以及定位准确度的方式

$Confidence = Pr(obj)*IOU_{truth}^{pred}$

表示有物体的中心落在当前的grid cell内部的概率，即当前grid cell负责的区域有物体的概率。 $IOU_{truth}^{pred}$ 表示当前用于预测的Bounding Box与真实要预测的物体的Truth Box的IOU值，这体现了预测的Bounding Box的准确度。

预测输出的表示Bounding Box覆盖的区域含有物体的可能性，而我们在制作Ground Truth时，如果该grid cell中有物体的中心，则该Ground Truth的=1，否则=0。

定位：如果我们直接预测Bounding Box的位置、长宽，这会导致模型的泛化能力有所降低，这是因为：

1. 直接预测图像中心点的位置和尺度，会导致预测值的变化幅度占据了[0,447]，尺度变化太过剧烈，并不利于网络的收敛，训练过程中波动会很大

2. 如果网络训练和测试的图片中物体的尺度差异过大，会导致模型在测试数据上的识别能力完全不够

因此作者使用了相对偏移量的方式，由于每一个grid cell 负责预测目标中心落在其内部的物体，因此物体中心的坐标一定在grid cell内，所以将中心点与grid cell左上角的坐标差与grid cell本身的长宽做除法得到相对的比例值。同样，物体的长宽预测，由于物体一定落在整个图像内部，于是可以与图像的长宽做除法得到相对的比例值，如下图：

预测输出的结果我们使用sigmod函数将输出压缩在(0,1)，在制作Ground Truth时，我们根据上述约定直接计算即可。

Yolo_V1_DataSet.py

from torch.utils.data import Dataset
import os
import cv2
import xml.etree.ElementTree as ET
import torch
import torchvision.transforms as transforms

class YoloV1DataSet(Dataset):

    def __init__(self, imgs_dir="./VOC2007/Train/JPEGImages", annotations_dir="./VOC2007/Train/Annotations", img_size=448, S=7, B=2, ClassesFile="./VOC2007/Train/class.data"): # 图片路径、注解文件路径、图片尺寸、每个grid cell预测的box数量、类别文件
        img_names = os.listdir(imgs_dir)
        img_names.sort()
        self.transfrom = transforms.Compose([
            transforms.ToTensor(), # height * width * channel -> channel * height * width
            transforms.Normalize(mean=(0.5,0.5,0.5),std=(0.5,0.5,0.5))
        ])
        self.img_path = []
        for img_name in img_names:
            self.img_path.append(os.path.join(imgs_dir,img_name))
        annotation_names = os.listdir(annotations_dir)
        annotation_names.sort() #图片和文件排序后可以按照相同索引对应
        self.annotation_path = []
        for annotation_name in annotation_names:
            self.annotation_path.append(os.path.join(annotations_dir,annotation_name))
        self.img_size = img_size
        self.S = S
        self.B = B
        self.grid_cell_size = self.img_size / self.S
        self.ClassNameToInt = {}
        classIndex = 0
        with open(ClassesFile, 'r') as f:
            for line in f:
                line = line.replace('\n','')
                self.ClassNameToInt[line] = classIndex #根据类别名制作索引
                classIndex = classIndex + 1
        print(self.ClassNameToInt)
        self.Classes = classIndex # 一共的类别个数
        self.getGroundTruth()

    # PyTorch 无法将长短不一的list合并为一个Tensor
    def getGroundTruth(self):
        self.ground_truth = [[[list() for i in range(self.S)] for j in range(self.S)] for k in
                             range(len(self.img_path))]  # 根据标注文件生成ground_truth
        ground_truth_index = 0
        for annotation_file in self.annotation_path:
            ground_truth = [[list() for i in range(self.S)] for j in range(self.S)]
            # 解析xml文件--标注文件
            tree = ET.parse(annotation_file)
            annotation_xml = tree.getroot()
            # 计算 目标尺寸 -> 原图尺寸 self.img_size * self.img_size , x的变化比例
            width = (int)(annotation_xml.find("size").find("width").text)
            scaleX = self.img_size / width
            # 计算 目标尺寸 -> 原图尺寸 self.img_size * self.img_size , y的变化比例
            height = (int)(annotation_xml.find("size").find("height").text)
            scaleY = self.img_size / height
            # 因为两次除法的误差可能比较大 这边采用除一次乘一次的方式
            # 一个注解文件可能有多个object标签，一个object标签内部包含一个bnd标签
            objects_xml = annotation_xml.findall("object")
            for object_xml in objects_xml:
                # 获取目标的名字
                class_name = object_xml.find("name").text
                if class_name not in self.ClassNameToInt: # 不属于我们规定的类
                    continue
                bnd_xml = object_xml.find("bndbox")
                # 目标尺度放缩
                xmin = (int)((int)(bnd_xml.find("xmin").text) * scaleX)
                ymin = (int)((int)(bnd_xml.find("ymin").text) * scaleY)
                xmax = (int)((int)(bnd_xml.find("xmax").text) * scaleX)
                ymax = (int)((int)(bnd_xml.find("ymax").text) * scaleY)
                # 目标中心点
                centerX = (xmin + xmax) / 2
                centerY = (ymin + ymax) / 2
                # 当前物体的中心点落于 第indexI行 第indexJ列的 grid cell内
                indexI = (int)(centerY / self.grid_cell_size)
                indexJ = (int)(centerX / self.grid_cell_size)
                # 真实物体的list
                ClassIndex = self.ClassNameToInt[class_name]
                ClassList = [0 for i in range(self.Classes)]
                ClassList[ClassIndex] = 1
                ground_box = list([centerX / self.grid_cell_size - indexJ,centerY / self.grid_cell_size - indexI,(xmax-xmin)/self.img_size,(ymax-ymin)/self.img_size,1,xmin,ymin,xmax,ymax,(xmax-xmin)*(ymax-ymin)])
                #增加上类别
                ground_box.extend(ClassList)
                ground_truth[indexI][indexJ].append(ground_box)

            #同一个grid cell内的多个groudn_truth，选取面积最大的两个
            for i in range(self.S):
                for j in range(self.S):
                    if len(ground_truth[i][j]) == 0:
                        self.ground_truth[ground_truth_index][i][j].append([0 for i in range(10 + self.Classes)])
                    else:
                        ground_truth[i][j].sort(key = lambda box: box[9], reverse=True)
                        self.ground_truth[ground_truth_index][i][j].append(ground_truth[i][j][0])

            ground_truth_index = ground_truth_index + 1
        self.ground_truth = torch.Tensor(self.ground_truth).float()

    def __getitem__(self, item):
        # height * width * channel
        img_data = cv2.imread(self.img_path[item])
        img_data = cv2.resize(img_data, (448, 448), interpolation=cv2.INTER_AREA)
        img_data = self.transfrom(img_data)
        return img_data,self.ground_truth[item]


    def __len__(self):
        return len(self.img_path)

[注]：在YOLO v1中，每一个grid cell虽然预测两个bounding box，但是最终只有一个是有效的，最多检测7*7*1=49个物体，因此在本人的实现中，对于多个物体的重心落于同一个grid cell的情况，采用的方式是选择具有最大面积的物体。

4. YOLO v1 损失函数

损失函数是深度学习网络模型非常重要的“指挥棒”，负责引导整体网络的任务和学习方向，通过对预测样本和真实样本的误差进行反向传播来指导网络进行参数的调整学习。

我们将含有物体的Bounding Box当作正样本，将不含有物体的Bounding Box当作负样本。在实际的实现上，通过Bounding Box与真实的物体边界框(Ground Truth)的IoU值来判定正负样本，将与Ground Truth拥有最大IoU值的box当作正样本，其余的box作为负样本。

整个YOLO v1算法的损失函数就包含分别关于正样本(负责预测物体的Bounding Box)和负样本(负责预测物体的Bounding Box)两部分，正样本置信度为1，负样本置信度为0，正样本的损失包含置信度损失、边框回归损失和类别损失，而负样本损失只有置信度损失。

[注]：这边解释一下，因为我们预先设置好了S*S*B个Bounding Box，但是有可能存在一些Bounding Box是完全没有预测到目标的，那些预测到目标的Bounding Box就是正样本，没有预测到目标的就是负样本。在作者创作YOLO v1的那个年代，用于目标检测的数据还没有特别密集的目标的情况，因此存在较多的负样本。

YOLO v1的损失由5个部分组成，均使用均方差损失：

(1) 第一部分为正样本中心点坐标的损失，引入 $\lambda coord$ 参数调节定位损失的权重。默认设置为5，提高了定位损失的权重，避免在训练初期，由于负样本过多导致正样本的损失在反向传播时的作用微弱进而导致模型不稳定、网络训练发散的问题。

$\lambda coord\sum_{i=0}^{S*S}\sum_{j=0}^{B}1_{ij}^{obj}[(x_{i}-\hat{x}_{i})^{2}+(y_{i}-\hat{y}_{i})^{2}]$

$\lambda coord$ ：超参数，用于调节定位损失在整体损失中的权重

$\sum_{i=0}^{S*S}$ ：S*S个格子里都有Bounding Box

$\sum_{j=0}^{B}$ ：每个格子里有B个Bounding Box

$1_{ij}^{obj}$ ：第i个网格中的第j个Bounding Box负责预测该网格对应的物体时为1，否则为0

$(x_{i}-\hat{x}_{i})+(y_{i}-\hat{y}_{i})$ ：物体中心点与Bounding Box预测的中心点的差距

(2) 第二部分为正样本的宽高损失，YOLO v1通过对宽高进行根号处理，在一定程度上降低了网络对尺度变化的敏感程度，同时也能提高小物体宽高损失在整体目标宽高差距损失上的权重。毕竟，对于大型的Bounding Box来说，小的偏差影响并不大，而对于小型的Bounding Box来说，小型的偏差就显得尤为重要。

$\lambda coord\sum_{i=0}^{S*S}\sum_{j=0}^{B}1_{ij}^{obj}[(\sqrt{w_{i}}-\sqrt{\hat{w}_{i}})^{2}+(\sqrt{h_{i}}-\sqrt{\hat{h}_{i}})^{2}]$

$(\sqrt{w_{i}}-\sqrt{\hat{w}_{i}})+(\sqrt{h_{i}}-\sqrt{\hat{h}_{i}})$ ：物体的长宽与Bounding Box预测的长宽之间的差距，根号处理是因为小尺度的目标对于尺度变化很敏感。例如，目标尺度为10，预测出来为20，差值为100%；目标尺度为100，预测出来为110，插值为10%。

(3) 第三部分分别为正样本的置信度损失。

$\sum_{i=0}^{S*S}\sum_{j=0}^{B}1_{ij}^{obj}(C_{i}-\hat{C}_{i})^{2}$

$(C_{i}-\hat{C}_{i})^{2}$ ：含有物体的Bounding Box的置信度与对应Ground Truth的置信度方差

(4) 第四部分为负样本的置信度损失，引入 $\lambda noobj$ 调节负样本置信度损失的权重，默认值为0.5。

$\lambda noobj\sum_{i=0}^{S*S}\sum_{j=0}^{B}1_{ij}^{obj}(C_{i}-\hat{C}_{i})^{2}$

$\lambda noobj$ ：由于负样本常常比较多，为了保证网络更多的还是学习如果正确定位正样本，因此需要将负样本的损失权重降低

$(C_{i}-\hat{C}_{i})^{2}$ ：不含有物体的Bounding Box的置信度与对应Ground Truth的置信度方差

(5) 第五部分是正样本的类别损失。

$\sum_{i=0}^{S*S}1_{i}^{obj}\sum_{c\ \epsilon\ classes}(p_{i}(c)-\hat{p}_{i}(c))^{2}$

$1_{i}^{obj}$ ：是否有物体的中心落在该grid cell中

$\sum_{c\ \epsilon\ classes}(p_{i}(c)-\hat{p}_{i}(c))^{2}$ ：对于每一个类别，都计算平方误差

Yolo_v1_lossFunction.py

import torch.nn as nn
import math
import torch

class Yolov1_Loss(nn.Module):

    def __init__(self, S=7, B=2, Classes=20, l_coord=5, l_noobj=0.5):
        # 有物体的box损失权重设为l_coord,没有物体的box损失权重设置为l_noobj
        super(Yolov1_Loss, self).__init__()
        self.S = S
        self.B = B
        self.Classes = Classes
        self.l_coord = l_coord
        self.l_noobj = l_noobj

    def iou(self, bounding_box, ground_box, gridX, gridY, img_size=448, grid_size=64):  # 计算两个box的IoU值
        # predict_box: [centerX, centerY, width, height]
        # ground_box : [centerX / self.grid_cell_size - indexJ,centerY / self.grid_cell_size - indexI,(xmax-xmin)/self.img_size,(ymax-ymin)/self.img_size,1,xmin,ymin,xmax,ymax,(xmax-xmin)*(ymax-ymin)
        # 1.  预处理 predict_box  变为  左上X,Y  右下X,Y  两个边界点的坐标 避免浮点误差 先还原成整数
        # 不要共用引用
        predict_box = list([0,0,0,0])
        predict_box[0] = (int)(gridX + bounding_box[0] * grid_size)
        predict_box[1] = (int)(gridY + bounding_box[1] * grid_size)
        predict_box[2] = (int)(bounding_box[2] * img_size)
        predict_box[3] = (int)(bounding_box[3] * img_size)

        # [xmin,ymin,xmax,ymax]
        predict_coord = list([max(0, predict_box[0] - predict_box[2] / 2), max(0, predict_box[1] - predict_box[3] / 2),min(img_size - 1, predict_box[0] + predict_box[2] / 2), min(img_size - 1, predict_box[1] + predict_box[3] / 2)])
        predict_Area = (predict_coord[2] - predict_coord[0]) * (predict_coord[3] - predict_coord[1])

        ground_coord = list([ground_box[5],ground_box[6],ground_box[7],ground_box[8]])
        ground_Area = (ground_coord[2] - ground_coord[0]) * (ground_coord[3] - ground_coord[1])

        # 存储格式 xmin ymin xmax ymax

        # 2.计算交集的面积 左边的大者 右边的小者 上边的大者 下边的小者
        CrossLX = max(predict_coord[0], ground_coord[0])
        CrossRX = min(predict_coord[2], ground_coord[2])
        CrossUY = max(predict_coord[1], ground_coord[1])
        CrossDY = min(predict_coord[3], ground_coord[3])

        if CrossRX < CrossLX or CrossDY < CrossUY: # 没有交集
            return 0

        interSection = (CrossRX - CrossLX + 1) * (CrossDY - CrossUY + 1)
        return interSection / (predict_Area + ground_Area - interSection)

    def forward(self, bounding_boxes, ground_truth, batch_size=32,grid_size=64, img_size=448):  # 输入是 S * S * ( 2 * B + Classes)
        # 定义三个计算损失的变量 正样本定位损失 样本置信度损失 样本类别损失
        loss = 0
        loss_coord = 0
        loss_confidence = 0
        loss_classes = 0
        iou_sum = 0
        object_num = 0
        mseLoss = nn.MSELoss()
        for batch in range(len(bounding_boxes)):
            for i in range(self.S):  # 先行 - Y
                for j in range(self.S):  # 后列 - X
                    # 取bounding box中置信度更大的框
                    if bounding_boxes[batch][i][j][4] < bounding_boxes[batch][i][j][9]:
                        predict_box = bounding_boxes[batch][i][j][5:]
                        # 另一个框是负样本
                        loss = loss + self.l_noobj * torch.pow(bounding_boxes[batch][i][j][4], 2)
                        loss_confidence += self.l_noobj * math.pow(bounding_boxes[batch][i][j][4].item(), 2)
                    else:
                        predict_box = bounding_boxes[batch][i][j][0:5]
                        predict_box = torch.cat((predict_box, bounding_boxes[batch][i][j][10:]), dim=0)
                        # 另一个框是负样本
                        loss = loss + self.l_noobj * torch.pow(bounding_boxes[batch][i][j][9], 2)
                        loss_confidence += self.l_noobj * math.pow(bounding_boxes[batch][i][j][9].item(), 2)
                    # 为拥有最大置信度的bounding_box找到最大iou的groundtruth_box
                    if ground_truth[batch][i][j][0][9] == 0:  # 面积为0的grount_truth 为了形状相同强行拼接的无用的0-box negative-sample
                        loss = loss + self.l_noobj * torch.pow(predict_box[4], 2)
                        loss_confidence += self.l_noobj * math.pow(predict_box[4].item(), 2)
                    else:
                        object_num = object_num + 1
                        iou = self.iou(predict_box, ground_truth[batch][i][j][0], j * 64, i * 64)
                        iou_sum = iou_sum + iou
                        ground_box = ground_truth[batch][i][j][0]
                        loss = loss + self.l_coord * (torch.pow((ground_box[0] - predict_box[0]), 2) + torch.pow((ground_box[1] - predict_box[1]), 2) + torch.pow(torch.sqrt(ground_box[2] + 1e-8) - torch.sqrt(predict_box[2] + 1e-8), 2) + torch.pow(torch.sqrt(ground_box[3] + 1e-8) - torch.sqrt(predict_box[3] + 1e-8), 2))
                        loss_coord += self.l_coord * (math.pow((ground_box[0] - predict_box[0]), 2) + math.pow((ground_box[1] - predict_box[1]), 2) + math.pow(math.sqrt(ground_box[2] + 1e-8) - math.sqrt(predict_box[2] + 1e-8), 2) + math.pow(math.sqrt(ground_box[3] + 1e-8) - math.sqrt(predict_box[3] + 1e-8), 2))
                        loss = loss + torch.pow(ground_box[4] - predict_box[4], 2)
                        loss_confidence += math.pow(ground_box[4] - predict_box[4], 2)
                        ground_class = ground_box[10:]
                        predict_class = bounding_boxes[batch][i][j][self.B * 5:]
                        loss = loss + mseLoss(ground_class,predict_class) * self.Classes
                        loss_classes += mseLoss(ground_class,predict_class).item() * self.Classes
        print("坐标误差:{} 置信度误差:{} 类别损失:{} iou_sum:{} object_num:{} iou:{}".format(loss_coord, loss_confidence, loss_classes, iou_sum, object_num, "nan" if object_num == 0 else (iou_sum / object_num)))
        return loss, loss_coord, loss_confidence, loss_classes, iou_sum, object_num

[注]：的确可能存在一个grid cell中含有多个物体的中心点的情况，本人的处理策略为选取具有最大面积的那个ground_truth，降低网络训练的难度，因为YOLO v1天生就存在着小物体识别能力不足的缺陷。

5. YOLO v1预测结果处理--NMS算法

通常来说，目标检测算法的最终输出结果是很多的Bounding Box用于预测目标，常用做法是将所有的Box通过非极大值抑制(NMS)算法去除冗余，保留效果最好的。

算法 NMS算法

输入：Bounding Box的集合p、IoU阈值、置信度阈值。

输出：去除冗余的Bounding box集合q。

1.去除集合p中置信度低于置信度阈值的Bounding Box。

2.在集合p中选取拥有最大置信度的Box，移出集合p并加入集合q，并将p中剩余的Bounding Box与该box计算IOU值，去除那些与该Box的IOU值超过阈值的Bounding Box。

3.重复步骤2，直到集合p为空

4.输出集合q，为所求的结果集合。

NMS.py

import numpy as np

# 这边要求的bounding_boxes为处理后的实际的样子
def NMS(bounding_boxes,confidence_threshold,iou_threshold):
    # boxRow : x y dx dy c
    # 1. 初步筛选,先把grid cell预测的两个bounding box取出置信度较高的那个
    boxes = []
    for boxRow in bounding_boxes:
        # grid cell预测出的两个box,含有物体的置信度没有达到阈值
        if boxRow[4] < confidence_threshold or boxRow[9] < confidence_threshold:
            continue
        # 获取物体的预测概率
        classes = boxRow[10:-1]
        class_probality_index = np.argmax(classes,axis=1)
        class_probality = classes[class_probality_index]
        # 选择拥有更大置信度的box
        if boxRow[4] > boxRow[9]:
            box = boxRow[0:4]
        else:
            box = boxRow[5:9]
        # box : x y dx dy class_probality_index class_probality
        box.append(class_probality_index)
        box.append(class_probality)
        boxes.append(box)

    # 2. 循环直到待筛选的box集合为空
    predicted_boxes = []
    while len(boxes) != 0:
        # 对box集合按照置信度从大到小排序
        boxes = sorted(boxes, key=(lambda x : [x[4]]), reverse=True)
        # 确定含有最大值信度的box会被选中
        choiced_box = boxes[0]
        predicted_boxes.append(choiced_box)
        for index in len(boxes):
            # 如果冲突的box的iou值已经大于阈值 需要丢弃
            if iou(boxes[index],choiced_box) > iou_threshold:
                boxes.pop(index)

    return predicted_boxes

6. YOLO v1分析

1.YOLO v1网络优势

①在3*3的卷积后接上一个通道数低的1*1的卷积，用于进行特征的通道压缩，降低计算量；同时多一层的卷积也提升了模型的非线性表达能力。

②在训练中使用Dropout和数据增强的方式来防止网络过拟合。

③并没有引入Anchor机制，而是直接在每个区域进行框的大小与位置信息的预测，利用区域本身携带的位置信息和被检测物体尺度处于网络可以回归范围之内的特性将目标检测问题转化为一个回归问题。

④YOLO v1将物体类别与物体置信度分开预测，简化了问题，实验证明YOLO v1背景误检率要低于Fast R-CNN，YOLO v1的误差主要来源是定位误差，如图4-7所示：

2.YOLO v1缺陷分析

①每一个区域只预测两个框，并且共用同一个类别向量，这导致YOLO v1只能检测有限个物体，并且对于小物体和距离相近的物体的检测效果并不好，而实际的情况下，预测的7*7*2=98个bounding box中，最多只有49个是有效的，也就是说YOLO v1对于一张图片最多预测49个物体。

②由于没有引入Anchor机制，而是直接从数据中学习并进行预测，故很难泛化到新的、不常见的宽高比例的目标的检测中，所以模型对于新的或者并不常见宽高比例的物体检测效果并不好。另外，由于下采样率比较大，对于边框的回归精度也不高。

③在v1的损失函数设计中，大物体和小物体的定位损失权重一样，这将会导致同等比例的定位误差，大物体的损失会比小物体大，小物体的损失在总损失中占比较小，然而实际上，小边界框的小误差对IoU的影响比大边界框要大得多，会导致定位的不准确，但是作者也是知道的，只不过为了保持YOLO v1简单的特性，作者的处理方式是使用对尺度开方，依此提高小物体尺度损失的相对权重。

3.YOLO v1与其他网络的性能对比：

相较于DPM等传统方法而言，YOLO有更高的精度；相较于以Fast R-CNN为代表的一系列的Two-stage算法，YOLO的精度稍有逊色，但是FPS达到了完全碾压的地步，兼顾了实时性和精度，使得工业上用深度学习做目标检测成为可能。

7.个人训练优化策略

1.全卷积结构

为了避免卷积的输出reshape为普通张量导致的特征图错乱的问题，因此本人还提出一种全卷积结构用来实验对YOLO V1的推理能力进行优化，结合1*1的卷积进行特征压缩，而不是直接降采样，依此来提高有效的特征保留。

2.多步长调整学习率

在深度学习中，学习率在初期往往很大，一是可以用来加快训练，二是可以冲出鞍点和一些局部最优点；而在后期，网络稳定收敛到某个最小值时（实际上可能还是局部最小，因为深度学习不是一个凸优化问题，因此我们不太可能正好找到那个最优解，但是我们可以通过学习算法获得一个较为优秀的解），为了避免网络发散，同时防止网络在最小值附近不断震荡，而应该调小学习率，让网络顺着那个最小值的方向进行下降。

3.Tensorboard监控训练

为了更好地监控网络的训练情况，本人在项目中引入了Tensorboard功能。

4.后期准备

本人打算先复现一个功能上还算完善的网络，后期还会加入数据集扩充等功能，并继续优化网络的计算速度以及显存占用~~

5.当前网络情况

全卷积网络收敛情况

YOLO V1原网络收敛情况

项目复现github地址：https://github.com/ProgrammerZhujinming/YOLO_V1_GPU

你可能感兴趣的:(深度学习网络复现)

二供设备运维不再困难，云边一体物联网系统助力水务行业数字化转型
随着城市边际越来越模糊，城市规模变得越来越大，承载着越来越多人口的生活与工作活动，对于用水、用电、网络、交通等基础民生工程的要求越来越高。二次供水泵站是对高层小区及大型建筑提供用水加压的重要场所。随着二次供水泵站站点越来越多，越来越分散，监控管理设备也愈发困难，对于大量设备的运维工作也十分艰巨，往往只有在出了问题后才能安排人员抢修，严重影响居民用水体验甚至存在安全隐患。针对以上现状，物通博联提供由
如何调整优化器的参数来优化神经网络性能？ Idividuals 深度学习神经网络机器学习 python scikit-learn
不同优化器有不同的可调整参数，下面以常见的优化器为例，讲解如何调整其参数来优化神经网络性能：Adam优化器Adam优化器有几个关键参数：learning_rate（学习率）、beta_1、beta_2和epsilon。1.学习率(learning_rate)-作用：控制每次参数更新的步长。学习率过大，模型可能无法收敛，在最优解附近振荡甚至发散；学习率过小，训练速度会非常缓慢。-调整方法：通常初始值
Prometheus 监控系统简介 wespten Linux 自动化运维智能运维性能监控系统调优 TS prometheus
一、监控原理简介监控系统在这里特指对数据中心的监控，主要针对数据中心内的硬件和软件进行监控和告警。从监控对象的角度来看，可以将监控分为网络监控、存储监控、服务器监控和应用监控等。从程序设计的角度来看，可以将监控分为基础资源监控、中间件监控、应用程序监控和日志监控。1、基础资源监控从监控对象的角度来看，可以将基础资源监控分为网络监控、存储监控和服务器监控。1）网络监控这里讲解的网络监控主要包括：对数
RocketMQ 高可用集群架构与一致性机制解析乘风破浪~~ rocketmq 架构
分布式场景中一致性问题：1.服务器不稳定：随时泵机的可能2.网络问题：导致请求丢失3.网速问题：难以保证请求顺序性，最终结果数据一致性需要操作顺序性保证4.快速响应：不能因为一致性，导致响应以集群中最慢的为准。常见的算法弱一致性算法：DNS系统，Gossip协议（RedisCluster）强一致性算法：Basic-Paxos、Multi-Paxos包括Raft系列(Nacos的JRaft，Kafk
解决【WVP服务+ZLMediaKit媒体服务】加入海康摄像头后，能发现设备，播放/点播失败，提示推流超时！ l1o3v1e4ding 后端开发热点代码视频编解码音视频实时音视频 java linux
环境介绍每人搭建的环境不一样，情况不一样，但是原因都是下面几种：wvp配置不当网络端口未放开网络不通我搭建的环境：WVP服务：windows下，用idea运行的源码ZLM服务：虚拟机里问题描述1.国标设备里能发现海康的摄像头，心跳正常2.WVP服务与ZLM服务心跳正常3.播放失败，推流超时解决问题，我是第三种情况（详见下面的点播流程图的第5步）原因是ZLM服务在虚拟机里，虚拟机默认是NAT网络连接
解决引入TransXNet模块后显存爆炸问题的全面指南 pk_xz123456 算法大数据 python 机器人数据挖掘深度学习
解决引入TransXNet模块后显存爆炸问题的全面指南前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.问题背景与现状分析1.1MF-PSN和TransXNet项目概述MF-PSN（Multi-FeaturePyramidStereoNetwork）是一个基于金字塔特征的多特征立体匹配网络，它通过构建多层次的特征金字塔来处理不同尺度的立体匹配问题
F5推出后量子密码学解决方案，助力企业应对新一代安全威胁 CSDN资讯密码学安全量子计算
近日，全球领先的应用交付和API安全解决方案提供商F5(NASDAQ:FFIV)宣布推出全新综合性后量子密码学（PQC）就绪解决方案，助力客户应对量子计算带来的网络安全范式变革。该解决方案现已无缝集成至F5应用交付与安全平台（F5ApplicationDeliveryandSecurityPlatform），为企业提供保障应用和API安全所需工具的同时，保持卓越的性能与可扩展性。随着量子时代的到来
美国VPS服务器Linux内核参数调优的实践与验证 cpsvps 服务器 linux 运维
美国vps服务器Linux内核参数调优的实践与验证在云计算和虚拟化技术日益普及的今天，美国VPS服务器因其稳定的网络环境和优越的性价比，成为众多企业和开发者的首选。Linux内核参数的默认配置往往无法充分发挥VPS的性能潜力。本文将深入探讨美国VPS服务器上Linux内核参数的调优实践，通过系统化的测试验证方法，帮助用户实现服务器性能的显著提升。美国VPS服务器Linux内核参数调优的实践与验证一
网上最火的配音台词可爱，网上最火的配音台词超燃配音就业圈
一、网上最火的配音台词可爱，网上最火的配音台词超燃在网络上，有很多可爱和燃点的配音台词广受欢迎。兼职副业推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种远程工作与在线兼职，职位包括：写手、程序开发、剪辑、设计、翻译、配音、无门槛、插画、翻译、等等。。。每日更新兼职。这些配音台词常常以幽默、俏皮的方式表达出人们的情感和观点，引起了广大网友的共鸣。这些台
放下执念，过轻松自如的人生甘宁
图片来源网络马尔克斯在《百年孤独》中写到:“我们趋行在人生这个亘古的旅途，在坎坷中奔跑，在挫折里涅槃，忧愁缠满全身，痛苦飘洒一地。我们累，却无从止歇；我们苦，却无法回避。”是啊！人生实苦，唯有自渡。生活在茫茫尘世中，有时，我们感到有一种无形的力量折磨着我们，仿佛千斤重担压身，甚至有点喘不过气来，好像身上背了无数个无法扔掉的包袱。细想一下，是谁让我们如此煎熬呢？答案是:我们自己的心。要想过得轻松自如
网络安全三剑客：入侵检测、威胁情报和深度检测，到底有啥区别？漠月瑾网络安全学习点滴入侵检测威胁情报深度检测网络安全
网络安全三剑客：入侵检测、威胁情报和深度检测，到底有啥区别？在网络安全领域，我们经常听到入侵检测（IDS）、威胁情报、深度检测这些术语，它们听起来很相似，但实际工作方式却大不相同。它们都是用来发现和阻止网络攻击的，但各自有不同的“特长”。今天，我们就用最通俗的语言，聊聊这三者的区别，以及它们是如何协同工作的。1.入侵检测（IDS）——按“规则”抓坏人**入侵检测系统（IDS）**就像是一个“规则警
GPT-4o mini TTS：领先的文本转语音技术桂花饼 AIGC GPT-4o o4-mini 语音识别人工智能 GPT-4o
什么是GPT-4ominiTTS？GPT-4ominiTTS是OpenAI推出的全新一代文本转语音（TTS）技术，能够以自然、流畅的方式将普通文本转换为语音。依托先进的神经网络架构，GPT-4ominiTTS在语音合成中避免了传统TTS的生硬与机械感，能够生成富有情感和个性化表达的高质量语音。该技术支持多语言与多口音，是视频、播客、电子学习等场景的理想选择。核心特点自然流畅，接近真人GPT-4om
带你走进属于消防员的一片天地十二点点一
今天我们就来说说人民武装警察——消防员。图片来源于网络消防员（fireman）是指由政府或民间团体所成立的救灾救人团体，通常是一个国家所成立的专门司职于灭火及救援等事项的部门，是站在救灾救人第一线的职业。其主要职责为消灭火灾及救援服务，同时也参与其他救援服务。消防员是维护祖国内部稳定的中坚力量。有政府的时候就有消防员的存在，因为消防是事关国计民生的一件大事，消防的机构和编制一直在变化，终于在198
《网络安全法》在工控领域的实操指南：从责任到应对的全场景解析黑客思维者法规解读工业控制系统网络安全法网络空间安全系统安全
目录摘要一、工控系统中《网络安全法》的责任划分：谁来担责？1.法律框架下的责任划分原则2.典型场景的责任判定示例3.关键信息基础设施（CII）的特殊责任二、内部人员操作风险防控：《网络安全法》的人员管理要求1.制度性约束：责任到人与流程标准化2.技术化管控：权限最小化与操作可追溯3.常态化教育：培训考核与意识提升4.实操技术方案三、企业CEO的工控安全责任：《网络安全法》的顶层要求1.法律框架下的
【开源推荐】AI-PROXY：一站式多厂商AI API代理网关，帮你解决因网络无法请求的问题
【开源推荐】AI-PROXY：一站式多厂商AIAPI代理网关，帮你解决因网络无法请求的问题在AI技术飞速发展的当下，开发者们往往需要与多家AI厂商的API进行交互，这不仅涉及到复杂的API管理，还可能面临网络限制和安全隐患。今天，我将向大家隆重推荐一款专为解决这些痛点而生的开源项目——AI-PROXY，体验地址：https://aceproxy.xyz。一、项目简介AI-PROXY是一款开箱即用的
CAN通讯理论与实践：调试和优化全讲解大模型大数据攻城狮 can通讯汽车电子数据帧 can网络嵌入式开发嵌入式调试 can协议
目录1.CAN通讯的本质：为什么它这么“香”？1.1CAN的核心特点1.2适用场景1.3一个小误区2.CAN协议的理论基石：从物理层到应用层2.1物理层：硬件的“血肉之躯”2.2数据链路层：CAN的“大脑”数据帧结构2.3应用层：让CAN“听懂”你的需求3.CAN硬件选型：别让“硬件”拖后腿3.1控制器和收发器3.2线缆和连接器3.3终端电阻的“坑”4.CAN网络调试：从“头疼”到“丝滑”4.1波
服务器与工控机的区别解析 D-海漠其他
服务器和工控机虽然都是计算机，但它们的设计目标、使用环境和核心特性有本质的区别，就像轿车和越野车虽然都是车，但用途和构造截然不同。以下是它们的主要区别：核心设计目标：服务器：数据处理、存储、网络服务和应用托管。核心目标是高性能、高吞吐量、高可靠性、可扩展性和高可用性（通常通过集群、冗余实现）。它需要处理海量并发请求（如网页服务、数据库查询、文件共享、虚拟化等）。工控机：工业环境中的过程控制、数据采
Redis集群会有写操作丢失吗？为什么? java1234_小锋 java redis java 数据库
大家好，我是锋哥。今天分享关于【Redis集群会有写操作丢失吗？为什么?】面试题。希望对大家有帮助；Redis集群会有写操作丢失吗？为什么?超硬核AI学习资料，现在永久免费了！在Redis集群中，写操作丢失是有可能发生的，特别是在网络分区、节点故障或配置不当的情况下。以下是一些可能导致写操作丢失的原因：节点故障或网络分区：当一个Redis集群节点出现故障或网络发生分区时，部分写操作可能无法同步到副
DPDK（25.03）零基础配置笔记 _Chipen DPDK 计算机网络
DPDK零基础配置笔记DPDK（DataPlaneDevelopmentKit，数据面开发工具包）是一个高性能数据包处理库，主要用于绕过Linux内核网络协议栈，直接在用户空间对网卡收发的数据进行操作，以此实现极高的数据吞吐。DPDK的核心价值是：使用轮询+巨页内存+用户态驱动，提升网络收发性能。适用场景：高频交易、软件路由器、防火墙、负载均衡器等对网络性能要求极高的系统。基本数据简要解释igb_
【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型 AIGC零基础入门小白 AI大模型大模型教程人工智能机器学习科技 AI大模型 AIGC AI教程大模型教程
文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
前事不忘后事之师毕秀敏
图片来源于网络2020年8月13号上午8点30分左右，我清理冰箱里的食品时，发现还有调好的刁子鱼没做，我就准备用油发着吃。我把油倒在锅里，打开燃气灶，见油没动静，外面太阳已经很大，我便去阳台上把昨晚洗的衣服收进来，收衣服时忘了锅里的油，我回到客厅正准备把衣服叠好时，发现厨房里大火熊熊，浓烟滚滚，窗户的纱窗也被热浪冲破了。走近一看，油锅倒在地板砖上在烧，抽油烟机也在烧，灶台和地上都是油。我想报火警，
Java网络编程基础（TCP/IP协议、Socket编程）扬子鳄008 Java 网络 java tcp/ip
Java网络编程是现代软件开发中的一个重要组成部分，尤其是在构建分布式系统和网络服务时。Java提供了丰富的网络编程API，使得开发者能够轻松地实现各种网络通信功能。本文将详细介绍Java网络编程的基础知识，包括TCP/IP协议和Socket编程的基本概念和实现方法。TCP/IP协议简介TCP/IP（传输控制协议/互联网协议）是一组用于网络通信的标准协议集。它由多个层次组成，每个层次负责不同的功能
游戏行业中的恶梦：不断升级的DDoS攻击上海云盾第一敬业销售 ddos 网络安全 web安全
近年来，游戏行业快速发展，成为全球娱乐市场的重要组成部分。然而，伴随着这一行业的繁荣，网络安全问题也随之而来。游戏公司面临着一种特殊的威胁：分布式拒绝服务（DDoS）攻击。这种攻击不仅对公司的声誉造成严重损害，也对其财务状况构成了威胁。本文将探讨游戏行业面临的DDoS攻击挑战，并提供有效的应对策略。具体内容如下：一、攻击者的动机DDoS攻击之所以在游戏行业中如此猖獗，与其背后多元化的攻击动机密切相
游戏盾能否保护业务免受DDoS攻击吗？上海云盾第一敬业销售游戏 ddos 网络
在当今这个网络攻击日益频繁的时代，DDoS攻击已成为企业面临的最大威胁之一。游戏盾，作为一种先进的网络安全解决方案，被广泛用于保护在线游戏免受攻击，但其在企业业务保护方面的效果如何呢？本文将深入探讨游戏盾是否能够保护业务免受DDoS攻击，分析其在企业网络安全中的作用和重要性。随着网络攻击手段的不断升级，企业必须采取更为有效的防护措施，以确保业务连续性和数据安全。1、游戏盾的定义游戏盾最初是为在线游
高防CDN是什么？和传统CDN有什么区别？上海云盾第一敬业销售网络安全 ddos
为了应对日益复杂的网络攻击和流量压力，高防CDN逐渐成为企业关注的焦点。然而，很多人对高防CDN和传统CDN的区别并不清晰。本文将从定义、功能、适用场景等方面深入解析两者的差异，帮助企业做出更明智的选择。具体内容如下：什么是普通CDN和高防CDN？1.普通CDN（内容分发网络）CDN（ContentDeliveryNetwork）的核心目标是通过全球分布的边缘节点缓存网站内容，使用户就近获取资源，
防范DDoS攻击，服务器稳定性崩溃的根源与高效防御对策上海云盾第一敬业销售 ddos 服务器运维
DDoS攻击（分布式拒绝服务攻击）已成为危害服务器稳定性和业务连续性的主要因素之一。本文将深入探讨为什么服务器一遇到DDoS攻击就崩溃，以及如何从根本上实现有效防御和应对这一威胁，帮助企业提升网络安全水平。具体内容如下：随着互联网业务的不断扩展，企业服务器面临的安全威胁日益严峻，DDoS攻击（分布式拒绝服务攻击）已成为危害服务器稳定性和业务连续性的主要因素之一。本文将深入探讨为什么服务器一遇到DD
什么是网关？网关的作用是什么？肉胎凡体物联网网络服务器 tcp/ip
网关(Gateway)又称网间连接器、协议转换器。网关在传输层上以实现网络互连，是最复杂的网络互连设备，仅用于两个高层协议不同的网络互连。网关的结构也和路由器类似，不同的是互连层。网关既可以用于广域网互连，也可以用于局域网互连。网关是一种充当转换重任的计算机系统或设备。在使用不同的通信协议、数据格式或语言，甚至体系结构完全不同的两种系统之间，网关是一个翻译器。与网桥只是简单地传达信息不同，网关对收
Python特性：装饰器解决数据库长时间断连问题超龄超能程序猿数据库 python
前言在基于Python的Web应用开发里，数据库连接是极为关键的一环。不过，像网络波动、数据库服务器维护这类因素，都可能造成数据库长时间断连，进而影响应用的正常运作。本文将详细介绍怎样运用retry_on_failure装饰器来解决数据库长时间断连的难题一问题背景在实际开发场景中，应用和数据库之间的连接可能会由于各种缘由中断（长时间系统无人访问，再次访问，数据库连接超时）。当应用尝试执行数据库操作
2018.12.19 紫smile
焦点网络九期中级紫分享第370天生活中我们有没有遇到过这样的情况:别人说的一句话或是做的一件事就让我们感觉特别的不舒服，反感，生气，怒火蹭的一下就冒出来，想和人吵架甚至是动手打架？这就是突发情绪。今天我们分享的主题就是:突发情绪，理性面对事件1:秦皇岛市内的一个超市事件2:球场明星两个平常冷静的人做出的反常举动被心理学家解释为:在那一瞬间他们被突发情绪控制了突发情绪给人带来了什么样的影响？当人被突
HTTP协议详细介绍
HTTP（HyperTextTransferProtocol，超文本传输协议）是用于在计算机网络中分发超文本信息的基础协议。它是万维网（WorldWideWeb）的核心协议之一，允许浏览器、服务器和其他应用程序之间的通信。HTTP是无状态的应用层协议，最初用于传输HTML文档，但现在几乎可以传输任何类型的数据。1.HTTP的基本概念1.1无状态协议HTTP是一个无状态协议，这意味着每个请求和响应都
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1