可能要学习通信的小白

Yolo-V3 关于负数据的引入

负数据的引入

想要引入负数据，使网络具有更好的鲁棒性，我们首先需要明确的是如何计算Loss，然后再将负数据在网络中的效果添加到Loss计算中

Loss

首先明确，网络中含训练集和测试集，具体是图片与归一化之后的数据（存放于特定的txt文件中）。

1. 读取数据

读取数据的函数位于datasets.py中：

def __init__(self, list_path, img_size=416, augment=True, multiscale=True, normalized_labels=True):
        with open(list_path, "r") as file:
            self.img_files = file.readlines()

        self.label_files = [
            path.replace("images", "labels").replace(".png", ".txt").replace(".jpg", ".txt")
            for path in self.img_files
        ]
        self.img_size = img_size
        self.max_objects = 100
        self.augment = augment
        self.multiscale = multiscale
        self.normalized_labels = normalized_labels
        self.min_size = self.img_size - 3 * 32
        self.max_size = self.img_size + 3 * 32
        self.batch_count = 0

读取数据之后，将图片修改为符合网络训练的规格：`

def __getitem__(self, index):
       
        #获取图片路径
        img_path = self.img_files[index % len(self.img_files)].rstrip()
        img = cv2.imread(img_path)
        #print(img_path)
        img = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
        label_path = self.label_files[index % len(self.img_files)].rstrip()
        if os.path.exists(label_path):
            boxes = np.loadtxt(label_path).reshape(-1, 5)
        else:
            target = None
            img = transforms.ToTensor()(img)
            return img_path, img, targets
        if self.augment:
            if np.random.random() < 0.5:
                #获取图片pad之前的长宽
                w, h = img.size
                w_factor, h_factor = (w, h) if self.normalized_labels else (1, 1)


                x1 = w_factor * (boxes[:, 1] - boxes[:, 3] / 2)
                y1 = h_factor * (boxes[:, 2] - boxes[:, 4] / 2)
                x2 = w_factor * (boxes[:, 1] + boxes[:, 3] / 2)
                y2 = h_factor * (boxes[:, 2] + boxes[:, 4] / 2)

                xMin = np.min(x1)
                yMin = np.min(y1)
                xMax = np.max(x2)
                yMax = np.max(y2)
            
                left = random.uniform(0, max(0, xMin-0.1*w))
                top = random.uniform(0, max(0, yMin-0.1*h))
                right = random.uniform(min(w, xMax+0.1*w), w)
                bottom = random.uniform(min(h, yMax+0.1*h), h)

                #裁剪之后的图像
                img = img.crop((left, top, right, bottom))

                #裁剪后新边长
                new_w = right - left
                new_h = bottom - top

                #boxes1代替原来的boxes1
                boxes[:, 1] = (w_factor * boxes[:, 1] - left) / new_w
                boxes[:, 2] = (h_factor * boxes[:, 2] - top) / new_h
                boxes[:, 3] = w_factor * boxes[:, 3] / new_w
                boxes[:, 4] = h_factor * boxes[:, 4] / new_h
            else:
                pass

        img = transforms.ToTensor()(img)
        boxes = torch.from_numpy(boxes)

        # Handle images with less than three channels
        if len(img.shape) != 3:
            img = img.unsqueeze(0)
            img = img.expand((3, img.shape[1:]))

        _, h, w = img.shape
        h_factor, w_factor = (h, w) if self.normalized_labels else (1, 1)
        # Pad to square resolution	
        img, pad = pad_to_square(img, 0)
        _, padded_h, padded_w = img.shape
            
        # Extract coordinates for unpadded + unscaled image
        x1 = w_factor * (boxes[:, 1] - boxes[:, 3] / 2)
        y1 = h_factor * (boxes[:, 2] - boxes[:, 4] / 2)
        x2 = w_factor * (boxes[:, 1] + boxes[:, 3] / 2)
        y2 = h_factor * (boxes[:, 2] + boxes[:, 4] / 2)
        # Adjust for added padding
        x1 += pad[0]
        y1 += pad[2]
        x2 += pad[1]
        y2 += pad[3]
        # Returns (x, y, w, h)
        boxes[:, 1] = ((x1 + x2) / 2) / padded_w
        boxes[:, 2] = ((y1 + y2) / 2) / padded_h
        boxes[:, 3] *= w_factor / padded_w
        boxes[:, 4] *= h_factor / padded_h

        targets = torch.zeros((len(boxes), 6))
        targets[:, 1:] = boxes
        return img_path, img, targets

可见最后return的是图像路径，图像与targets，所谓targets就是最后和网络训练结果对比的标准答案。

2. 了解数据在哪里输出，找到print出Loss的位置从而确定Loss如何计算

在train.py中找到了将网络训练的数据以表格的形式print出的语句，但是很可惜这并不能告诉我们怎么计算。

log_str = "\n---- [Epoch %d/%d, Batch %d/%d] ----\n" % (epoch, opt.epochs, batch_i, len(dataloader))
metric_table = [["Metrics", *[f"YOLO Layer {i}" for i in range(len(model.yolo_layers))]]]

最后在Xshell中输出的形式如图所示：

3. 网络具体结构

在输出的语句中我们发现，Loss值是作为model.yolo_layers的参数输出的，既然我们没有办法直接得到具体的数学计算公式，那我们就去看网络结构，看看这个yolo_layers长什么样。
在model.py的class - YOLOLayer中，找到了网络结构的定义。

class YOLOLayer(nn.Module):

init

def __init__(self, anchors, num_classes, img_dim=416):
        super(YOLOLayer, self).__init__()
        self.anchors = anchors
        self.num_anchors = len(anchors)
        self.num_classes = num_classes
        self.ignore_thres = 0.5
        self.mse_loss = nn.MSELoss()
        self.bce_loss = nn.BCELoss()
        self.obj_scale = 1
        self.noobj_scale = 100
        self.metrics = {}
        self.img_dim = img_dim
        self.grid_size = 0  # grid size

init中主要是定义了后面要用到的一些参数。

compute_grid_offsets

def compute_grid_offsets(self, grid_size, cuda=True):
        self.grid_size = grid_size
        g = self.grid_size 
        FloatTensor = torch.cuda.FloatTensor if cuda else torch.FloatTensor
        self.stride = self.img_dim / self.grid_size
        # Calculate offsets for each grid
        self.grid_x = torch.arange(g).repeat(g, 1).view([1, 1, g, g]).type(FloatTensor)
        self.grid_y = torch.arange(g).repeat(g, 1).t().view([1, 1, g, g]).type(FloatTensor)
        self.scaled_anchors = FloatTensor([(a_w / self.stride, a_h / self.stride) for a_w, a_h in self.anchors])
        self.anchor_w = self.scaled_anchors[:, 0:1].view((1, self.num_anchors, 1, 1))
        self.anchor_h = self.scaled_anchors[:, 1:2].view((1, self.num_anchors, 1, 1))

forward

def forward(self, x, targets=None, img_dim=None):

定义数据类型

	# Tensors for cuda support
    FloatTensor = torch.cuda.FloatTensor if x.is_cuda else torch.FloatTensor
    LongTensor = torch.cuda.LongTensor if x.is_cuda else torch.LongTensor
    ByteTensor = torch.cuda.ByteTensor if x.is_cuda else torch.ByteTensor

定义预测值

	prediction = (
    	x.view(num_samples, self.num_anchors, self.num_classes + 5, grid_size, grid_size)
        .permute(0, 1, 3, 4, 2)
        .contiguous()
       )

x.view中view的作用是把原先tensor中的数据按照行优先的顺序排成一个一维的数据（这里应该是因为要求地址是连续存储的），然后按照参数组合成其他维度的tensor。比如说是不管你原先的数据是[[[1,2,3],[4,5,6]]]还是[1,2,3,4,5,6]，因为它们排成一维向量都是6个元素，所以只要view后面的参数一致。
permute(0, 1, 3, 4, 2)的作用简而言之就是将tensor的维度换位。
contiguous: transpose、permute等维度变换操作后，tensor在内存中不再是连续存储的，而view操作要求tensor的内存连续存储，所以需要contiguous来返回一个contiguous copy contiguous-知乎

获取输出

	# Get outputs
    x = torch.sigmoid(prediction[..., 0])  # Center x
    y = torch.sigmoid(prediction[..., 1])  # Center y
    w = prediction[..., 2]  # Width
    h = prediction[..., 3]  # Height
    pred_conf = torch.sigmoid(prediction[..., 4])  # Conf
    pred_cls = torch.sigmoid(prediction[..., 5:])  # Cls pred.

torch.sigmoid为激活函数Sigmoid，具体公式在Pytorch官方文档中有。Pytorch.nn

将prediction中数据作处理后放入output中

	# Add offset and scale with anchors
	pred_boxes = FloatTensor(prediction[..., :4].shape)
    pred_boxes[..., 0] = x.data + self.grid_x
    pred_boxes[..., 1] = y.data + self.grid_y
    pred_boxes[..., 2] = torch.exp(w.data) * self.anchor_w
    pred_boxes[..., 3] = torch.exp(h.data) * self.anchor_h

    output = torch.cat(
        (
            pred_boxes.view(num_samples, -1, 4) * self.stride,
            pred_conf.view(num_samples, -1, 1),
            pred_cls.view(num_samples, -1, self.num_classes),
        ),
        -1,
    )

获取targets

if targets is None:
	return output, 0
else:
	iou_scores, class_mask, obj_mask, noobj_mask, tx, ty, tw, th, tcls, tconf = build_targets(
		pred_boxes=pred_boxes,
		pred_cls=pred_cls,
		target=targets,
		anchors=self.scaled_anchors,
		ignore_thres=self.ignore_thres,
	     )

其中的build_targets位于utils.py中，等会再说。

计算所有的loss

	# Loss : Mask outputs to ignore non-existing objects (except with conf. loss)
	loss_x = self.mse_loss(x[obj_mask], tx[obj_mask])
	loss_y = self.mse_loss(y[obj_mask], ty[obj_mask])
	loss_w = self.mse_loss(w[obj_mask], tw[obj_mask])
	loss_h = self.mse_loss(h[obj_mask], th[obj_mask])
	loss_conf_obj = self.bce_loss(pred_conf[obj_mask], tconf[obj_mask])
	loss_conf_noobj = self.bce_loss(pred_conf[noobj_mask], tconf[noobj_mask])
	loss_conf = self.obj_scale * loss_conf_obj + self.noobj_scale * loss_conf_noobj
	loss_cls = self.bce_loss(pred_cls[obj_mask], tcls[obj_mask])
	total_loss = loss_x + loss_y + loss_w + loss_h + loss_conf + loss_cls
	
	# Metrics
	cls_acc = 100 * class_mask[obj_mask].mean()
	conf_obj = pred_conf[obj_mask].mean()
	conf_noobj = pred_conf[noobj_mask].mean()
	conf50 = (pred_conf > 0.5).float()
	iou50 = (iou_scores > 0.5).float()
	iou75 = (iou_scores > 0.75).float()
	detected_mask = conf50 * class_mask * tconf
	precision = torch.sum(iou50 * detected_mask) / (conf50.sum() + 1e-16)
	recall50 = torch.sum(iou50 * detected_mask) / (obj_mask.sum() + 1e-16)
	recall75 = torch.sum(iou75 * detected_mask) / (obj_mask.sum() + 1e-16)

将结果放入self.metrics中

	self.metrics = {
		"loss": to_cpu(total_loss).item(),
		"x": to_cpu(loss_x).item(),
		"y": to_cpu(loss_y).item(),
		"w": to_cpu(loss_w).item(),
		"h": to_cpu(loss_h).item(),
		"conf": to_cpu(loss_conf).item(),
		"cls": to_cpu(loss_cls).item(),
		"cls_acc": to_cpu(cls_acc).item(),
		"recall50": to_cpu(recall50).item(),
		"recall75": to_cpu(recall75).item(),
		"precision": to_cpu(precision).item(),
		"conf_obj": to_cpu(conf_obj).item(),
		"conf_noobj": to_cpu(conf_noobj).item(),
		"grid_size": grid_size,
		}

返回out，total_loss

	return output, total_loss

现在，回到前面看bulid_targets是如何操作的：

def build_targets(pred_boxes, pred_cls, target, anchors, ignore_thres):

定义数据类型

	ByteTensor = torch.cuda.ByteTensor if pred_boxes.is_cuda else torch.ByteTensor
    FloatTensor = torch.cuda.FloatTensor if pred_boxes.is_cuda else torch.FloatTensor

获取x, y ,w, cls的大小，并以此创建Tensor放置target数据

	nB = pred_boxes.size(0)
    nA = pred_boxes.size(1)
    nC = pred_cls.size(-1)
    nG = pred_boxes.size(2)

    # Output tensors
    obj_mask = ByteTensor(nB, nA, nG, nG).fill_(0)
    noobj_mask = ByteTensor(nB, nA, nG, nG).fill_(1)
    class_mask = FloatTensor(nB, nA, nG, nG).fill_(0)
    iou_scores = FloatTensor(nB, nA, nG, nG).fill_(0)
    tx = FloatTensor(nB, nA, nG, nG).fill_(0)
    ty = FloatTensor(nB, nA, nG, nG).fill_(0)
    tw = FloatTensor(nB, nA, nG, nG).fill_(0)
    th = FloatTensor(nB, nA, nG, nG).fill_(0)
    tcls = FloatTensor(nB, nA, nG, nG, nC).fill_(0)

将x, y, w, h的数据放于gxy与gwh中

	# Convert to position relative to box
    target_boxes = target[:, 2:6] * nG
    gxy = target_boxes[:, :2]
    gwh = target_boxes[:, 2:]

与anchor进行比较后，用并集 / 交集后得到ious，求得最大值

	# Get anchors with best iou
    ious = torch.stack([bbox_wh_iou(anchor, gwh) for anchor in anchors])
    best_ious, best_n = ious.max(0)

torch.stack作用是将维度结合，这里有三中类型的anchor，所以stack将三个一维的tensor结合成二维
ious.max(0)的作用是取出ious中每列的最大值

min(0)返回该矩阵中每一列的最小值
min(1)返回该矩阵中每一行的最小值
max(0)返回该矩阵中每一列的最大值
max(1)返回该矩阵中每一行的最大值

将target中的值拿出来

	# Separate target valueshuo
    b, target_labels = target[:, :2].long().t()
    gx, gy = gxy.t()
    gw, gh = gwh.t()
    gi, gj = gxy.long().t()
    # Set masks
    obj_mask[b, best_n, gj, gi] = 1
    noobj_mask[b, best_n, gj, gi] = 0

计算各种用于计算Loss的target值

	# Coordinates
    tx[b, best_n, gj, gi] = gx - gx.floor()
    ty[b, best_n, gj, gi] = gy - gy.floor()
    # Width and height
    tw[b, best_n, gj, gi] = torch.log(gw / anchors[best_n][:, 0] + 1e-16)
    th[b, best_n, gj, gi] = torch.log(gh / anchors[best_n][:, 1] + 1e-16)
    # One-hot encoding of label
    tcls[b, best_n, gj, gi, target_labels] = 1
    # Compute label correctness and iou at best anchor
    class_mask[b, best_n, gj, gi] = (pred_cls[b, best_n, gj, gi].argmax(-1) == target_labels).float()
    iou_scores[b, best_n, gj, gi] = bbox_iou(pred_boxes[b, best_n, gj, gi], target_boxes, x1y1x2y2=False)

    tconf = obj_mask.float()

返回所有test值

	return iou_scores, class_mask, obj_mask, noobj_mask, tx, ty, tw, th, tcls, tconf

4. 理清如何去添加

首先，在bulid_targets中引入的target数据是原始的，我们在labelImg2上标记并归一化了的数据，在models中的prediction是网络训练出来的结果，最后的loss值是由loss_x = self.mse_loss(x[obj_mask], tx[obj_mask]) 这种形式计算的。

5. 最后解决方案

看最后loss中的代码不难看出，所有的计算都与坐标[b, best_n, gj, gi]有关，而此坐标最关键的是与obj_mask和noobj_mask息息相关。obj_mask[] = 1表示检测出物体，noobj_mask[] = 1表示没有检测出物体。

	# Set masks
    obj_mask[b, best_n, gj, gi] = 1
    noobj_mask[b, best_n, gj, gi] = 0

引入负数据，首先将图片路径放入train.txt中，然后将归一化之后的txt文件与之前的训练txt放在一起。但是我们知道，负数据是没有相关特征的，我们不对其作标注，直接在其各自的txt文件中全部加0。然后在以上代码下加两行，表面如果检测到tx，ty = 0的话，将noobj_mask置为1，将obj_mask置为0。这就相当于告诉了网络，即使网络认为，这个负数据中存在特征，但是如果他的label没有描述，网络就算是判断错误。最后是否成功，就要看网络最后的实际效果和出来的loss值了。但是由于此次训练，是只检测一个label也就是card，所以说loss值经过几个epoch之后就非常高，看loss意义就不大了。

	# 如果是全0的label，即anchor_ious为0，则将obj mask设为0，noobj mask设为1
    obj_mask[b[i], anchor_ious == 0., gj[i], gi[i]] = 0
    noobj_mask[b[i], anchor_ious == 0., gj[i], gi[i]] = 1

最后问题得以解决，此文告一段落。

3.13 YOLO V3 不要不开心了机器学习 pytorch 深度学习
今天的内容为YOLO-V3YOLO系列-YOLO-V3，最大的改进就是网络结构，使其更适合小目标检测。-特征做得更细致，融入多持续特征图信息来预测不同规格物体。-先验框更丰富了，3种scale，每种3个规格，一共9种。-softmax改进，预测多标签任务。-多scale-为了能检测到不同大小的物体，设计了3个scale。-scale变换经典方法-左图：图像金字塔；右图：单一的输入。-scale变换
图像识别技术与应用课后总结（18）一元钱面包人工智能
·YOLO-V3RetinaNet系列，YOLO-V3在不同变体（如YOLOV3-320、YOLOV3-416等）下，在推理时间和精度上有不同的表现，展示了其在速度和准确性上的平衡。YOLO-V3的改进点网络结构：相比之前版本，YOLO-V3的网络结构进行了优化，使其更适合小目标检测。特征处理：对特征的处理更加细致，通过融入多持续特征图信息来预测不同规格的物体。先验框：先验框更加丰富，有3种sca
Yolo-v3利用GPU训练make时发生错误：/usr/bin/ld: cannot find -lcuda 徐小妞66666
一.利用GPU训练Yolov3时，首先要修改MakeFile文件，修改格式如下：GPU=1(原来为0)CUDNN=1(原来为0)NVCC=/usr/local/cuda/bin/nvcc(新建,注意自己本机的地址)二.此时make产生错误/usr/bin/ld:cannotfind-lcuda1.查看MakeFile文件找到该行代码：LDFLAGS+=-L/usr/local/cuda/lib64
使用Flask在B/S端部署YOLOv3（Pytorch） Wupke 项目与比赛 Pytorch flask pytorch python
使用Flask在B/S端部署YOLOv3文前白话后端搭建启动服务服务请求&调用模型开启服务发送请求&响应文前白话Flask是一种用python实现轻量级的web微服务，其灵活性较强而且效率高，在深度学习方面，可以用来部署B/S检测模型。下面以yolov3模型为例，介绍基于Flask的简单部署过程。有需要的话可以自行添加丰富的web展示界面。相关链接传送：【YOLO-v3源码详细解读】https:/
win10 YOLO-v3-keras-gpu版本实现记录夜深人语寂
1、在https://github.com/qqwweee/keras-yolo3下载yolo-v3的算法2、在https://pjreddie.com/media/files/yolov3.weights下载权重并放在keras-yolo3的文件夹下3、配置cuda环境下载电脑适配的cuda，cudnn版本，两个版本有对应起来。（本人cuda8.0，cudnn6.0）3、配置电脑python环境
轨道异物检测旖旎沐心深度学习 Python python
深度学习-轨道异物检测（1）本实验主要通过YOLO-v3（轻量级）的算法进行设计；（2）本实验所需要的数据集来源于实验室；（3）本实验使用LabelImg标注工具对数据集进行标注（这个标注软件可以对矩形的图像标注，并将标注结果保存为.txt或.xml的格式.如果后期需要对标注文件的标签类别内容进行改变，那我们就需要在主目录data文件夹中找到指定的文件进行改变）；（4）本实验将标注好的.xml文件
Yolo系列-yolov3 coding_ksy #物体检测经典算法实战 YOLO
YOLO-V3这张图讲道理真的过分了！！！我不是针对谁，在座的各位都是终于到V3了，最大的改进就是网络结构，使其更适合小目标检测特征做的更细致，融入多持续特征图信息来预测不同规格物体先验框更丰富了，3种scale，每种3个规格，一共9种softmax改进，预测多标签任务多scale为了能检测到不同大小的物体，设计了3个scalescale变换经典方法左图：图像金字塔；右图：单一的输入；残差连接-为
Python搭建RTMP流媒体服务器，实现网络摄像头的推流，并使用机器视觉模型Yolo-v3实时处理视频、输出分类标签。只想大吃一顿那些项目实践遇到的大坑神经网络 python 多线程视频处理
Python搭建RTMP流媒体服务器，实现网络摄像头的推流，并使用机器视觉模型Yolo-v3实时处理视频、输出分类标签。对于推流与处理，用到了多线程防止卡死。#-*-coding:utf-8-*-"""CreatedonMonJul622:21:492020@author:Straka"""#=====================================================
计算机视觉-目标检测（二）：从R-FCN到YOLO-v3 orangerfun 计算机视觉计算机视觉目标检测 python
文章目录1.R-FCN1.1动机1.2.R-FCN网络结构1.3.R-FCN的损失函数1.4.R-FCN的训练及性能2.YoLO-v12.1简介2.2YOLO-v1网络结构2.3目标函数2.4YOLO-v1的优缺点3.YOLO-v23.1YOLO-v2相比v1的优化4.YOLO-v3参考1.R-FCN论文链接：R-FCN:ObjectDetectionviaRegion-basedFullyCon
yolo-v3看不懂？手撕代码逐行讲解，附带网盘完整代码实现 QTreeY123 yolo YOLO 神经网络深度学习计算机视觉目标检测
目录一：读取数据二：初始化模型Route层用于将来自不同层的特征图进行连接或拼接。Shortcut层用于执行残差连接，将前一层的特征图与当前层的特征图相加。最重要的一层yolo层：三：初始化完所有有网络层后，开始处理数据四：开始训练五：损失六：完整代码网盘链接（附带训练集，和测试的demo）不多说一句话，直接开撕！！！一：读取数据读取coco.data文件二：初始化模型接下里继续搭建模型，卷积后紧
(四)目标检测- YoloV3和SSD对比 li三河深度学习算法总结深度学习 cnn 人工智能
SSD的loss中，不同类别的分类器是softmax，最终检测目标的类别只能是一类。而在yolo-v3中，例如对于80类的coco数据集，对于类别进行判断是80个logistic分类器，只要输出大于设置的阈值，则都是物体的类别，物体同时可以属于多类，例如一个物体同时是person和woman。SSD损失函数分为两个部分：对应搜索框的位置loss(loc)和类别置信度loss(conf).i指代搜索
yolo_v3训练自己的模型（人脸及deep-sort)（或自己数据集）剑峰随心 python 深度学习机器学习 tensorflow 人脸识别
做deep-sort多目标跟踪需要结合yolo_v3进行检测行人由于我的项目中需要对人脸进行检测，所以需要训练针对人脸的模型训练样本是来自WIDER-FACE人脸库。(有3w+的图片和标注框)deep-sort结合yolo-v3的博客分享https://blog.csdn.net/weixin_42755375/article/details/85723239分享一篇博客(按照博客要求可以完美训练
百度架构师手把手带你零基础实践深度学习——YOLO-V3 张学义深度学习深度学习
目标检测Yolov3学习发展历程目标检测基础概念数据集及预处理数据读取数据预处理图像增广方法汇总批量数据读取与加速使用paddle.reader.xmap_readers实现多线程读取数据YOLO-V3模型设计思想产生候选区域卷积神经网络提取特征YOLO-V3骨干网络结构Darknet53的实现代码损失函数定义上采样模块定义YOLO-V3模型开启端到端训练预测模型效果及可视化展示发展历程2013年
CV——day72：从零开始学YOLO——YOLO-v3（可以在我的资源里下载完整的v1到v3的笔记啦！）想太多! CV YOLO 计算机视觉深度学习
YOLO-v36.YOLO-v36.1YOLO-v3改进综述6.2多scale方法改进与特征融合6.3经典变换方法对比分析6.4残差连接方法解读6.5整体网络模型架构分析6.6先验框设计改进6.7softmax层改进6.YOLO-v3**tips：**作者本人因为美军广泛运用于军事领域，所以决定不再继续开发YOLO系列。但是其他人还是继续往后做了~v8都有了注意，原点值（x轴预测时间，y轴map）
YOLOv3 模型中的多尺度融合与训练 Gallant Hu 深度学习目标检测计算机视觉
YOLO-V3模型设计思想下半部分描述了生成候选区域的过程，首先将原图划分成多个小方块，每个小方块的大小是32×3232\times3232×32，然后以每个小方块为中心分别生成一系列锚框，整张图片都会被锚框覆盖到。在每个锚框的基础上产生一个与之对应的预测框，根据锚框和预测框与图片上物体真实框之间的位置关系，对这些预测框进行标注。这里的锚框生成方式和两阶段的算法不同，两阶段的算法通过RPN网络在特
yolo目标检测软件 c语言,深度学习目标检测之——YOLO-v3目标检测（windows端调用）... 曙Ouba yolo目标检测软件 c语言
前言目前基于深度学习的目标检测越来越火，其准确度很高。笔者采用Yolo-v3实现目标检测。Yolo-v3基于darknet框架，该框架采用纯c语言，不依赖来其他第三方库，相对于caffe框架在易用性对开发者友好(笔者编译过数次caffe才成功)。本文基于windows平台将yolo-v3编译为动态链接库dll,测试其检测性能。New,python接口的YOLO-v3,!!!,走过不要错过为了方便测
VS2019 C++调用pytorch Faster-RCNN全过程(Libtorch+opencv) 8倍 c++调用python网络 c++pytorch cnn 目标检测
前言目标检测网络根据阶段数主要有one-stage和two-stage两大类。one-stage：直接通过调整先验框得到预测框（速度更快）two-stage：先生成建议框，再通过调整建议框得到预测框（精度更高）此前我们已经通过Darknet成功实现了在C++中调用one-stage的网络模型YOLO-V3(☞vs2019使用Darknet调用YOLOV3模型并测试（CPU+GPU）)。Faster
4.2 目标检测YOLO-V3算法--数据预处理&数据增广(百度架构师手把手带你零基础实践深度学习原版笔记系列) aiAIman 深度学习算法深度学习机器学习数据分析
4.2目标检测YOLO-V3算法--数据预处理&数据增广(百度架构师手把手带你零基础实践深度学习原版笔记系列)目录4.2目标检测YOLO-V3算法--数据预处理&数据增广(百度架构师手把手带你零基础实践深度学习原版笔记系列)数据预处理（数据增广目的）随机改变亮暗、对比度和颜色等随机填充随机裁剪随机缩放随机翻转随机打乱真实框排列顺序图像增广方法汇总批量数据读取与加速数据预处理（数据增广目的）在计算机
YOLO-V3实时检测实现（opencv+python实现） shuihg python opencv 开发语言
YOLO-V3实时检测实现（opencv+python实现）_Keep_Trying_Go的博客-CSDN博客_opencvyolov3importosimportcv2importnumpyasnpimportmatplotlib.pyplotaspltimporttime#读取网络配置文件和权重文件net=cv2.dnn.readNet(model='./weights/yolov3-tiny
目标检测之Yolov3与Anchor-Free javastart 深度学习深度学习计算机视觉 python
原文：目标检测之RCNN、Yolo、SSD、RetinaNet与Anchor-Free_dagongji10的博客-CSDN博客2.2Yolov3（2018）Yolo-v3论文比Yolo-v2还要随意，具体优化内容主要有：bbox的预测：基本上还是沿用Yolo-v2那一套（对anchor的offset），但是Yolo-v3使用逻辑回归对每一个框打分，该分数用于选取与GroundTruth最为契合的
Autoware1.14-摄像头目标检测YOLO-V3 Double lee 无人驾驶目标检测人工智能计算机视觉自动驾驶
下载YOLO-V3权重文件权重地址：https://pjreddie.com/media/files/yolov3.weights建议存放地址：autoware.ai/install/vision_darknet_detect/share/vision_darknet_detect/darknet/cfg打开autoware控制台，终端执行命令cdautoware.ai/sourceinstall
PyTorch从零开始实现YOLO-V3目标检测算法起床啦修狗
PyTorch从零开始实现YOLO-V3目标检测算法主要从以下几位博主中学习第1部分：了解YOLO如何工作第2部分：创建网络结构第3部分：实现网络的前向传播第4部分：对象置信度阈值和非最大抑制第5部分：设计输入和输出管道
YOLO系列-yolov3 dzm1204 深度学习计算机视觉深度学习人工智能
文章目录YOLO-V3多scalescale经典方法残差链接-resnet思想核心网络架构先验框设计softmax改进YOLO-V3在yolov3中不论速度还是map值都比其他算法高出很多yolov3最大的改进就是网络结构，使其更适合小目标检测特征做的更细致，融入多持续特征图信息来预测不同规格的物体先验框更丰富了，3种scale，每种3个规格，一共9种softmax改进，可以预测多标签任务多sca
YOLO-V3实时检测实现（opencv+python实现） Keep_Trying_Go Opencv python opencv 计算机视觉目标检测
文章目录1.前置知识点（浅层了解）（1）深度学习的网络模型（2）yolo-v3网络结构2.YOLO-V3权重文件(.weights)，类别文件（.names）和网络文件（.cfg）下载（1）YOLOV3权重文件下载（2）YOLOV3类别文件下载（3）YOLO.cfg配置文件下载3.代码实战（1）读取权重文件和网络配置文件（2）获取最后三个输出层的名称（3）读取包含80个类别coco.names的文
物体检测之YOLO系列 Clark-dj 人工智能杂七杂八
业界对于目标检测的热度只增不减，但目前的框架也难于逾越RCNN系列、SSD、YOLO系列这三座大山，很多新的方法也是在此基础上做一些改进，所以有必要做一些整理，方便自己后续查看，这里先对YOLO系列做一些整理。没看过文章的可以回头细细品味下yolo-v1(发表于2016.5)、yolo-v2(发表于2016.12)、yolo-v3(发表于2018.4)这是继RCNN系列（two-stage）后针对
LabelImg标注的YOLO格式txt标签中心坐标和物体边界框长宽的转换 Keep_Trying_Go python xml 深度学习人工智能
目录1.LabelImg标注的YOLO格式的TXT标签Opencv+YOLO-V3实现目标跟踪YOLO-V3实时检测实现（opencv+python实现）——改进——＞更加的易懂YOLO-V3实时检测实现（opencv+python实现）1.LabelImg标注的YOLO格式的TXT标签关于LabelImg下载及使用：标注工具labelImg的下载安装及使用首先标注一张图片：查看标签.txt文件：
YOLO-v3论文详解 PD我是你的真爱粉 Tensorflow 目标检测深度学习
YOLO-v3论文详解--潘登同学的目标检测笔记文章目录YOLO-v3论文详解--潘登同学的目标检测笔记继承YOLO-9000与技术改进YOLO-v3试了但没成功继承YOLO-9000与技术改进BoundingBoxPrediction计算方法与YOLO-9000bx=σ(tx)+cxby=σ(ty)+cybw=pwetwbh=phethPr(object)∗IOU(b,object)=σ(to)
Pytorch基础知识（8）多目标检测求则得之，舍则失之 PyTorch 目标检测 pytorch 深度学习
目标检测是对图像中存在的目标进行定位和分类的过程。识别出的物体在图像中显示为边界框。一般的目标检测有两种方法：基于区域提议的和基于回归/分类的。在本章中，我们将使用一个名为YOLO的基于回归/分类的方法。YOLO-v3是该系列的其中一个版本，在精度方面比以前的（YOLOV1、YOLOV2)版本表现更好。因此，本章将重点介绍使用PyTorch开发的Yolo-v3。在本章中，我们将学习如何实现YOLO
[深度学习 - 目标检测] YOLO系列（六）：YOLO-V3源码解析：基于配置文件构造网络模型南城同学深度学习目标检测目标检测深度学习
源码：models.py1.读取配置文件PyTorch-YOLOv3\config\yolov3.cfgdef__init__(self,config_path,img_size=416):super(Darknet,self).__init__()self.module_defs=parse_model_config(config_path)2.创建模型self.hyperparams,self
YOLO（一）：YOLOv3在Windows7（无GPU）下的配置+opencv3.1.0+VS2015 mozun2020 DL2:YOLO学习笔记 windows opencv c++机器学习
提醒一下：本文为64位Windows7操作系统下仅CPU的配置，GPU版本及YOLO-V3的训练问题先挖个坑，后期再更新。主要参考：CSDN博主「凌空的桨」：(https://blog.csdn.net/baidu_36669549/article/details/79798587)其实对于初学者，YOLOv3上手真的是非常友好，但架不住网上坑人的所谓狗皮膏药一样的教程，不可避免的要经受洗礼，终于
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的