白羊星座七七七

基于keras-yolov3，原理及代码细节的理解

本文GitHub 源码：https://github.com/qqwweee/keras-yolo3

yolov3论文地址：https://pjreddie.com/media/files/papers/YOLOv3.pdf

yolov3官网：https://pjreddie.com/darknet/yolo/

最近对YOLOV3很感兴趣，看了好多资料。做了一些相关的项目。所以写下了一些心得体会，以便以后回顾查询。

YOLO，即 You Only Look Once 的缩写，是一个基于卷积神经网络（CNN）的物体检测算法。

yolo设计理念

yolo算法整体来说是采用CNN对目标进行end-to-end的检测。流程如图一所示

图一

具体来说（基于YOLOV3）

1：输入一张任意大小图片，保持长宽比不变的情况下，缩放至 w 或 h 达到416，再覆盖在416*416的新图上，作为网络的输入。即网络的输入是一张416*416，3通道的RGB图。

2：运行网络。YOLO的CNN网络把图片分成 S*S 个网格（yolov3多尺度预测，输出3层，每层 S * S个网格，分别为 13*13 ，26 *26 ，52*52），然后每个单元格负责去检测那些中心点落在该格子内的目标，如图二所示。每个单元格需要预测 3*（4+1+B）个值。如果将输入图片划分为 S*S 网格，那么每层最终预测值为 S*S*3*(4+1+B) 大小的张量。 B：类别数（coco集为80类），即B=80. 3 为每层anchorbox数量，4 为边界框大小和位置（x , y , w , h ）1 为置信度。

3: 通过NMS，非极大值抑制，筛选出框boxes,输出框class_boxes和置信度class_box_scores，再生成类别信息classes，生成最终的检测数据框，并返回

图二图三

YOLOV3网络结构：

多尺度：

yolov3采用多尺度预测。【（13*13）（26*26）（52*52）】

•小尺度：（13*13的feature map）

网络接收一张（416*416）的图，经过5个步长为2的卷积来进行降采样（416 / 2ˆ5 = 13）.输出（13*13）。

•中尺度：（26*26的feature map）

从小尺度中的倒数第二层的卷积层上采样(x2，up sampling)再与最后一个13x13大小的特征图相加，输出（26*26）。

•大尺度：（52*52的feature map）

操作同中尺度输出（52*52）

好处：让网络同时学习到深层和浅层的特征，通过叠加浅层特征图相邻特征到不同通道（而非空间位置），类似于Resnet中的identity mapping。这个方法把26x26x512的特征图叠加成13x13x2048的特征图，与原生的深层特征图相连接，使模型有了细粒度特征,增加对小目标的识别能力。

anchor box:

yolov3 anchor box一共有9个，由k-means聚类得到。在COCO数据集上，9个聚类是：（10*13）;（16*30）;（33*23）;（30*61）;（62*45）; （59*119）; （116*90）; （156*198）; （373*326）。

不同尺寸特征图对应不同大小的先验框。

13*13feature map对应【（116*90），（156*198），（373*326）】
26*26feature map对应【（30*61），（62*45），（59*119）】
52*52feature map对应【（10*13），（16*30），（33*23）】

原因：特征图越大，感受野越小。对小目标越敏感，所以选用小的anchor box。

特征图越小，感受野越大。对大目标越敏感，所以选用大的anchor box。

边框预测：

预测tx ty tw th

对tx和ty进行sigmoid，并加上对应的offset（下图Cx, Cy）
对th和tw进行exp，并乘以对应的锚点值
对tx,ty,th,tw乘以对应的步幅，即：416/13, 416 ⁄ 26, 416 ⁄ 52
最后，使用sigmoid对Objectness和Classes confidence进行sigmoid得到0~1的概率，之所以用sigmoid取代之前版本的softmax，原因是softmax会扩大最大类别概率值而抑制其他类别概率值

(tx,ty) :目标中心点相对于该点所在网格左上角的偏移量，经过sigmoid归一化。即值属于【0,1】。如图约（0.3 , 0.4）

(cx,cy):该点所在网格的左上角距离最左上角相差的格子数。如图（1,1）

(pw,ph):anchor box 的边长

(tw,th):预测边框的宽和高

PS：最终得到的边框坐标值是bx,by,bw,bh.而网络学习目标是tx,ty,tw,th

损失函数LOSS

YOLO V3把YOLOV2中的Softmax loss变成Logistic loss

此图仅供参考，与YOLOV3略有不同

代码解读：源码 检测部分

Usage

Git Clone https://github.com/qqwweee/keras-yolo3
从YOLO website 下载yolov3 weights
把darknet版本的yolo model 转换为 Keras model
运行 YOLO dection

YOLO类的初始化参数：
class YOLO(object):

    _defaults = {
        "model_path": 'model_data/yolo.h5',  #训练好的模型
        "anchors_path": 'model_data/yolo_anchors.txt',  # anchor box 9个， 从小到大排列
        "classes_path": 'model_data/coco_classes.txt',  #类别数
        "score" : 0.3,  #score 阈值
        "iou" : 0.45,   #iou 阈值
        "model_image_size" : (416, 416),  #输入图像尺寸
        "gpu_num" : 1,  #gpu数量
    }

run yolo_video.py

def detect_img(yolo):
    while True:
        img = input('Input image filename:')   #输入一张图片
        try:
            image = Image.open(img)
        except:
            print('Open Error! Try again!')
            continue
        else:
            r_image = yolo.detect_image(image)  #进入yolo.detect_image 进行检测
            r_image.show()
    yolo.close_session()


detect_image（）函数在yolo.py第102行

    def detect_image(self, image):
        start = timer()

        if self.model_image_size != (None, None):  #判断图片是否存在
            assert self.model_image_size[0]%32 == 0, 'Multiples of 32 required'  
            assert self.model_image_size[1]%32 == 0, 'Multiples of 32 required'
            #assert断言语句的语法格式 model_image_size[0][1]指图像的w和h，且必须是32的整数倍

            boxed_image = letterbox_image(image, tuple(reversed(self.model_image_size)))                               #letterbox_image()定义在utils.py的第20行。输入参数（图像 ,(w=416,h=416)),输出一张使用填充来调整图像的纵横比不变的新图。  
        else:
            new_image_size = (image.width - (image.width % 32),
                              image.height - (image.height % 32))
            boxed_image = letterbox_image(image, new_image_size)
        image_data = np.array(boxed_image, dtype='float32')
        print(image_data.shape)  #（416，416,3）
        image_data /= 255.  #归一化
        image_data = np.expand_dims(image_data, 0) 
        #批量添加一维 -> (1,416,416,3) 为了符合网络的输入格式 -> (bitch, w, h, c)

        out_boxes, out_scores, out_classes = self.sess.run(
            [self.boxes, self.scores, self.classes],  
            #目的为了求boxes,scores,classes，具体计算方式定义在generate（）函数内。在yolo.py第61行
            feed_dict={    #喂参数
                self.yolo_model.input: image_data,  #图像数据
                self.input_image_shape: [image.size[1], image.size[0]],   #图像尺寸
                K.learning_phase(): 0   #学习模式 0：测试模型。 1：训练模式
            })

        print('Found {} boxes for {}'.format(len(out_boxes), 'img'))

      # 绘制边框，自动设置边框宽度，绘制边框和类别文字，使用Pillow绘图库

　　   font = ImageFont.truetype(font='font/FiraMono-Medium.otf',
            　　　　size=np.floor(3e-2 * image.size[1] + 0.5).astype('int32'))  #字体
　　　　 thickness = (image.size[0] + image.size[1]) // 300  #厚度

　　　　 for i, c in reversed(list(enumerate(out_classes))):
    　　 　　predicted_class = self.class_names[c]  #类别
    　　　　 box = out_boxes[i]  #框
    　　　　 score = out_scores[i]  #置信度

    　　label = '{} {:.2f}'.format(predicted_class, score)  #标签
    　　draw = ImageDraw.Draw(image)  #画图
    　　label_size = draw.textsize(label, font)　　# 标签文字

    　　top, left, bottom, right = box
    　　top = max(0, np.floor(top + 0.5).astype('int32'))
    　　left = max(0, np.floor(left + 0.5).astype('int32'))
    　　bottom = min(image.size[1], np.floor(bottom + 0.5).astype('int32'))
    　　right = min(image.size[0], np.floor(right + 0.5).astype('int32'))
    　　print(label, (left, top), (right, bottom))  #边框

    　　if top - label_size[1] >= 0:  #标签文字
        　　text_origin = np.array([left, top - label_size[1]])
    　　else:
        　　text_origin = np.array([left, top + 1])

    　　# My kingdom for a good redistributable image drawing library.
    　　for i in range(thickness):   #画框
        　　draw.rectangle(
            　　[left + i, top + i, right - i, bottom - i],
            　　outline=self.colors[c])
    　　draw.rectangle(     #文字背景
        　　[tuple(text_origin), tuple(text_origin + label_size)],
        　　fill=self.colors[c])
    　　draw.text(text_origin, label, fill=(0, 0, 0), font=font)  #文案
    　　del draw

　　end = timer()
　　print(end - start)
　　return image

generate()在yolo.py第61行

def generate(self):
    model_path = os.path.expanduser(self.model_path)  #获取model路径
    assert model_path.endswith('.h5'), 'Keras model or weights must be a .h5 file.'  #判断model是否以h5结尾

    # Load model, or construct model and load weights.
    num_anchors = len(self.anchors)   #num_anchors = 9。yolov3有9个先验框
    num_classes = len(self.class_names)  #num_cliasses = 80。 #coco集一共80类
    is_tiny_version = num_anchors==6 # default setting is_tiny_version = False
    try:
        self.yolo_model = load_model(model_path, compile=False)   #下载model
    except:
        self.yolo_model = tiny_yolo_body(Input(shape=(None,None,3)), num_anchors//2, num_classes) \
            if is_tiny_version else yolo_body(Input(shape=(None,None,3)), num_anchors//3, num_classes)
        self.yolo_model.load_weights(self.model_path) # 确保model和anchor classes 对应
    else:
        assert self.yolo_model.layers[-1].output_shape[-1] == \     
       # model.layer[-1]:网络最后一层输出。 output_shape[-1]:输出维度的最后一维。 -> (?,13,13,255)
            num_anchors/len(self.yolo_model.output) * (num_classes + 5), \ 
       #255 = 9/3*(80+5). 9/3:每层特征图对应3个anchor box  80:80个类别 5:4+1,框的4个值+1个置信度
            'Mismatch between model and given anchor and class sizes'

    print('{} model, anchors, and classes loaded.'.format(model_path))

    # 生成绘制边框的颜色。
    hsv_tuples = [(x / len(self.class_names), 1., 1.)    
    #h(色调）：x/len(self.class_names)  s(饱和度）：1.0  v(明亮）：1.0 
                  for x in range(len(self.class_names))]
    self.colors = list(map(lambda x: colorsys.hsv_to_rgb(*x), hsv_tuples))   #hsv转换为rgb
    self.colors = list(
        map(lambda x: (int(x[0] * 255), int(x[1] * 255), int(x[2] * 255)),   
            self.colors))
   #hsv取值范围在【0,1】，而RBG取值范围在【0,255】，所以乘上255
    np.random.seed(10101)  # np.random.seed():产生随机种子。固定种子为一致的颜色
    np.random.shuffle(self.colors)  # 调整颜色来装饰相邻的类。
    np.random.seed(None)  #重置种子为默认

# Generate output tensor targets for filtered bounding boxes.
self.input_image_shape = K.placeholder(shape=(2, ))      #K.placeholder:keras中的占位符
if self.gpu_num>=2:
    self.yolo_model = multi_gpu_model(self.yolo_model, gpus=self.gpu_num)
boxes, scores, classes = yolo_eval(self.yolo_model.output, self.anchors,
        len(self.class_names), self.input_image_shape,
        score_threshold=self.score, iou_threshold=self.iou)    #yolo_eval():yolo评估函数
return boxes, scores, classes

def yolo_eval(yolo_outputs,      #模型输出，格式如下【（?，13,13,255）（?，26,26,255）（?,52,52,255）】 ?:bitch size; 13-26-52:多尺度预测； 255：预测值（3*（80+5））
              anchors,            #[(10,13), (16,30), (33,23), (30,61), (62,45), (59,119), (116,90), (156,198),(373,326)]
              num_classes,　　　　 # 类别个数，coco集80类
              image_shape,        #placeholder类型的TF参数，默认(416, 416)；
              max_boxes=20,       #每张图每类最多检测到20个框同类别框的IoU阈值，大于阈值的重叠框被删除，重叠物体较多，则调高阈值，重叠物体较少，则调低阈值
              score_threshold=.6, #框置信度阈值，小于阈值的框被删除，需要的框较多，则调低阈值，需要的框较少，则调高阈值；
              iou_threshold=.5):  #同类别框的IoU阈值，大于阈值的重叠框被删除，重叠物体较多，则调高阈值，重叠物体较少，则调低阈值

    """Evaluate YOLO model on given input and return filtered boxes."""

    num_layers = len(yolo_outputs)   #yolo的输出层数；num_layers = 3  -> 13-26-52

    anchor_mask = [[6,7,8], [3,4,5], [0,1,2]] if num_layers==3 else [[3,4,5], [1,2,3]]
  # default setting  #每层分配3个anchor box.如13*13分配到【6,7,8】即【（116,90）（156,198）（373,326）】

    input_shape = K.shape(yolo_outputs[0])[1:3] * 32   
  #输入shape(?,13,13,255);即第一维和第二维分别*32  ->13*32=416; input_shape:(416,416)

    boxes = []
    box_scores = []
    for l in range(num_layers):
        _boxes, _box_scores = yolo_boxes_and_scores(yolo_outputs[l],
            anchors[anchor_mask[l]], num_classes, input_shape, image_shape)
        boxes.append(_boxes)
        box_scores.append(_box_scores)
    boxes = K.concatenate(boxes, axis=0)    #K.concatenate:将数据展平 ->(?,4)
    box_scores = K.concatenate(box_scores, axis=0)   # ->(?,)

    mask = box_scores >= score_threshold  #MASK掩码，过滤小于score阈值的值，只保留大于阈值的值
    max_boxes_tensor = K.constant(max_boxes, dtype='int32')   #最大检测框数20
    boxes_ = []
    scores_ = []
    classes_ = []
    for c in range(num_classes):
        # TODO: use keras backend instead of tf.
        class_boxes = tf.boolean_mask(boxes, mask[:, c])    #通过掩码MASK和类别C筛选框boxes
        class_box_scores = tf.boolean_mask(box_scores[:, c], mask[:, c])    #通过掩码MASK和类别C筛选scores
        nms_index = tf.image.non_max_suppression(        #运行非极大抑制
            class_boxes, class_box_scores, max_boxes_tensor, iou_threshold=iou_threshold)
        class_boxes = K.gather(class_boxes, nms_index)     #K.gather:根据索引nms_index选择class_boxes
        class_box_scores = K.gather(class_box_scores, nms_index)   #根据索引nms_index选择class_box_score)
        classes = K.ones_like(class_box_scores, 'int32') * c    #计算类的框得分
        boxes_.append(class_boxes)
        scores_.append(class_box_scores)
        classes_.append(classes)

    boxes_ = K.concatenate(boxes_, axis=0)    
   #K.concatenate().将相同维度的数据连接在一起；把boxes_展平。  -> 变成格式:(?,4);  ?:框的个数；4：（x,y,w,h）

    scores_ = K.concatenate(scores_, axis=0)   #变成格式（?,）
    classes_ = K.concatenate(classes_, axis=0) #变成格式（?,）

    return boxes_, scores_, classes_




yolo_boxes_and_scores()在model.py的第176行

def yolo_boxes_and_scores(feats, anchors, num_classes, input_shape, image_shape):  
 # feats:输出的shape，->(?,13,13,255); anchors:每层对应的3个anchor box       
 # num_classes: 类别数（80）; input_shape:（416,416）; image_shape:图像尺寸

    '''Process Conv layer output'''

box_xy, box_wh, box_confidence, box_class_probs = yolo_head(feats,             
        anchors, num_classes, input_shape)
 #yolo_head():box_xy是box的中心坐标，(0~1)相对位置；box_wh是box的宽高，(0~1)相对值；
 #box_confidence是框中物体置信度；box_class_probs是类别置信度；

    boxes = yolo_correct_boxes(box_xy, box_wh, input_shape, image_shape)         
   #将box_xy和box_wh的(0~1)相对值，转换为真实坐标，输出boxes是(y_min,x_min,y_max,x_max)的值

    boxes = K.reshape(boxes, [-1, 4])                                               
   #reshape,将不同网格的值转换为框的列表。即（?,13,13,3,4）->(?,4)  ？：框的数目

    box_scores = box_confidence * box_class_probs                                    
    #框的得分=框的置信度*类别置信度

    box_scores = K.reshape(box_scores, [-1, num_classes])                          
    #reshape,将框的得分展平，变为(?,80); ?:框的数目
    return boxes, box_scores

yolo_head()在model.py的第122行

def yolo_head(feats, anchors, num_classes, input_shape, calc_loss=False):        #参数同上
   
 """Convert final layer features to bounding box parameters."""

num_anchors = len(anchors)          #num_anchors = 3

 # Reshape to batch, height, width, num_anchors, box_params.
anchors_tensor = K.reshape(K.constant(anchors), [1, 1, 1, num_anchors, 2])     #reshape ->(1,1,1,3,2)

    grid_shape = K.shape(feats)[1:3] # height, width  (?,13,13,255)  -> (13,13)


 #grid_y和grid_x用于生成网格grid，通过arange、reshape、tile的组合， 创建y轴的0~12的组合grid_y，再创建x轴的0~12的组合grid_x，将两者拼接concatenate，就是grid；
grid_y = K.tile(K.reshape(K.arange(0, stop=grid_shape[0]), [-1, 1, 1, 1]),       
        [1, grid_shape[1], 1, 1])
    grid_x = K.tile(K.reshape(K.arange(0, stop=grid_shape[1]), [1, -1, 1, 1]),
        [grid_shape[0], 1, 1, 1])
    grid = K.concatenate([grid_x, grid_y])
    grid = K.cast(grid, K.dtype(feats))   #K.cast():把grid中值的类型变为和feats中值的类型一样

    feats = K.reshape(                                                                            
        feats, [-1, grid_shape[0], grid_shape[1], num_anchors, num_classes + 5])
    #将feats的最后一维展开，将anchors与其他数据（类别数+4个框值+框置信度）分离

    # Adjust preditions to each spatial grid point and anchor size.  
   #xywh的计算公式，tx、ty、tw和th是feats值，而bx、by、bw和bh是输出值，如下图                            
    box_xy = (K.sigmoid(feats[..., :2]) + grid) / K.cast(grid_shape[::-1], K.dtype(feats))           
    box_wh = K.exp(feats[..., 2:4]) * anchors_tensor / K.cast(input_shape[::-1], K.dtype(feats))       
    box_confidence = K.sigmoid(feats[..., 4:5])
    box_class_probs = K.sigmoid(feats[..., 5:])   
    #sigmoid:σ  
    # ...操作符，在Python中，“...”(ellipsis)操作符，表示其他维度不变，只操作最前或最后1维；

    if calc_loss == True:
        return grid, feats, box_xy, box_wh
    return box_xy, box_wh, box_confidence, box_class_probs


yolo_correct_boxes()在model.py的第150行

def yolo_correct_boxes(box_xy, box_wh, input_shape, image_shape):    #得到正确的x,y,w,h
    '''Get corrected boxes'''
box_yx = box_xy[..., ::-1]                                           #“::-1”是颠倒数组的值
    box_hw = box_wh[..., ::-1]
    input_shape = K.cast(input_shape, K.dtype(box_yx))
    image_shape = K.cast(image_shape, K.dtype(box_yx))
    new_shape = K.round(image_shape * K.min(input_shape/image_shape))
    offset = (input_shape-new_shape)/2./input_shape
    scale = input_shape/new_shape
    box_yx = (box_yx - offset) * scale
    box_hw *= scale

    box_mins = box_yx - (box_hw / 2.)
    box_maxes = box_yx + (box_hw / 2.)
    boxes =  K.concatenate([
        box_mins[..., 0:1],           #y_min
        box_mins[..., 1:2],           #x_min
        box_maxes[..., 0:1],          #y_max
        box_maxes[..., 1:2]           #x_max
])

    # Scale boxes back to original image shape.
boxes *= K.concatenate([image_shape, image_shape])
    return boxes

　OK, that's all! Enjoy it!

参考：

https://blog.csdn.net/qq_14845119/article/details/80335225

https://www.cnblogs.com/makefile/p/YOLOv3.html

https://www.colabug.com/4125223.html

还没搞懂YOLO v7，YOLO v8已经来了！沃恩智慧目标检测深度学习计算机视觉
YOLO系列又双叒更新！只能说，YOLO系列发展地真快，已经有点跟不上了！YOLOv1-YOLOv8系列回顾YOLOv1：2015年JosephRedmon和AliFarhadi等人（华盛顿大学）YOLOv2：2016年JosephRedmon和AliFarhadi等人（华盛顿大学）YOLOv3：2018年JosephRedmon和AliFarhadi等人（华盛顿大学）YOLOv4：2020年Al
python实现yolo目标检测_目标检测|YOLO原理与实现 weixin_39709194
码字不易，欢迎给个赞！欢迎交流与转载，文章会同步发布在公众号：机器学习算法全栈工程师(Jeemy110)最新的YOLOv2和YOLOv3:小白将：目标检测|YOLOv2原理与实现(附YOLOv3)zhuanlan.zhihu.com前言当我们谈起计算机视觉时，首先想到的就是图像分类，没错，图像分类是计算机视觉最基本的任务之一，但是在图像分类的基础上，还有更复杂和有意思的任务，如目标检测，物体定位，
python写接口调用模型_对YOLOv3模型调用时候的python接口详解 weixin_39835607 python写接口调用模型
需要注意的是：更改完源程序.c文件，需要对整个项目重新编译、makeinstall，对已经生成的文件进行更新，类似于之前VS中在一个类中增加新函数重新编译封装dll，而python接口的调用主要使用的是libdarknet.so文件，其余在配置文件中的修改不必重新进行编译安装。之前训练好的模型，在模型调用的时候，总是在lib=CDLL("/home/*****/*******/darknet/li
YOLOv3在工业生产中产品瑕疵检测的可行性分析 Y.C.~ python 机器学习图像处理
图像中瑕疵检测1.概述瑕疵检测是机器视觉任务中的一条分支，在技术发展的过程中对于图片处理的方式往往使用CNN（卷积神经网络）作为处理模型，毫无疑问CNN的在处理图像方面有着独特的优势，通过设置卷积核我们可以使得计算机提取图像的特征数据，再通过延伸纵向的网络模型增加网络神经元的个数，可以很好地让网络模型识别图片中的内容，所以说CNN在图像分类和识别当中都有着很好的效果，在实践过程中也有着很不错的表现
交通领域当中的视觉识别算法若木胡交通数据探索算法
以下是一些交通领域中常见的视觉识别算法：目标检测算法YOLO系列：YouOnlyLookOnce（YOLO）算法以其快速高效的特点在交通领域得到广泛应用。它能够在一张图像中同时检测多个目标，并快速确定目标的位置和类别。例如，在车辆检测中，可以准确识别出道路上不同类型的车辆，如轿车、卡车、公交车等；在行人检测方面，能够实时检测出行人的位置和姿态，为自动驾驶车辆或交通监控系统提供重要信息。YOLOv3
深度学习YOLOv3压双黄线期末项目 yzx991013 giit YOLO
一、引言实现功能目录一、引言实现功能打开视频连续检测车辆能检测到道路中间的双黄线能检测出车辆是否压双黄线当车辆压到双黄线时给出提示要求使用多线程实现功能二、技术栈概览三、代码功能深度剖析视频文件选择功能（choosevideo函数）四、项目亮点提炼五、总结与展望1.打开视频2.连续检测车辆3.能检测到道路中间的双黄线4.能检测出车辆是否压双黄线5.当车辆压到双黄线时给出提示6.要求使用多线程实现功
Yolo-v3利用GPU训练make时发生错误：/usr/bin/ld: cannot find -lcuda 徐小妞66666
一.利用GPU训练Yolov3时，首先要修改MakeFile文件，修改格式如下：GPU=1(原来为0)CUDNN=1(原来为0)NVCC=/usr/local/cuda/bin/nvcc(新建,注意自己本机的地址)二.此时make产生错误/usr/bin/ld:cannotfind-lcuda1.查看MakeFile文件找到该行代码：LDFLAGS+=-L/usr/local/cuda/lib64
目标检测-YOLOv3 wydxry 深度学习目标检测 YOLO 深度学习
YOLOv3介绍YOLOv3(YouOnlyLookOnce,Version3)是YOLO系列目标检测模型的第三个版本，相较于YOLOv2有了显著的改进和增强，尤其在检测速度和精度上表现优异。YOLOv3的设计目标是在保持高速的前提下提升检测的准确性和稳定性。下面是对YOLOv3改进和优势的介绍，以及YOLOv3核心部分的代码展示。相比YOLOv2的改进与优势多尺度特征金字塔YOLOv3引入了FP
目标检测-YOLOv4 wydxry 深度学习目标检测 YOLO 目标跟踪
YOLOv4介绍YOLOv4是YOLO系列的第四个版本，继承了YOLOv3的高效性，并通过大量优化和改进，在目标检测任务中实现了更高的精度和速度。相比YOLOv3，YOLOv4在框架设计、特征提取、训练策略等方面进行了全面升级。它在保持实时检测的同时，显著提升了检测性能，尤其在复杂场景中的表现尤为出色。相比YOLOv3的改进与优势改进的Backbone(CSPDarknet-53)YOLOv4使用
来了，YoloV5的TensorFlow版开源半壶雪
开源自从yolov5开源以来，(不管因为啥原因)深受瞩目，我最近用tensorflow实现了其主要部分。可能是第一个纯正的tensorfow2版本，欢迎tryandstar：github.com/LongxingTan…之前在工作中接触过yolov3(跑过demo应该就算接触过了)，效果惊艳。我在视觉领域只是个新人(悲伤的是我一个中年人却在哪儿哪儿都TM是新人)，能力有限，疏漏难免。从头开始实现，
YOLO缺陷检测学习笔记（2） tt555555555555 YOLO 缺陷检测学习笔记 YOLO 学习笔记
YOLO缺陷检测学习笔记（2）残差连接1.**YOLO的残差连接结构**2.**YOLO使用残差连接的目的**3.**YOLO中的残差块**4.**YOLOv3和YOLOv4的残差连接架构**YOLO网络架构概述1.特征提取网络2.预测头（DetectionHead）3.后处理（Post-processing）YOLOv3/v4的改进YOLOv3YOLOv4SoftmaxSoftmax的性质：So
DNN学习平台（GoogleNet、SSD、FastRCNN、Yolov3）吾名招财人工智能 MFC界面应用 dnn opencv 神经网络
DNN学习平台（GoogleNet、SSD、FastRCNN、Yolov3）前言相关介绍1，登录界面：2，主界面：3，部分功能演示如下（1）识别网络图片（2）GoogleNet分类（3）人脸识别（4）SSD目标检测（5）FasterRCNN目标检测资源链接（含源码）前言还记得上学那会儿刚学完几个深度学习模型的C++简单部署应用，当时特别兴奋，外加那会儿还能自己写界面生成应用程序了，就想着做一个
YOLO系列目标检测数据集大全_yolo数据集(1) 2401_84187537 程序员 YOLO 目标检测人工智能
Darknet版YOLOv4猫狗识别训练好的权重文件：https://download.csdn.net/download/zhiqingAI/85541214Darknet版YOLOv3猫狗识别训练好的权重文件：https://download.csdn.net/download/zhiqingAI/85541209DeepSORT-YOLOv5猫狗检测和跟踪+可视化目标运动轨迹yolov7猫狗
目标检测 | yolov8 原理和介绍 hero_hilog 目标检测 AI YOLO 目标检测
相关系列：目标检测|yolov1原理和介绍目标检测|yolov2/yolo9000原理和介绍目标检测|yolov3原理和介绍目标检测|yolov4原理和介绍目标检测|yolov5原理和介绍目标检测|yolov6原理和介绍目标检测|yolov7原理和介绍目标检测|yolov8原理和介绍目标检测|yolov9原理和介绍目标检测|yolov10原理和介绍IEEE链接:https://ieeexplore
【计算机视觉面经四】基于深度学习的目标检测算法面试必备（RCNN~YOLOv5）旅途中的宽~ 计算机视觉面经总结计算机视觉深度学习目标检测 YOLO RCNN
文章目录一、前言二、两阶段目标检测算法2.1RCNN2.2Fast-RCNN2.3FasterR-CNN三、多阶段目标检测算法3.1CascadeR-CNN四、单阶段目标检测算法4.1编码方式4.1.1基于中心坐标4.1.1.1方案14.1.1.2方案24.1.1.3方案34.2YOLOv14.3SSD4.4YOLOv24.5RetinaNet4.6YOLOv34.7YOLOv44.8YOLOv5
深度学习||YOLO（You Only Look Once）深度学习的实时目标检测算法（YOLOv1~YOLOv5）小嘤嘤怪学深度学习算法目标检测
目录YOLOv1:YOLOv2:YOLOv3:YOLOv4:YOLOv5:总结：YOLO（YouOnlyLookOnce）是一系列基于深度学习的实时目标检测算法。自从2015年首次被提出以来，YOLO系列不断发展，推出了多个版本，包括YOLOv1,YOLOv2,YOLOv3,YOLOv4,和YOLOv5等。下面是对YOLO系列的详解：YOLOv1:提出时间:2015年。主要贡献:将目标检测任务转换
挑战杯 YOLOv7 目标检测网络解读 laafeer python
文章目录0前言1yolov7的整体结构2关键点-backbone关键点-head3训练4使用效果5最后0前言世界变化太快，YOLOv6还没用熟YOLOv7就来了，如果有同学的毕设项目想用上最新的技术，不妨看看学长的这篇文章，学长带大家简单的解读yolov7，目的是对yolov7有个基础的理解。从2015年的YOLOV1，2016年YOLOV2，2018年的YOLOV3，到2020年的YOLOV4、
yolov3-tiny HelloWorldQAQ。 CNN模型介绍自动驾驶深度学习神经网络
文章目录一、目标检测简介二、Yolov3-tiny2.1anchorbox2.2NMS算法三、后记一、目标检测简介针对一张图片，根据后续任务的需要，有三个主要层次。一是分类（Classification），即是将图像结构化为某一类别的信息，用事先确定好的类别或实例ID来描述图片，这一任务是最简单、最基础的图像理解任务，也是深度学习模型最先取得突破和实现大规模应用的任务。其中ImageNet是最权威
YOLO系列详解（YOLOV1-YOLOV3） X.AI666 深度学习 yolo
YOLO算法简介本文主要介绍YOLO算法，包括YOLOv1、YOLOv2/YOLO9000和YOLOv3。YOLO算法作为one-stage目标检测算法最典型的代表，其基于深度神经网络进行对象的识别和定位，运行速度很快，可以用于实时系统。了解YOLO是对目标检测算法研究的一个必须步骤。目标检测思路目标检测属于计算机视觉的一个中层任务，该任务可以细化为目标定位与目标识别两个任务，简单来说，找到图片中
AI助力农作物自动采摘，基于YOLOv3全系列【yolov3tiny/yolov3/yolov3spp】参数模型开发构建作物生产场景下番茄采摘检测计数分析系统 Together_CZ 人工智能 YOLO
去年十一那会无意间刷到一个视频展示的就是德国机械收割机非常高效自动化地24小时不间断地在超广阔的土地上采摘各种作物，专家设计出来了很多用于采摘不同农作物的大型机械，看着非常震撼，但是我们国内农业的发展还是相对比较滞后的，小的时候拔草是一个人一列蹲在地里就在那埋头拔草，不知道什么时候才能走到地的尽头，小块的分散的土地太多基本上都是只能人工手工来取收割，大点的连片的土地可以用收割机来收割，不过收割机基
如何用OpenCV加载Yolov5并使用CUDA加速 geekboys
1背景随着Pytorch、TensorFlow等有效的框架被用来深度的学习开发，各种任务的模型也层出不穷。但是大多的部署往往依赖签名的两个框架，需要前面的两个框架大量的库。而且先前的Yolov3和Yolov4有官方直接支持，可以自接加载weights和cfg文件。部署起来相对来说就很简单，但是最新的Yolov5确实基于Pytorch版本的，这使用Opencv部署起来就稍微的麻烦了。可以这时候我们希
在C++上如何使用OpenCV头文件是什么_用OpenCV的dnn模块调用yolov3模型 weixin_39785858
前言在实际应用场景，我们用darknet的GPU版本训练自己的数据，得到权值文件，然后我们可以调用训练的好的模型去实现自己的检测项目。一般情况下，我们可以使用opencv的dnn模块去调用yolov3。下面大致讲解一下如何是实现调用。一、环境准备1、编译好darknet的GPU版本。可参考我的文章https://zhuanlan.zhihu.com/p/1343471762、安装好opencv3.
C++ OpenCV-dnn模块调用模型进行目标检测（支持CUDA加速）枸杞叶儿经验笔记深度学习神经网络
前言OpenCV4.4开始支持YOLOv4模型的调用，需要使用Opencv的DNN模块。编译安装OpenCV和OpenCV-contrib库步骤，点此链接C++OpenCV调用YOLO模型的完整代码点此下载一、模型加载constexprconstchar*darknet_cfg="../face/yolov3-tiny.cfg";//网络文件constexprconstchar*darknet_w
Darknet yolov3 Makefile文件解析未完城 ubuntu deep-learning darknet linux makefile
文章目录1.darknetMakefile注释2.reference现在搞深度学习都在linux平台，经常遇到gcc手动编译的时候。由于linux平台没有通用的IDE，大家都是靠Makefile配置文件进行make。在学习darknet框架的过程中，决定要顺便搞清楚Makefile的写法和参数配置。Makefile完整的教程网上有很多，我暂时也不打算完整学一遍，仅仅把遇到的都搞懂，下次遇到新的东西
【从零开始学习YOLOv3】5. 网络模型的构建 pprpp
前言：之前几篇讲了cfg文件的理解、数据集的构建、数据加载机制和超参数进化机制，本文将讲解YOLOv3如何从cfg文件构造模型。本文涉及到一个比较有用的部分就是bias的设置，可以提升mAP、F1、P、R等指标，还能让训练过程更加平滑。1.cfg文件在YOLOv3中，修改网络结构很容易，只需要修改cfg文件即可。目前，cfg文件支持convolutional,maxpool,unsample,ro
python相对导入错误，ValueError: attempted relative import beyond top-level package aminghhhh python pycharm
在yolov3的文件中出现了类似的相对导入错误，同时类似的还有ValueError:attemptedrelativeimportnoparentpackage或者明明存在的.py文件报错说不存在，例如Modulenofound：utilsisnoamodle/XXXisnotamodle。。。这是由于在引入文件的时候相对导入的问题直接说解决方法：将相对导入改为绝对导入1.先右键点击package
经典目标检测YOLO系列(三)YOLOv3算法详解 undo_try #深度学习目标检测 YOLO python
经典目标检测YOLO系列(三)YOLOv3算法详解不论是YOLOv1，还是YOLOv2，都有一个共同的致命缺陷：小目标检测的性能差。尽管YOLOv2使用了passthrough技术将16倍降采样的特征图（即C4特征图）融合到了C5特征图中，但最终的检测仍是在C5尺度的特征图上进行的。为了解决这一问题，YOLO作者做了第3次改进，主要改进如下：使用了更好的主干网络DarkNet-53使用了多级检测与
经典目标检测YOLO系列(三)YOLOv3的复现(2)正样本的匹配、损失函数的实现 undo_try #深度学习目标检测 YOLO
经典目标检测YOLO系列(三)YOLOv3的复现(2)正样本的匹配、损失函数的实现我们在之前实现YOLOv2的基础上，加入了多级检测及FPN，快速的实现了YOLOv3的网络架构，并且实现了前向推理过程。经典目标检测YOLO系列(三)YOLOV3的复现(1)总体网络架构及前向处理过程我们继续进行YOLOv3的复现。1正样本匹配策略1.1基于先验框的正样本匹配策略官方YOLOv2的正样本匹配思路是根据
经典目标检测YOLO系列(三)YOLOV3的复现(1)总体网络架构及前向处理过程 undo_try #深度学习目标检测 YOLO 人工智能
经典目标检测YOLO系列(三)YOLOV3的复现(1)总体网络架构及前向处理过程和之前实现的YOLOv2一样，根据《YOLO目标检测》(ISBN:9787115627094)一书，在不脱离YOLOv3的大部分核心理念的前提下，重构一款较新的YOLOv3检测器，来对YOLOv3有更加深刻的认识。书中源码连接:RT-ODLab:YOLOTutorial1、YOLOv3网络架构1.1DarkNet53主
keras yolo v3调用笔记本本地摄像头实时监测 A大于_963a
最近在学习yolov3，下载了yolo的keras版本，按照工程里readme中将权重下载，运行Convert后，可以进行yolo的图像检测，图像检测命令：pythonyolo_video.py--image，然后在提示下输入图片路径即可实现本地图片检测。本地视频检测：pythonyolo_video.py--inputxxx.mp4即可实时检测本地视频。然后，想用笔记本的自带摄像头进行实时检测，
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To git@git.dianrong.com:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to 'git@git.dianron
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。

基于keras-yolov3，原理及代码细节的理解

你可能感兴趣的:(yolov3)