zscrane

windows系统下使用yolo3训练自己的数据集并进行物体检测测试

用yolo3对自己的数据集进行训练，查阅一些相关文章，发现都是使用老版本的文章，一些细节方面有很多改动，我在文章中会列出我遇到的一些新问题和一些老问题，在写训练步骤的同时多为大家列出一些常见问题。新手入门大神们多多指点。

如果是linux环境下可以访问参考文章
模型代码下载地址：
https://github.com/qqwweee/keras-yolo3
参考文章：
1.https://blog.csdn.net/m0_37857151/article/details/81330699
2.https://blog.csdn.net/patrick_Lxc/article/details/80615433

一、下载项目源码，进行快速测试

进入模型代码网址，下载源码目录到本地，根据github作者的指导完成快速测试，由于现在新代码跟老本版不一样了，相关命令有些许的改动。

1.步骤一让去yolo官网下载一个权重文件：https://pjreddie.com/media/files/yolov3.weights，文件200多M，如果没有VPN下载速度慢的话可以从这里下载:https://pan.baidu.com/s/15NsB5hbwa_N-eJ6-sNwgLw 提取码：kj44 。
2.下载好weight权重文件后放入在github上下载的keras-yolo3-master文件夹下，执行convert.py文件，用于将权重文件转为 .h5格式的文件，生成的h5将被保存在model_data目录下。在当前目录下打开终端并输入命令：

python convert.py yolov3.cfg yolov3.weights model_data/yolo.h5

3.用生成好的.h5文件进行目标检测。
a:如果对图片进行测试，输入命令，运行后会让你在终端上输入图片路径：

python yolo_video.py --image

b:如果要对视频进行测试，直接输入命令：

python3 yolo_video.py --input=原视频地址 --output=新生成地址

+++++++++++++++++++++++++++++++++++++++++++++++++分割线
贴个效果图：

二、用自己的数据集训练自已的模型

文章开头列出的参考文章是使用了VOC2007数据集的格式，新手不用在意是否使用什么VOC格式，之所以用这个本质是为减少对源代码的修改量，就算自己创建几个文件夹也无所谓，无非就是在代码中修改目录罢了。

我们创建的文件夹，第一Annotations是储存标注后的xml文件，第二ImageSets/Main是存储生成所需文本文件，第三JPEGImages是存储图片，第四个model_data储存我们的classes和最终生成的.h5文件，第五个yolo3是在githup下载模型中的文件夹，没有改动，直接复制过来就好，后面其它的文件也是模型中复制过来或者后文中贴出的代码。

注：为了少改代码大家可以参考我的VOC2007目录,跟原版本格式有删减，剔除了没用的部分：

第一步：创建JPEGImages文件夹，将你要训练的图片放到JPEGImages中。

第二步：闯将Annotations文件夹，将你标注所生成的xml文件放到Annotations文件夹中。如果不知道怎么标注的童鞋们点击蓝色字体：讲述如何标注的文章

第三步：创建ImageSets/Main文件夹，这个文件夹用来储存我们的对数据集进行训练和验证拆分后的文本。

第四步：对我们的数据集进行分类，分成train.txt和val.txt。
复制以下代码至根目录VOC2007下，命名convert_to_txt.py

import os
import random

trainval_percent = 0.1
train_percent = 0.9
xmlfilepath = 'Annotations'
txtsavepath = 'ImageSets\Main'
total_xml = os.listdir(xmlfilepath)

num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)

ftrainval = open('ImageSets/Main/trainval.txt', 'w')
ftest = open('ImageSets/Main/test.txt', 'w')
ftrain = open('ImageSets/Main/train.txt', 'w')
fval = open('ImageSets/Main/val.txt', 'w')

for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftest.write(name)
        else:
            fval.write(name)
    else:
        ftrain.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

此代码在上述参考文章中都有，该目录的朋友注意下目录地址，按本文创建的目录不需要删减。
运行后在ImageSets/Main目录下生成4个txt文本：

第五步：将生成的txt文本重新整理生成我们yolo3模型需要的txt格式，就是把图片的文件名和xml文件中box的坐标融合在一起。运行voc_annotation.py文件，注意这里面是要进行修改的：

import xml.etree.ElementTree as ET
from os import getcwd

sets=[('2007', 'train'), ('2007', 'val'), ('2007', 'test')]

classes = [‘car’,'person','bus']


def convert_annotation(year, image_id, list_file):
    in_file = open('Annotations/%s.xml'%( image_id))
    tree=ET.parse(in_file)
    root = tree.getroot()

    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult)==1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (int(xmlbox.find('xmin').text), int(xmlbox.find('ymin').text), int(xmlbox.find('xmax').text), int(xmlbox.find('ymax').text))
        list_file.write(" " + ",".join([str(a) for a in b]) + ',' + str(cls_id))

wd = getcwd()

for year, image_set in sets:
    image_ids = open('ImageSets/Main/%s.txt'%(image_set)).read().strip().split()
    list_file = open('%s.txt'%(image_set), 'w')
    for image_id in image_ids:
        list_file.write('JPEGImages/%s.jpg'%(image_id))
        convert_annotation(year, image_id, list_file)
        list_file.write('\n')
    list_file.close()

注意：
1.第6行的 classes 改成你们自己的类
2.第10，27，30行的目录是否是自己的目录
3.我与原文的目录稍加不同，如果完全按照本文目录生成的直接复制上面代码
4.新生成的txt内容是这个样子的！！！！！！！

第六步：创建model_data文件夹，并生成voc_classes.txt，里面填写的是你的classes。

第七步：修改train.py文件。为什么修改呢？在参考文章中说到：因为原作者的代码中会加载预先对coco数据集已经训练完成的yolo3权重文件，我们不需要预加载他以前训练过的权重，我们要训练自己的模型，所以我们剔除掉原文中没用的东西。下面贴出修改后的train.py，我也是在参考文章中直接复制的，谢谢这些大哥们的代码。

"""
Retrain the YOLO model for your own dataset.
"""
import numpy as np
import keras.backend as K
from keras.layers import Input, Lambda
from keras.models import Model
from keras.callbacks import TensorBoard, ModelCheckpoint, EarlyStopping

from yolo3.model import preprocess_true_boxes, yolo_body, tiny_yolo_body, yolo_loss
from yolo3.utils import get_random_data


def _main():
    annotation_path = 'train.txt'
    log_dir = 'logs/000/'
    classes_path = 'model_data/voc_classes.txt'
    anchors_path = 'model_data/yolo_anchors.txt'
    class_names = get_classes(classes_path)
    anchors = get_anchors(anchors_path)
    input_shape = (416, 416)  # multiple of 32, hw
    model = create_model(input_shape, anchors, len(class_names))
    train(model, annotation_path, input_shape, anchors, len(class_names), log_dir=log_dir)


def train(model, annotation_path, input_shape, anchors, num_classes, log_dir='logs/'):
    model.compile(optimizer='adam', loss={
        'yolo_loss': lambda y_true, y_pred: y_pred})
    logging = TensorBoard(log_dir=log_dir)
    checkpoint = ModelCheckpoint(log_dir + "ep{epoch:03d}-loss{loss:.3f}-val_loss{val_loss:.3f}.h5",
                                 monitor='val_loss', save_weights_only=True, save_best_only=True, period=1)
    batch_size = 10
    val_split = 0.1
    with open(annotation_path) as f:
        lines = f.readlines()
    np.random.shuffle(lines)
    num_val = int(len(lines) * val_split)
    num_train = len(lines) - num_val
    print('Train on {} samples, val on {} samples, with batch size {}.'.format(num_train, num_val, batch_size))

    model.fit_generator(data_generator_wrap(lines[:num_train], batch_size, input_shape, anchors, num_classes),
                        steps_per_epoch=max(1, num_train // batch_size),
                        validation_data=data_generator_wrap(lines[num_train:], batch_size, input_shape, anchors,
                                                            num_classes),
                        validation_steps=max(1, num_val // batch_size),
                        epochs=100,
                        initial_epoch=0)
    model.save_weights(log_dir + 'trained_weights.h5')


def get_classes(classes_path):
    with open(classes_path) as f:
        class_names = f.readlines()
    class_names = [c.strip() for c in class_names]
    return class_names


def get_anchors(anchors_path):
    with open(anchors_path) as f:
        anchors = f.readline()
    anchors = [float(x) for x in anchors.split(',')]
    return np.array(anchors).reshape(-1, 2)


def create_model(input_shape, anchors, num_classes, load_pretrained=False, freeze_body=False,
                 weights_path='model_data/yolo_weights.h5'):
    K.clear_session()  # get a new session
    image_input = Input(shape=(None, None, 3))
    h, w = input_shape
    num_anchors = len(anchors)
    y_true = [Input(shape=(h // {0: 32, 1: 16, 2: 8}[l], w // {0: 32, 1: 16, 2: 8}[l], \
                           num_anchors // 3, num_classes + 5)) for l in range(3)]

    model_body = yolo_body(image_input, num_anchors // 3, num_classes)
    print('Create YOLOv3 model with {} anchors and {} classes.'.format(num_anchors, num_classes))

    if load_pretrained:
        model_body.load_weights(weights_path, by_name=True, skip_mismatch=True)
        print('Load weights {}.'.format(weights_path))
        if freeze_body:
            # Do not freeze 3 output layers.
            num = len(model_body.layers) - 3
            for i in range(num): model_body.layers[i].trainable = False
            print('Freeze the first {} layers of total {} layers.'.format(num, len(model_body.layers)))

    model_loss = Lambda(yolo_loss, output_shape=(1,), name='yolo_loss',
                        arguments={'anchors': anchors, 'num_classes': num_classes, 'ignore_thresh': 0.5})(
        [*model_body.output, *y_true])
    model = Model([model_body.input, *y_true], model_loss)
    return model


def data_generator(annotation_lines, batch_size, input_shape, anchors, num_classes):
    n = len(annotation_lines)
    np.random.shuffle(annotation_lines)
    i = 0
    while True:
        image_data = []
        box_data = []
        for b in range(batch_size):
            i %= n
            image, box = get_random_data(annotation_lines[i], input_shape, random=True)
            image_data.append(image)
            box_data.append(box)
            i += 1
        image_data = np.array(image_data)
        box_data = np.array(box_data)
        y_true = preprocess_true_boxes(box_data, input_shape, anchors, num_classes)
        yield [image_data, *y_true], np.zeros(batch_size)


def data_generator_wrap(annotation_lines, batch_size, input_shape, anchors, num_classes):
    n = len(annotation_lines)
    if n == 0 or batch_size <= 0: return None
    return data_generator(annotation_lines, batch_size, input_shape, anchors, num_classes)


if __name__ == '__main__':
    _main()

直接运行train.py就可以了，至此训练步骤结束。其中有一些运行问题我将在文章末尾写出来，大家可以先看看在进行训练，避免做无用功！！！

三、使用生成好的模型文件来预测

我是用1080ti 11G显存跑的，其中bitch_size=10 epochs=80,训练了6个小时，loss训练到30。参考文章中说loss训练到10就可以了，我实在懒得等的就先凑活用了。我先说下步骤。

第一步：可以根据第一章的内容，快速测试！！！！！！

第二步：用原文中的方式得一张一张图片输入路径太慢了，我对代码进行了修改，批量对图片进行测试。
->先创建一个pic文件，里面储存待测试图片。在生成一个res文件，储存测试结果。

->将新建yolo_image.py文件，直接复制下面代码：

import time
import argparse
from yolo import YOLO, detect_video
from PIL import Image
import os

def detect_img(yolo):
    filename = os.listdir('pic')
    for i in filename:
        img = f"pic/{i}"
        try:
            image = Image.open(img)
        except:
            print('Open Error! Try again!')
            continue
        else:
            r_image = yolo.detect_image(image)
            r_image.save(f'res/{i}')
    yolo.close_session()



if __name__ == '__main__':
    print("=========================开始预测===============================")
    start = time.time()
    parser = argparse.ArgumentParser(argument_default=argparse.SUPPRESS)
    '''
    Command line options
    '''
    parser.add_argument(
        '--model', type=str,
        help='path to model weight file, default ' + YOLO.get_defaults("model_path")
    )

    parser.add_argument(
        '--anchors', type=str,
        help='path to anchor definitions, default ' + YOLO.get_defaults("anchors_path")
    )

    parser.add_argument(
        '--classes', type=str,
        help='path to class definitions, default ' + YOLO.get_defaults("classes_path")
    )

    parser.add_argument(
        '--gpu_num', type=int,
        help='Number of GPU to use, default ' + str(YOLO.get_defaults("gpu_num"))
    )

    parser.add_argument(
        '--image', default=False, action="store_true",
        help='Image detection mode, will ignore all positional arguments'
    )
    '''
    Command line positional arguments -- for video detection mode
    '''
    parser.add_argument(
        "--input", nargs='?', type=str,required=False,default='./path2your_video',
        help = "Video input path"
    )

    parser.add_argument(
        "--output", nargs='?', type=str, default="",
        help = "[Optional] Video output path"
    )

    FLAGS = parser.parse_args()
    detect_img(YOLO(**vars(FLAGS)))
    end =  time.time()
    t = end-start
    print('用时：',int(t),'s')

直接运行 yolo_image.py，结果直接在res文件中查看即可。
++++++++++++++++++++++++++++++++++++++++++++分割线
贴测试效果图：

2600张数据集，训练时间6小时，loss=30，训练时间太短效果一般，识别效果时有时无。

四、训练过程中的问题及注意事项

1.在训练自己的数据集之前，执行train.py之前，先在目录下创建logs/000文件夹，否则训练几个小时后，在完成的那一刻报错！！！！太坑了这个问题！
OSError: Unable to open file

2.我分别用1080ti 11g和2080 8g显卡跑，1080ti可以直接跑，但是2080跑回报显存不足的错误，这个错误我们先从模型本身入手，先将train.py中bitch_size值改小，最好先改成1，然后我在运行，依然会报显存不足。
tensorflow.python.framework.errors_impl.InternalError: Blas SGEMM launch failed : m=43264, n=32, k=64
[[{{node conv2d_3/convolution}}]]
[[{{node loss/add_74}}]]

然后我觉得8G显存足够了，用faster-rcnn和ssd都没问题，我在想会不会是因为显存一下被占用满导致显卡运行有问题，然后我在yolo3文件夹中的model.py中添加了限制gpu使用的代码：

os.environ["CUDA_VISIBLE_DEVICES"] = "0"
config = tf.ConfigProto()
config.gpu_options.allow_growth = True
config.gpu_options.per_process_gpu_memory_fraction = 0.8
set_session(tf.Session(config=config))

此时bitch_size=1,完美执行。然后又一点点试，bitch_size设置为5都没有问题。
3.以上是两个让我比较深刻的问题，还有一些问题暂且想不起来，如果有人提问我将问题写在这里。或者去参考文章下看看提问兴许对你们有帮助。

手撕yolo3系列——详解train训练代码（详细注释）识久 pytorch 目标检测深度学习深度学习神经网络人工智能
完整代码百度云直达链接（包含预训练权重）(小白注释)https://pan.baidu.com/s/1US6e93OaCYOghmF21v0UIA提取码：z8at参考链接【注】代码是大神的代码，在此基础上添加了详细的小白注释，方便我以后阅读。上一节：详解yolo3整体网络代码本节代码所在文件pytorch_yolo3/train.py主程序pytorch_yolo3/nets/yolo_train
【深度学习】Anaconda3 + PyCharm 的环境配置 5：手把手带你运行 predict.py 文件，史上最全的问题解决记录作者正在煮茶深度学习人工智能 python pytorch
前言文章性质：实操记录主要内容：主要记录了运行predict.py文件时遇到的错误以及相应的解决方案。项目源码：GitHub-SZU-AdvTech-2022/213-Rethinking-Image-Restoration-for-Object-Detection相关文档：睿智的目标检测26：Pytorch搭建yolo3目标检测平台冷知识+1：小伙伴们不经意的点赞与收藏✨可以让作者更有创作动力！
【深度学习】Anaconda3 + PyCharm 的环境配置 4：手把手带你运行 train.py 文件，史上最全的问题解决记录作者正在煮茶深度学习人工智能 pytorch python
前言文章性质：实操记录主要内容：主要记录了运行train.py文件时遇到的错误以及相应的解决方案。项目源码：GitHub-SZU-AdvTech-2022/213-Rethinking-Image-Restoration-for-Object-Detection相关文档：睿智的目标检测26：Pytorch搭建yolo3目标检测平台冷知识+1：小伙伴们不经意的点赞与收藏✨可以让作者更有创作动力！目录
目标检测YOLO3笔记1 BKXjilu 目标检测目标跟踪人工智能
目录目标检测实现效果：目标检测的实现思路：如何划分候选区？基础知识：YOLO3基本思想：思考与总结：怎么产生候选区域？怎么比较出正样本负样本？怎么设置类别标签？Anchor是固定的，模型怎么进行Anchor的调整，输出预测框？算法预测流程图：网络结构：思考与总结：(NMS)非极大值抑制：作用：怎么实现？怎么判断多个预测框预测同一个物体？Iou:NMS:（学习资料：飞桨AIStudio星河社区-人工
yolo v3 ca8519be679b
小白怎么实现进阶yolov3，什么都不说，先玩玩看效果才是重点github原文链接https://github.com/qqwweee/keras-yolo3把文件download下来解压，然后从这里https://pjreddie.com/media/files/yolov3.weights下载yolo3的weights数据，丢到上一步解压文件中然后在文件夹shift右键再此打开命令行，输入py
YOLO1、YOLO2、YOLO3对比纸上得来终觉浅～图像处理 YOLO1 YOLO2 YOLO3
YOLO详解参见地址：YOLO1：https://blog.csdn.net/qq_32172681/article/details/99418000YOLO2：https://blog.csdn.net/qq_32172681/article/details/99482044YOLO3：https://blog.csdn.net/qq_32172681/article/details/99595
Permission denied:的解决办法（windows系统) 踩坑专业户报错处理
在跑yolo3的tain的代码时遇到了一下问题，Permissiondenied:'D:\yolo3-keras’的报错提示，如图检查后发现，我的yolo-huawei文件是由我的yolo3-keras文件复制而来的，是作为副本的，所以就会受到原文件yolo3-keras的阻止，因为yolo-huawei是没有该项权限的，之后我在原文件中跑就没有这样的问题了。如果是linux的系统的话还可以用su
一文搞定YOLO3训练自己的数据集小鹏聊智驾 2D目标检测深度学习目标检测 YOLO
文章目录前言1制作自己的数据集2安装darknet3建立软链接4训练文件准备5训练数据集6验证模型6.1loss曲线图6.2计算AP和mAP7批量测试模型前言本文默认大家已经安装好TF-gpu环境，没有安装好的伙伴请先看下文一文多图搞定Ubuntu安装Anaconda+GPUDriver+CUDA+CUDNN+TensorFlow-gpu+Pytorch(附网盘链接)1制作自己的数据集利用labe
目标检测网络系列——YOLOV3 新兴AI民工图像深度网络经典论文详解目标检测网络 YOLO yolov3 darknet
文章目录YOLO3的改进点针对区域中包含重叠物体的改进ClassPredictionBoundingBoxPrediction更牛逼的网络结构：Dartnet53多尺度预测性能其他工作YOLOV3的论文篇幅比较短，感觉比较随意，和一般论文最大的区别就是把对比实验去掉了，在摘要和论文的最后说到YOLO3是一个好的目标检测网络就没有了。但是YOLO3确实是一个非常牛逼的网络，以至于YOLO3的官网上的
Pytorch+Yolov3搭建自己的目标检测项目工程（带你从理论到实践）夏天是冰红茶目标检测 pytorch YOLO 目标检测
学习目标使用pytorch去构建一个Yolov3的项目工程。参考的原作者的博客：睿智的目标检测26——Pytorch搭建yolo3目标检测平台构建主干网络darknet53yolov3采用的主干网络是darknet53，借鉴了yolov2中的网络darknet19结构，相较于后者，前者加入了大量的残差模块，并且使用了步长为2，卷积核大小为3×3卷积层Conv2D替代池化层Maxpooling2D，
使用coco数据集训练自己的yolo3网络 papaofdoudou 嵌入式系统 Linux pytorch 深度学习神经网络
coco数据集的全称是MSCOCO(MicrosoftCommonObjectsinContext),起源于微软2014年出资标注的MicrosoftCOCO数据集，COCO是当前目标识别，检测领域最重要，最权威的一个标杆。yolo3网络物体的检测搭建好后，用预训练好的权重测试推理功能：现在我们用coco数据库训练自己的网络：获取coco数据要下载COCO数据和标签，darknet下scripts
yolo系列之yolo v3 叫我老村长
yolo系列之yolov3【深度解析】让你彻底了解YOLO3先分析一下yolo_v3上保留的东西：“分而治之”，从yolo_v1开始，yolo算法就是通过划分单元格来做检测，只是划分的数量不一样。采用"leakyReLU"作为激活函数。端到端进行训练。一个lossfunction搞定训练，只需关注输入端和输出端。从yolo_v2开始，yolo就用batchnormalization作为正则化、加速
YOLO学习-YOLO3测试错误 Relly-Lee YOLO YOLO
darknet.exe停止工作原因：在测试时使用的网络图片尺寸应该修改为256*256（与训练数据保持一致）
深度学习和OpenCV的对象检测(MobileNet SSD图像识别) 人工智能研究所人工智能之计算机视觉深度学习 opencv 人工智能
基于深度学习的对象检测时，我们主要分享以下三种主要的对象检测方法：FasterR-CNN(后期会来学习分享)你只看一次（YOLO，最新版本YOLO3,后期我们会分享）单发探测器（SSD，本节介绍，若你的电脑配置比较低，此方法比较适合R-CNN是使用深度学习进行物体检测的训练模型;然而，这种技术很难理解,难以实施，并且难以训练。如果我们只追求速度，那么我们倾向于使用YOLO，因为这个算法要快得多，但
海思 3559 SVP NNIE demo解读 ztono 深度学习海思深度学习
海思3559SVPNNIEdemo解读图片处理——yolo3为例1.先看函数voidSAMPLE_SVP_NNIE_Yolov3(void)-部分1HI_CHAR*pcSrcFile="./data/nnie_image/rgb_planar/dog_bike_car_416x416.bgr";HI_CHAR*pcModelName="./data/nnie_model/detection/ins
yolo3解析迷途的Go
yolov3解析yolo系列论文看过，源码包调过，抽点时间把论文理解和源码做个一一对应，加深理解，论文https://pjreddie.com/darknet/yolo/源码看的mxnet,gluon-cv,代码地址：https://github.com/dmlc/gluon-cvyolov3networkdarknet53一共53层卷积，除去最后一个FC总共52个卷积用于当做主体网络，主体网络被
yolo3 入手必看[巨详细] 绮怀先生
yolo训练总结上一年总结的旧文章,也许对新接触yolo的有点帮助.数据生成via网页标注的数据需要经过一系列转换,才能适配yolo的训练,主要步骤包括如下:根据标注json生成每一张图片的标注label:xxx.txtxxx.txt格式(数值都是除以图片实际宽高保存的):类名box矩形中心x坐标box矩形中心y坐标box矩形宽box矩形高image同时会将图片压缩成1536,保存到image文件
darknet-yolov3环境搭建陈德良EGG
操作系统：Windows10IDE：PycharmPython：3.6.2且已安装好tensorflow,keras，pyqt5,lxml包二、快速使用yolo3预测图片keras-yolo3源代码,下载到本地后用Pycharm打开。初始权重文件，在QQ群文件中，下载好后放在上述文件keras-yolo3一级目录下。命令行中执行如下命令将darknet下的yolov3配置文件转换成keras适用的
解决yolo3目标检测训练过程中train.py运行问题网创学长目标检测目标跟踪人工智能
yolo3是一种广泛使用的目标检测算法，它在计算机视觉领域具有很高的准确率和性能。然而，在使用yolo3进行目标检测训练时，有时会出现train.py运行问题。本文将探讨如何解决这个问题。首先，让我们了解一下训练过程中可能遇到的常见问题：缺少依赖项：运行train.py之前，请确保您安装了所有所需的依赖项，并且版本与要求相匹配。常见的依赖项包括Python、CUDA、CUDNN、OpenCV等。请
如何在Pycharm中复现别人pytorch的项目实例 carrymingteng Pytorch python anaconda pytorch pycharm
如何在Pycharm中复现别人pytorch的项目实例（Windows下Pycharm配置Pytorch环境）问题描述：学习如何在pytorch框架下用yolo3训练自己的模型时，将别人的整个项目文件夹下载后，无法在Pycharm中运行解决：1.在Pycharm中新建一个工程文件夹File→NewProject2.在出现的对话框中，勾选到Existinginterpreter，点击…3.在AddP
项目1新知识 Rondox 深度学习人工智能
1.dict()创建一个字典={}2."tiny"inmodel_arch字符串是否在字符串中3.img_size=416yolo3的数据集处理也是一大亮点，由于yolo3对数据集的输入有要求，指定的照片输入大小必须是416，所有对于不满足照片的大小有一系列的操作，如果直接resize操作，将直接损失照片信息，网络在学习分类的过程还要适应照片尺寸的问题，导致训练效果不佳，在yolo3中是先进行高和
YOLOv3网络残剑天下论
YOLOv3没有太多的创新，主要是借鉴一些好的方案融合到YOLO里面。不过效果还是不错的，在保持速度优势的前提下，提升了预测精度，尤其是加强了对小物体的识别能力。YOLO3主要的改进有：调整了网络结构；利用多尺度特征进行对象检测；对象分类用Logistic取代了softmax。一、Backbone:darknet-53为了达到更好的分类效果，作者自己设计训练了darknet-53。作者在Image
基于Yolo3_deep_sort的目标追踪(原理及部分代码说明) --- 已解决喵喵love 目标追踪深度学习
基于Yolo3_Deep_sort的多目标追踪算法原理及部分代码说明写在前面的话：楼主前一段时间参与了一个小项目，是关于人的目标追踪，在此记录一下，这篇博文主要是记录一下对这个方法的认识和理解，希望能引起你的共鸣。如果想看具体的测试环境搭建及复现说明，请查看我的另一篇博客，传送门。将Yolo3与Deep_sort相结合，相当于目标检测中的Twostages的结构，采用detection（Yol
毕业设计记录-尝试修改NMS中的IOU算法芃芃です毕业设计记录算法深度学习目标检测 python
文章目录2022.1.15的记录2022.1.15的记录yolo3的损失函数讲解yolov5的损失函数的几点理解IOU、GIOU、CIOU、DIOUNMS非常感谢发布上面文章的博主，帮助太大了。本当にありがとうございました❕助かりました❕按照老师提供的论文，将yolov5的NMS中的IOU改为DIOU，修改文件为general.py。虽然改的对不对还不确定。等后天matlab的2w张图的训练集生成
（读Yolo3源码发现的不会的函数）Pytorch常用函数记录-pretrained-torch.nn.Upsample()函数-torch.cat-a.permute-a.view()等小馨馨的小翟笔记 pytorch 深度学习 cnn python
1、pretrained=False我们经常会在pytorch的代码中看到这个参数，可以设置为True，也可以设置为False.事实上这个参数常见于迁移学习的代码中，如果设置为True，则是启动下载预训练模型。如果设置为False，则是不下载预训练模型，我们一般喜欢提前手动下载好，放置到相应的路径，因为一般设置为False。2、torch.nn.Upsample()函数实现上采样importtor
关于第一次深度学习项目的总结 hands_up_down 深度学习目标检测人工智能
这是第一次从头开始操作一个深度学习项目，从数据预处理，model设计，搭建，训练，调参，基本上整个流程都走了一遍半年之前我将计算机视觉几个任务的主要模型都熟悉了，像分类任务的vgg,alexnet,目标检测的YOLO系列，SSD，RCNN，语义分割的Unet，FCN。在此之后，我要求具备深度网络的设计和实现能力。在复现了全卷积网络unet和yolo3之后，我想可以进入一个新的领域检验我所学习到的东
关于yolo3的学习 hands_up_down 深度学习 tensorflow 人工智能
https://www.bilibili.com/video/BV1Vg411V7bJhttps://www.bilibili.com/video/BV1Vg411V7bJyolo3的性能以0.5为步长，计算IoU从0.5到0.95的map.yolo3在速度上确实是一骑绝尘，在准确度上也在可接受的范围内在IoU=0.5,大分辨率输入的前提下，yolo3就是一个又快又准的模型了，是一个非常恐怖的存在
win10 下darknet+yolo(gpu版本）安装配置争渡！怎渡？ cuda opencv tensorflow 深度学习机器学习
Win10配置yolo3详细教程，亲试可行废话懒得说，直接上干货以下安装路径不要出现中文以下安装路径不要出现中文以下安装路径不要出现中文1.安装CUDA和cuDNN参考之前的文章，传送门2.编译器Vs2015由于版本的关系，强烈推荐安装使用vs编译。安装过程中必须要注意的地方：必须勾选V14，V14，V14PS,小伙伴说了，俺是vs2017，难道要卸掉重装vs2015吗？其实不用的。咱就是走的这条
ModuleNotFoundError: No module named ‘cv2‘解决方法 qq_39136248 pycharm 目标检测 python opencv
我遇到这个错误是在做YOLO3目标检测的时候，安装anaconda+tensorflow+pycharm后，pycharm命令终端提示ModuleNotFoundError:Nomodulenamed'cv2'我把网上几乎所有方法都试过，包括：condainstallopencvpipinstallopencv-pythonpipinstallopencv-contrib-python都不行我的解
Pytorch搭建yolo3目标检测平台 beihangzxm123 pytorch与目标检测深度学习 python
学习前言源码下载yolo3实现思路一、预测部分1、主题网络darknet53介绍2、从特征获取预测结果3、预测结果的解码4、在原图上进行绘制二、训练部分1、计算loss所需参数2、pred是什么3、target是什么。4、loss的计算过程训练自己的yolo3模型学习前言一起来看看yolo3的Pytorch实现吧，顺便训练一下自己的数据。源码下载https://github.com/bubblii
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

windows系统下使用yolo3训练自己的数据集并进行物体检测测试

windows系统下使用yolo3训练自己的数据集并进行物体检测测试

一、下载项目源码，进行快速测试

二、用自己的数据集训练自已的模型

三、使用生成好的模型文件来预测

四、训练过程中的问题及注意事项

你可能感兴趣的:(yolo3)