EdenJin

2.1【YoloV3--pytorch】Part One：基于Pytorch的YoloV3训练自己的数据集----准备数据集、配置文件并下载预训练权重文件

之前整理了基于tensorflow的Yolov3训练自己的数据集的相关步骤，奈何最近的一个课程实验要求必须使用pytorch架构的yolov3，so整理一波。

参考blog：
【YoloV3–tensorflow】Part one ---- 目标检测实战：用YOLOV3训练自建的数据集
【YoloV3–tensorflow】Part two ---- Ubuntu16.04：opencv调用yolov3训练后的模型进行目标检测

一、数据集准备及配置文件

1.1 下载源码并配置环境

源码github地址：ultralytics-yolov3

打开官方的requirements.txt如下：

# pip install -U -r requirements.txt
numpy
opencv-python >= 4.1
torch >= 1.5
matplotlib
pycocotools
tqdm
pillow
tensorboard >= 1.14

# Nvidia Apex (optional) for mixed precision training --------------------------
# git clone https://github.com/NVIDIA/apex && cd apex && pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" . --user && cd .. && rm -rf apex

# Conda commands (in place of pip) ---------------------------------------------
# conda update -yn base -c defaults conda
# conda install -yc anaconda numpy opencv matplotlib tqdm pillow ipython
# conda install -yc conda-forge scikit-image pycocotools tensorboard
# conda install -yc spyder-ide spyder-line-profiler
# conda install -yc pytorch pytorch torchvision
# conda install -yc conda-forge protobuf numpy && pip install onnx  # https://github.com/onnx/onnx#linux-and-macos

按照官方配置要求进行配置即可，在源码的github主页上，作者指出python版本要求3.7+，本人所使用的python版本是3.6.5，亲测可用；除此之外需要注意的是torchvision这个模块，torchvision的版本必须与torch版本匹配，否则会产生错误。
如果不确认如何安装对应的torchvision版本，请参考该网址：https://pytorch.org/get-started/locally/，界面如下

可根据自己的实际环境选择橙红色的选项，会在最后Run the Command选项那里生成可直接运行的终端命令，直接复制到终端运行即可。通过这种方法安装的torch和torchvision一定是相匹配的。本人之前使用pyharm搭建的虚拟环境，从charm中安装下载管理包，尽管版本号对应，但依然存在问题，使用这种方法问题迎刃而解。

1.2 制作文件格式，生成训练测试文本数据

Step1：

$\color{red}{在./data文件夹下新建Annotations、JPEGImages文件夹}$ ，使用labelimage标注工具进行标注，设置好保存文件路径。

之前的blog已经详细记录了自制数据集的流程以及相关详细的参考资料，这里不再赘述，请参考：
【YoloV3–tensorflow】Part one ---- 目标检测实战：用YOLOV3训练自建的数据集
【YoloV3–tensorflow】Part two ---- Ubuntu16.04：opencv调用yolov3训练后的模型进行目标检测

（倘若是直接使用之前已经标注好的数据集，那么一定要注意Annotations文件夹下每个.xml文件中所对应的文件路径，事实上，每次移动JPEGImages文件夹之后都需要修改这部分内容）
　使用下面的demo可以达到 $\color{red}{批量修改.xml文件中path内容}$ 的效果：

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import os
import os.path
from shutil import copy
from xml.etree.ElementTree import parse, Element
import xml.dom.minidom

def test():
    path='/home/eden/Downloads/yolov3-master/data/Annotations/'  #原始xml文件存放路径
    files=os.listdir(path)  #得到文件夹下所有文件名称 ,注意这里的文件夹下只是放着xml文件，不用把同名的jpg文件放这里
    files.sort()

    idx = 0
    for xmlFile in files: #遍历文件夹
        if not os.path.isdir(xmlFile): #判断是否是文件夹,不是文件夹才打开
            print(xmlFile)
            pass
        path='/home/***/Downloads/yolov3-master/data/Annotations/'

        newStr=os.path.join(path,xmlFile) #拼接路径
        
        dom=parse(newStr)  #读取xml文件
        root=dom.getroot()
      
        #修改folder的值
        dom.find('folder').text="JPEGImages"
        
        idx += 1
        dom.find('filename').text =str(idx).zfill(6)+'.jpg'
        newfilename = dom.find('filename').text

        newStr1='/home/***/Downloads/yolov3-master/data/JPEGImages/'+newfilename    
        root.find('path').text=newStr1

        print('path after change')
        
        dom.write(newStr,encoding="utf-8")

        pass
    print('total xml: ',idx)

if __name__=='__main__':
    test()

Step２：

$\color{red}{在./data文件夹下新建ImageSets、labels文件夹}$ ，
$\color{red}{同时复制JPEGImages文件夹并重命名为images。}$

Step3：

在文件夹根目录（./yolov3-master）下新建makeTxt.py和voc_label.py两个文件

makeTxt.py：

import os
import random
#划分训练数据和测试数据比例，可自行根据实际数据量大小进行调整 
trainval_percent = 0.1
train_percent = 0.9
xmlfilepath = 'data/Annotations'
txtsavepath = 'data/ImageSets'
total_xml = os.listdir(xmlfilepath)
 
num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)
 
ftrainval = open('data/ImageSets/trainval.txt', 'w')
ftest = open('data/ImageSets/test.txt', 'w')
ftrain = open('data/ImageSets/train.txt', 'w')
fval = open('data/ImageSets/val.txt', 'w')

for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftest.write(name)
        else:
            fval.write(name)
    else:
        ftrain.write(name)
 
ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

运行该py文件后会在data/ImageSets/文件夹下生成四个.txt文本文件， trainval.txt、test.txt、train.txt、val.txt，这些txt文本文件中只包含文件名，并未包含完整的图像路径。接着运行voc_label.py：

voc_label.py：

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join
 
sets = ['train', 'test','val']
 
classes = ["tank"]
 
 
def convert(size, box):
    dw = 1. / size[0]
    dh = 1. / size[1]
    x = (box[0] + box[1]) / 2.0
    y = (box[2] + box[3]) / 2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return (x, y, w, h)

 
def convert_annotation(image_id):
    in_file = open('data/Annotations/%s.xml' % (image_id))
    out_file = open('data/labels/%s.txt' % (image_id), 'w')
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
 
    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
 
 
wd = getcwd()
print(wd)
for image_set in sets:
    if not os.path.exists('data/labels/'):
        os.makedirs('data/labels/')
    image_ids = open('data/ImageSets/%s.txt' % (image_set)).read().strip().split()
    list_file = open('data/%s.txt' % (image_set), 'w')
    for image_id in image_ids:
        list_file.write('data/images/%s.jpg\n' % (image_id))
        convert_annotation(image_id)
    list_file.close()

运行该py文件后会在./data文件夹下生成test.txt 、train.txt、val.txt三个文本文件。后续我们只用到前两个。

Step 4：

在./data文件夹下新建两个文件分别命名为voc.data 、 voc.names
其中voc.names存放识别物体的类别名称
voc.data的格式如下;

classes=1
train=data/train.txt
valid=data/test.txt
names=data/voc.names
backup=backup/   
eval=coco

backup=backup/ 、eval=coco这两项根据自身实际情况添加即可，backup=backup/ 指的是会在backup文件夹下存放训练得到的checkpoint，eval=coco指的是在测试和评判模型时采用coco数据集中的评判标准，倘若加了这一项，还需要对之前生成的.xml文件做一些小小的改动，将其coco数据集格式的.cfg文件（详细的实现过程会在后续的参考资料中给出，感兴趣的可以自行查看）。本人后续使用的voc.data文件中并未添加后两项。

到此为止，data文件夹下应该有如下这些文件

samples文件夹存放的是待测试的图像文件，这里可以提前将要测试的图像文件放到这个文件夹下，以免后续遗忘。

1.3 修改配置文件

本文所使用的是yolov3-tiny.cfg（受疫情影响，目前仍然家里蹲，电脑太渣，显卡配置低且只有cpu，so只好先用yolov3-tiny跑一跑了，电脑配置高的可以路过了）
打开./cfg文件夹下的yolov3-tiny.cfg文件进行修改，主要修改的地方有两个方面，一个是classes修改为自己要检测的物体类别，另一个要修改的是strides，其计算方式为 3*(classes+5)
本人最终训练要用的yolov3-tiny.cfg如下（只检测一类物体）：

[net]
# Testing
batch=1
subdivisions=1
# Training
# batch=64
# subdivisions=2
width=416
height=416
channels=3
momentum=0.9
decay=0.0005
angle=0
saturation = 1.5
exposure = 1.5
hue=.1

learning_rate=0.001
burn_in=1000
max_batches = 500200
policy=steps
steps=400000,450000
scales=.1,.1

[convolutional]
batch_normalize=1
filters=16
size=3
stride=1
pad=1
activation=leaky

[maxpool]
size=2
stride=2

[convolutional]
batch_normalize=1
filters=32
size=3
stride=1
pad=1
activation=leaky

[maxpool]
size=2
stride=2

[convolutional]
batch_normalize=1
filters=64
size=3
stride=1
pad=1
activation=leaky

[maxpool]
size=2
stride=2

[convolutional]
batch_normalize=1
filters=128
size=3
stride=1
pad=1
activation=leaky

[maxpool]
size=2
stride=2

[convolutional]
batch_normalize=1
filters=256
size=3
stride=1
pad=1
activation=leaky

[maxpool]
size=2
stride=2

[convolutional]
batch_normalize=1
filters=512
size=3
stride=1
pad=1
activation=leaky

[maxpool]
size=2
stride=1

[convolutional]
batch_normalize=1
filters=1024
size=3
stride=1
pad=1
activation=leaky

###########

[convolutional]
batch_normalize=1
filters=256
size=1
stride=1
pad=1
activation=leaky

[convolutional]
batch_normalize=1
filters=512
size=3
stride=1
pad=1
activation=leaky

[convolutional]
size=1
stride=1
pad=1
filters=18
activation=linear



[yolo]
mask = 3,4,5
anchors = 10,14,  23,27,  37,58,  81,82,  135,169,  344,319
classes=1
num=6
jitter=.3
ignore_thresh = .7
truth_thresh = 1
random=1

[route]
layers = -4

[convolutional]
batch_normalize=1
filters=128
size=1
stride=1
pad=1
activation=leaky

[upsample]
stride=2

[route]
layers = -1, 8

[convolutional]
batch_normalize=1
filters=256
size=3
stride=1
pad=1
activation=leaky

[convolutional]
size=1
stride=1
pad=1
filters=18
activation=linear

[yolo]
mask = 1,2,3
anchors = 10,14,  23,27,  37,58,  81,82,  135,169,  344,319
classes=1
num=6
jitter=.3
ignore_thresh = .7
truth_thresh = 1
random=1

二、下载预训练权重文件

经过上面一番折腾，距离成功只剩两步之遥了，接下来的第一步就是要下载预训练权重文件。
在./weights文件夹下的download_yolov3_weights.sh文件中详细的给出了预训练权重文件的下载方式。这里只简单的讲哈yolov3-tiny.weights权重文件的生成过程，其他的权重文件本人会上传到资源供各位下载。

首先下载训练好的网络参数yolov3-tiny.weights，https://pjreddie.com/media/files/yolov3-tiny.weights到weights目录下，但仍然需要fine-tune，so对yolov3-tiny.weights进行改造，下载darknet相关文件https://github.com/pjreddie/darknet，下载好之后进入文件make一下，生成darknet可执行文件，在当前文件目录下运行：

./darknet partial cfg/yolov3-tiny.cfg yolov3-tiny.weights yolov3-tiny.conv.15 15

之后会生成yolov3-tiny.conv.15，将其也放在weights文件夹下。over，下篇继续。

资源下载链接：

yolov3-tiny.weights下载资源
yolov3-tiny.conv.15下载资源
darknet53.conv.74下载资源
yolov3.weights下载资源
yolov3-spp.weights下载资源

参考资料：

https://github.com/ultralytics/yolov3
https://pytorch.org/get-started/locally/

❤❤❤❤❤Yolov3的.cfg文件中的参数详解
❤❤❤❤❤参考Blog1
❤❤❤❤❤参考Blog2
❤❤❤❤❤参考Blog3
❤❤❤❤参考Blog4
❤❤❤参考Blog5

你可能感兴趣的:(图像识别)

轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
深度学习入门篇：PyTorch实现手写数字识别 AI_Guru人工智能深度学习 pytorch 人工智能
深度学习作为机器学习的一个分支，近年来在图像识别、自然语言处理等领域取得了显著的成就。在众多的深度学习框架中，PyTorch以其动态计算图、易用性强和灵活度高等特点，受到了广泛的喜爱。本篇文章将带领大家使用PyTorch框架，实现一个手写数字识别的基础模型。手写数字识别简介手写数字识别是计算机视觉领域的一个经典问题，目的是让计算机能够识别并理解手写数字图像。这个问题通常作为深度学习入门的练习，因为
机器学习引领未来：赋能精准高效的图像识别技术革新刷刷刷粉刷匠机器学习人工智能
图像识别技术近年来取得了显著进展，深刻地改变了各行各业。机器学习，特别是深度学习的突破，推动了这一领域的技术革新。本文将深入探讨机器学习如何赋能图像识别技术，从基础理论到前沿进展，再到实际应用与挑战展望，为您全面呈现这一领域的最新动态和未来趋势。1.引言在当今数字化和智能化的时代，图像识别技术正逐渐成为人工智能（AI）领域的核心组成部分。随着计算能力的提升和数据量的激增，机器学习特别是深度学习的快
【Python第三方库】OpenCV库实用指南墨辰JC Python opencv python 人工智能学习
文章目录前言安装OpenCV读取图像图像基本操作获取图像信息裁剪图像图像缩放图像转换为灰度图图像模糊处理边缘检测图像翻转图像保存视频相关操作方法讲解读取视频从摄像头读取视频前言OpenCV（OpenSourceComputerVisionLibrary）作为一个强大的计算机视觉库，提供了丰富的图像处理和计算机视觉功能，尤其在图像识别、对象检测、视频分析等领域有着广泛的应用。本文将带领读者使用Pyt
深度神经网络详解：原理、架构与应用阿达C 活动 dnn 计算机网络人工智能神经网络机器学习深度学习
深度神经网络（DeepNeuralNetwork，DNN）是机器学习领域中最为重要和广泛应用的技术之一。它模仿人脑神经元的结构，通过多层神经元的连接和训练，能够处理复杂的非线性问题。在图像识别、自然语言处理、语音识别等领域，深度神经网络展示了强大的性能。本文将深入解析深度神经网络的基本原理、常见架构及其实际应用。一、深度神经网络的基本原理1.1神经元和感知器神经元是深度神经网络的基本组成单元。一个
halcon第九讲，深度学习结合大数据实现AI智能识别思想青莲居士_村长
人工智能、大数据、5G1、什么是人工智能、大数据、5G,三者有什么关联。人工智能（ArtificialIntelligence）：英文缩写：AI，人工智能是[计算机]科学的一个分支，它企图了解智能的实质，并生产出一种新的能以[人类智能]相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和[专家系统]等。人工智能从诞生以来，理论和技术日益成熟，应用领域也不断扩大，
使用matlab的热门问题七十二五值得关注 matlab 开发语言青少年编程算法经验分享
MATLAB广泛应用于科学计算、数据分析、信号处理、图像处理、机器学习等多个领域，因此热门问题也涵盖了这些方面。以下是一些可能被认为当前最热门的MATLAB问题：深度学习与神经网络：如何使用MATLAB的深度学习工具箱（DeepLearningToolbox）来构建和训练神经网络？如何利用MATLAB进行图像识别、语音识别或自然语言处理等深度学习应用？数据分析与可视化：如何使用MATLAB进行大数
大模型落地指南：从下载到本地化部署全流程解析网安猫叔人工智能自然语言处理语言模型 AIGC 深度学习
一、引言随着人工智能技术的迅猛发展，大规模预训练模型（如GPT-4、BERT等）在自然语言处理、图像识别等领域展现出了卓越的性能。然而，如何将这些强大的模型从理论落地到实际应用中，仍然是许多技术从业者面临的挑战。本篇文章旨在为读者提供一份详尽的大模型落地指南，从模型的下载、文件结构的解析，到本地化部署的具体步骤，全面覆盖整个流程。无论你是初次接触大模型的新手，还是希望深入了解部署细节的资深开发者，
2021-01-02随笔 0清婉0
人工智能时代最重要的是机器学习，像数据分析、图像识别、数据挖掘、自然语言处理、语音识别等都是以其为基础的，也可以说人工智能的各种应用都需要机器学习来支撑。现在各大公司越来越注重数据的价值，人工成本也是越来越高，所以机器学习也就变得不可或缺了。数据分析、自然语言处理、语音识别，这将是作为前端人员的我，在2021年学习的重点。现收集几本关于数据分析的书籍，作为参考书籍学习：1.《跟着迪哥学Python
开源AI图像识别：支持扫描文件批量识别快速对接数据库存储思通数科x 人工智能计算机视觉图像处理 OCR 文本识别
随着数字化转型的不断深入，图像识别技术在各行各业中的应用越来越广泛。文件封识别作为图像识别技术的一个分支，能够有效地提高文件处理的自动化程度和准确性。本文将探讨文件封识别技术的原理、应用场景以及如何将识别后的内容批量对应数据库字段进行存储。开源项目介绍(可本地部署，支持国产化)思通数科研发了一款多模态AI能力引擎，专注于提供自然语言处理（NLP）、情感分析、实体识别、图像识别与分类、OCR识别和语
垂类大模型：领域专家参与的重要性澳鹏Appen 生成式AI 人工智能与机器学习人工智能 AI 生成式AI
随着人工智能（AI）的不断发展，训练数据的完整性和质量至关重要。早期的AI模型专注于处理和分析任务，如图像识别、语音识别和情感分析。这些模型通常是在大型数据集上训练的，标注任务多可以由具有一般技能的人类执行，早期模型中的缺陷可以被标注员轻松识别和纠正。然而近年，AI领域经历了重大变革。当代模型被设计用于更复杂的功能，如推理和总结，旨在处理需要更高认知参与的复杂和多样化场景。这些先进模型不仅需要原始
基于ARM芯片与OpenCV的工业分拣机器人项目设计与实现流程详解极客小张 arm开发 opencv 机器人单片机计算机视觉人工智能物联网
一、项目概述项目目标和用途本项目旨在设计和实现一套工业分拣机器人系统，能够高效、准确地对不同类型的物品进行自动分拣。该系统广泛应用于物流、仓储和制造业，能够显著提高工作效率，降低人工成本。技术栈关键词ARM芯片步进电机控制OpenCV图像识别无线通信模块传感器（如超声波传感器、红外传感器）二、系统架构设计符合项目需求的系统架构本项目的系统架构主要由以下几个部分组成：控制单元：基于ARM芯片的主控板
在国产芯片上实现YOLOv5/v8图像AI识别-【4.2】RK3588获取USB摄像头图像推流RTSP更多内容见视频橘子的战斗日记 YOLO 人工智能音视频
本专栏主要是提供一种国产化图像识别的解决方案，专栏中实现了YOLOv5/v8在国产化芯片上的使用部署，并可以实现网页端实时查看。根据自己的具体需求可以直接产品化部署使用。B站配套视频：https://www.bilibili.com/video/BV1or421T74f前言在实际生产过程中，有很多时候不光是通过网络获取rtsp视频流，通常会采用在板子上插上USB摄像头获取画面。今天我将向搭建演示该
一文让你搞懂什么是AI大模型码上飞扬人工智能大模型 AI
近年来，人工智能（AI）技术飞速发展，特别是大模型的出现，给各行各业带来了巨大的变革。无论是自然语言处理、图像识别，还是自动驾驶，AI大模型都展现出了强大的能力和广泛的应用前景。那么，什么是AI大模型？它们有哪些特点和应用场景？本文将带你一探究竟。目录AI大模型的定义AI大模型的发展历程AI大模型的特点AI大模型的应用场景如何训练和使用AI大模型AI大模型的挑战与未来1.AI大模型的定义AI大模型
Node.js发票识别接口助力企业实现发票的精准高效管理翔云API api node.js php 开发语言 ocr 自动化
在金融和会计领域，随着数字化进程的加速，大量的纸质发票处理已经成为了企业效率提升的一个瓶颈。发票文字识别接口的出现，被视为解决这一问题的关键技术创新。通过高精度的图像识别与机器学习技术，将繁琐的手动输入工作转化为自动化的过程，不仅提升了数据处理速度，还极大降低了人为错误。Node.js发票识别接口集成示例：varrequest=require('request');varoptions={'met
opencv轮廓近似，模板匹配富士达幸运星 opencv 人工智能计算机视觉
在图像处理领域，轮廓近似和模板匹配是两种非常关键的技术，它们广泛应用于计算机视觉、图像分析和图像识别等多个方面。本文将详细介绍如何使用OpenCV库进行轮廓近似和模板匹配，并给出具体的代码示例。一、轮廓近似（ContourApproximation）轮廓近似是指将图像中的轮廓逼近成由直线段组成的多边形或其他简单形状，以减少轮廓的复杂度和数据量。OpenCV提供了cv2.approxPolyDP()
AI模型：追求全能还是专精？ Lill_bin 杂谈人工智能分布式 zookeeper 机器学习游戏
AI模型简介人工智能（AI）模型是人工智能系统的核心，它们是经过训练的算法，能够执行特定的任务，如图像识别、自然语言处理、游戏玩法、预测分析等。AI模型的类型很多，可以根据其功能和应用场景进行分类。常见的AI模型类型包括：监督学习模型：这些模型通过训练数据集学习，数据集中包含了输入和对应的输出标签。例子包括决策树、支持向量机（SVM）、神经网络等。无监督学习模型：这些模型处理没有标签的数据，目的是
Azure和Transformers的详细解释漫天飞舞的雪花 azure microsoft python
AzureAI是微软提供的人工智能(AI)解决方案的集合，旨在帮助开发人员、数据科学家和企业轻松构建和部署智能应用程序。以下是对AzureAI各个方面的详细解释：AzureAI主要组件AzureCognitiveServices（认知服务）：计算视觉：包括图像识别、物体检测、人脸识别以及图像标注等。语音服务：包括语音识别、语音合成、说话人识别和语音翻译等。语言理解服务：包括文本分析、语言翻译、情感
【Python机器学习】卷积神经网络（CNN） zhangbin_237 Python机器学习机器学习 python cnn 开发语言自然语言处理
卷积神经网络（CNN）得名于在数据样本上用滑动窗口（或卷积）的概念。卷积在数学中应用很广泛，通常与时间序列数据相关。它是用一个可视化盒子在一个区域内滑动，如下图所示：构建块卷积神经网络最早出现在图像处理和图像识别领域，它能够捕捉每个样本中数据点之间的空间关系，也就能识别出图像中是猫还是狗。卷积网络，也称为convnet，不像传统的前馈网络那样对每个元素（图中的像素）分配权重，而是定义了一组在图像上
【区块链 + 物联网】斐得坊智慧停车区块链 | FISCO BCOS应用案例 FISCO_BCOS 2023FISCO BCOS产业应用发展报告区块链物联网
当下，庞大的停车需求场景已经形成一定市场规模，但现有的停车场因产权复杂，且普遍采用承包模式、无法作为抵押品，又因企业现金流难以呈现，停车管理企业较难凭借自身信用来获得金融服务支持。区块链技术具有防篡改的特性，反映在停车大场景内就是利用区块链的多中心化、共识机制、智能合约、信用管理等特性，综合采用高清电子图像识别、车位导航、线上支付等停车管理技术，实现智能缴费停车、预约停车、共享停车、信用停车管理、
通义千问-VL-Chat-Int4 九品神元师 python 开发语言
Qwen-VL是阿里云研发的大规模视觉语言模型（LargeVisionLanguageModel,LVLM）。Qwen-VL可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。Qwen-VL系列模型性能强大，具备多语言对话、多图交错对话等能力，并支持中文开放域定位和细粒度图像识别与理解。安装要求(Requirements)python3.8及以上版本pytorch2.0及以上版本建议使用C
深度学习100问44:如何避免模型出现过拟合现象不断持续学习ing 人工智能自然语言处理机器学习
嘿，想让你的模型不出现过拟合现象？来看看这些妙招吧！一、增加数据量这就好比让学生多做各种不同的练习题。数据多了，模型就能学到更普遍的规律，而不是只记住那一点点数据里的小细节。你可以去收集更多真实的数据，或者用数据增强的办法。就像在图像识别里，把图片转一转、翻一翻、剪一剪，这样数据就变得更多样啦。二、简化模型要是模型太复杂，那就像盖了一座超级华丽的城堡，容易记住一些不该记的东西。那就把模型弄得简单点
闪耀世界人工智能大会背后，AI头雁百度已成智能经济强力引擎何玺
7月11日，2020世界人工智能大会在上海圆满闭幕。本届大会，多位商界领袖、行业专家针对人工智能发表了自己的观点与见解，并引发人们对AI的思考。腾讯CEO马化腾称：“人工智能本身就是一场跨国跨学科的探索，正在将人类的认知推向更快更高更强，也势必带给我们一场前所未见的科技和产业革命。”。特斯拉CEO马斯克则表示，AI在感知层面的某些专业领域里，已经无人能及。例如，AI的图像识别“天赋”已经超过了地球
基于STM32的智能物料运载小车：OpenMV和OpenCV结合图像识别与运动控制算法优化（代码示例）极客小张 stm32 opencv 嵌入式硬件系统架构物联网 c语言机器人
一、项目概述智能物料运载小车项目旨在开发一款能够自主移动并进行物料搬运的智能设备。该小车通过多种传感器和智能控制算法，实现自动识别和搬运物料，提高物流效率，减少人工成本。项目的核心价值在于：提高效率：通过自动化搬运，减少人力需求，提升工作效率。降低错误率：利用传感器和图像处理技术，确保物料的准确搬运。增加灵活性：全方位移动能力使小车能够在复杂环境中自如穿行。二、系统架构1.系统架构设计本项目的系统
深度学习：图像数据分析的革命 2401_85761762 深度学习数据分析人工智能
深度学习：图像数据分析的革命在当今数据驱动的世界中，图像数据分析已成为一个热门领域，而深度学习技术在其中扮演着核心角色。深度学习，特别是卷积神经网络（CNN），已经在图像识别、分类和处理方面取得了显著的成就。本文将详细介绍如何使用深度学习进行图像数据分析，并提供实际的代码示例。深度学习与图像数据分析深度学习是一种机器学习方法，它通过使用多层神经网络来学习数据的复杂模式。在图像数据分析中，深度学习模
使用Python实现深度学习模型：智能灾害响应与救援机器人 Echo_Wish Python算法 Python 笔记 python 深度学习机器人
在自然灾害频发的今天，智能灾害响应与救援机器人可以在救援过程中发挥重要作用。本文将详细介绍如何使用Python和深度学习技术实现一个智能灾害响应与救援机器人，帮助你快速入门并掌握基本的开发技能。一、项目概述智能灾害响应与救援机器人的主要功能是通过摄像头实时监控灾区情况，识别受困人员，并提供救援路径规划。我们将使用深度学习模型进行图像识别，并通过Python进行开发。二、项目环境配置在开始项目之前，
卷积神经网络-解释1 weixin_33749242 人工智能数据结构与算法
[翻译]神经网络的直观解释2017/07/2717:36这篇文章原地址为AnIntuitiveExplanationofConvolutionalNeuralNetworks，卷积神经网络的讲解非常通俗易懂。什么是卷积神经网络？为什么它们很重要？卷积神经网络（ConvNets或者CNNs）属于神经网络的范畴，已经在诸如图像识别和分类的领域证明了其高效的能力。卷积神经网络可以成功识别人脸、物体和交通
见过最好的神经网络CNN解释罗晨晖卷积神经网络 CNN 计算机视觉深度学习
什么是卷积神经网络？为什么它们很重要？卷积神经网络（ConvNets或者CNNs）属于神经网络的范畴，已经在诸如图像识别和分类的领域证明了其高效的能力。卷积神经网络可以成功识别人脸、物体和交通信号，从而为机器人和自动驾驶汽车提供视力。在上图中，卷积神经网络可以识别场景，也可以提供相关的标签，比如“桥梁”、“火车”和“网球”；而下图展示了卷积神经网络可以用来识别日常物体、人和动物。最近，卷积神经网络
基于深度学习的手势识别系统毕设宇航深度学习人工智能手势识别
基于深度学习网络的手势识别系统完整源码+数据集+报告+PPT全套信息【python设计开发】基于深度学习的手势图像识别处理系统【包括】代码PPT报告2需求分析2.1要求（1）用Python语言实现程序设计；（2）初识深度学习和图像处理技术;（3）了解深度神经网络（DeepNeuralNetworks，简称DNN）相关知识;（4）【难点】了解LeNet-5卷积神经网络模型，并进行模型训练;（5）【难
【机器学习】机器学习与大模型在人工智能领域的融合应用与性能优化新探索 E绵绵 Everything 人工智能机器学习大模型 python AIGC 应用科技
文章目录引言机器学习与大模型的基本概念机器学习概述监督学习无监督学习强化学习大模型概述GPT-3BERTResNetTransformer机器学习与大模型的融合应用自然语言处理文本生成文本分类机器翻译图像识别自动驾驶医学影像分析语音识别智能助手语音转文字大模型性能优化的新探索模型压缩权重剪枝量化知识蒸馏分布式训练数据并行模型并行异步训练高效推理模型裁剪缓存机制专用硬件未来展望跨领域应用智能化系统人
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他