野生蜘蛛侠

使用YOLOV5进行手势识别（详细教程）

yolov5的配置相对简单，但是网上大部分博客都没有仔细介绍具体步骤，本文将详细介绍YOLOv5在windows10系统下的环境配置的全过程，以及yolov5使用的一些细节，以及如何制作和训练自己的数据集。

目录

一.搭建环境

二.安装配置

1.安装anconda3

2.安装pytorch

3.安装pycharm

4.下载yolov5资源包

三.制作训练自己的数据集

1.准备工作

2.训练自己的数据集

3.测试

4.手势识别

一.搭建环境

1.本项目所需环境为：pycharm+anconda3+pytorch

2.版本要求:YOLOV5官方要求Python>=3.7；pytorch>=1.6

CUDA:10.2(可在cmd下查询自己电脑的cuda版本)

写作之前新手必看：

CUDA

CUDA（Compute Unified Device Architecture），是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构，该架构使GPU能够解决复杂的计算问题。它包含了CUDA指令集架构（ISA）以及GPU内部的并行计算引擎。开发人员可以使用C语言来为CUDA™架构编写程序，C语言是应用最广泛的一种高级编程语言。所编写出的程序可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。

PyTorch

PyTorch是一个开源的Python机器学习库，基于Torch，用于自然语言处理等应用程序。它是一个基于Python的可续计算包，提供两个高级功能：1、具有强大的GPU加速的张量计算（如NumPy）。2、包含自动求导系统的深度神经网络。

二.安装配置

1.安装anconda3

清华源下载，如图所示蓝色区域

下载完成后进行安装，安装过程将conda环境添加到系统环境中。

在conda中create Python3.7

2.安装pytorch

进入pytorch官网（PyTorch）选择适配自己电脑的下载链接

打开 anconda prompt，我们用conda指令创建一个虚拟环境叫做：pytorch

指令如下：

conda create -n pytorch python=3.7

因为我创建过了所以他提示我是否打开，没有创建过的等他创建好后再打开。

输入指令：conda activate pytorch进入（pytorch）C:\Users\zhiyao>环境(根据自己创建的pytorch屋子所在地址)，然后输入在pytorch官网复制的下载链接：

conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch

，等待安装完成即可。

安装完成打开pycharm配置YOLOv5的项目环境。

3.安装pycharm

下载Community版本的pycharm，然后进行安装，pycharm的安装教程网上有很多自行安装吧。

4.下载yolov5资源包

下载地址如下：

GitHub - ultralytics/yolov5: YOLOv5 in PyTorch > ONNX > CoreML > TFLite

下载zip文件并完成解压

在pycharm中打开yolov5文件设置项目的Python解释器为我们conda环境下创建虚拟环境的pytorch（可以在anconda安装地址中找到）

5.安装labelImg

参考文章：Windows下深度学习标注工具LabelImg安装和使用指南 - 云+社区 - 腾讯云 (tencent.com)

三.制作训练自己的数据集

1.准备工作

（1）安装项目所需要的packages,在项目终端下输入指令：pip install -r requirements.txt

其中，如果pycocotools安装失败我们可以安装 visual studio installer。下载链接：Microsoft C++ 生成工具 - Visual Studio

安装完成后我们继续在pycharm项目终端中输入指令：pip install pycocotools，即可解决问题。

我们还可以利用python库镜像下载：pip install pycocotools -i https://pypi.tuna.tsinghua.edu.cn/simple

（2）模型下载

官方链接：Releases · ultralytics/yolov5 · GitHub
yolov5l.pt
yolov5s.pt
yolov5x.pt
yolov5m.pt
将权重文件放入yolov5/weights文件夹下

（3）在yolov5目录下创建mydata文件夹（名字可以自定义），目录结构如下，将之前labelImg标注好的xml文件和图片放到对应目录下
mydata
--images # 存放图片
--Annotations # 存放图片对应的xml文件
--ImageSets/Main #之后会在Main文件夹内自动生成train.txt，val.txt，test.txt和trainval.txt四个文件，存放训练/存放train.txt/val.txt/test.txt/trainval.txt文件。

例如：

建立my_test.py文件（用于在ImageSets/Main下生成.txt文件）：

# coding:utf-8

import os
import random
import argparse

parser = argparse.ArgumentParser()
#xml文件的地址，根据自己的数据进行修改 xml一般存放在Annotations下
parser.add_argument('--xml_path', default='Annotations', type=str, help='input xml label path')
#数据集的划分，地址选择自己数据下的ImageSets/Main
parser.add_argument('--txt_path', default='ImageSets/Main', type=str, help='output txt label path')
opt = parser.parse_args()

trainval_percent = 1.0
train_percent = 0.9
xmlfilepath = opt.xml_path
txtsavepath = opt.txt_path
total_xml = os.listdir(xmlfilepath)
if not os.path.exists(txtsavepath):
    os.makedirs(txtsavepath)

num = len(total_xml)
list_index = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list_index, tv)
train = random.sample(trainval, tr)

file_trainval = open(txtsavepath + '/trainval.txt', 'w')
file_test = open(txtsavepath + '/test.txt', 'w')
file_train = open(txtsavepath + '/train.txt', 'w')
file_val = open(txtsavepath + '/val.txt', 'w')

for i in list_index:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        file_trainval.write(name)
        if i in train:
            file_train.write(name)
        else:
            file_val.write(name)
    else:
        file_test.write(name)

file_trainval.close()
file_train.close()
file_val.close()
file_test.close()

运行代码后在Main文件夹生成四个txt文档：

将数据集格式转换为yolo_txt格式，同时生成label标签，创建my_label.py文件。

# -*- coding: utf-8 -*-
import xml.etree.ElementTree as ET
import os
from os import getcwd

sets = ['train', 'val', 'test']
classes = ["A","B","C","D"]   # 改成自己的类别
abs_path = os.getcwd()
print(abs_path)

def convert(size, box):
    dw = 1. / (size[0])
    dh = 1. / (size[1])
    x = (box[0] + box[1]) / 2.0 - 1
    y = (box[2] + box[3]) / 2.0 - 1
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return x, y, w, h

def convert_annotation(image_id):
    in_file = open('F:\web\yolov5-master\mydata\Annotations\%s.xml' % (image_id), encoding='UTF-8') #改成自己数据存放的地址
    out_file = open('F:\web\yolov5-master\mydata\labels\%s.txt' % (image_id), 'w')     #同上
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        b1, b2, b3, b4 = b
        # 标注越界修正
        if b2 > w:
            b2 = w
        if b4 > h:
            b4 = h
        b = (b1, b2, b3, b4)
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

wd = getcwd()
for image_set in sets:
    if not os.path.exists('F:\web\yolov5-master\mydata\labels'):    #同上
        os.makedirs('F:\web\yolov5-master\mydata\labels')   #同上
    image_ids = open('F:\web\yolov5-master\mydata\ImageSets\Main\%s.txt' % (image_set)).read().strip().split() #同上
    list_file = open('F:\web\yolov5-master\mydata\%s.txt' % (image_set), 'w')  #同上
    for image_id in image_ids:
        list_file.write(abs_path + 'F:\web\yolov5-master\mydata\images\%s.jpg\n' % (image_id))  #同上
        convert_annotation(image_id)
    list_file.close()

运行后在mydata文件夹下生成labels文件夹和txt文件，labels中为不同图像的标注文件，

(4)配置文件

在mydata文件夹下创建ABCD.yaml（名字可自定义）文件。

2.训练自己的数据集

在train.py进行以下几个修改：

以上参数解释如下：
epochs：指的就是训练过程中整个数据集将被迭代多少次,显卡不行你就调小点。
batch-size：一次看完多少张图片才进行权重更新，梯度下降的mini-batch,显卡不行你就调小点。
cfg：存储模型结构的配置文件
data：存储训练、测试数据的文件
img-size：输入图片宽高,显卡不行你就调小点。
rect：进行矩形训练
resume：恢复最近保存的模型开始训练
nosave：仅保存最终checkpoint
notest：仅测试最后的epoch
evolve：进化超参数
bucket：gsutil bucket
cache-images：缓存图像以加快训练速度
weights：权重文件路径
name：重命名results.txt to results_name.txt
device：cuda device, i.e. 0 or 0,1,2,3 or cpu
adam：使用adam优化
multi-scale：多尺度训练，img-size +/- 50%
single-cls：单类别的训练集
原文链接：https://blog.csdn.net/qq_36756866/article/details/109111065

训练结束会在yolov5目录下生成一个runs文件，所以训练结果都放在runs\train文件中。

3.测试

参考链接：https://blog.csdn.net/qq_36756866/article/details/109111065

4.手势识别

（1）收集你所需的手势照片放在文件夹mydata\images中，使用labelImg对照片进行打标签，保存在文件夹mydata\Annotations（XML文件）中；

（2）在pycharm中运行my_label.py生成TXT文件并保存在文件夹mydata\labels中；

（3）这样我们就可运行train.py文件进行训练，完成后我们在终端输入指令：python F:/yolov5/yolov5-master/detect.py --source 0 --weight="F:/yolov5/yolov5-master/runs/train/exp6/weights/best.pt"调用电脑摄像头，基本可以实现你所打标签的手势识别。

你可能感兴趣的:(图像识别)

使用Activeloop Deep Lake构建深度学习数据仓库与向量存储 dgay_hua 深度学习人工智能 python
技术背景介绍随着深度学习技术的发展，数据的存储与管理成为了一个重要的问题。尤其是对于需要处理大量数据的应用，例如自然语言处理和图像识别，传统的数据存储方式已经无法满足需求。ActiveloopDeepLake是专为深度学习设计的数据仓库，可以作为向量存储使用，支持多模态数据的存储和处理，并且可以直接用于细调大型语言模型（LLMs）。此外，它还提供自动版本控制，无需依赖其他服务，兼容主要云服务提供商
学习总结项目苏小夕夕学习人工智能深度学习机器学习
近段时间学习了机器学习、线性回归和softmax回归、多层感知机、卷积神经网络、Pytorch神经网络工具箱、Python数据处理工具箱、图像分类等的知识，学习了利用神经网络实现cifar10的操作、手写图像识别项目以及其对应的实验项目报告总结。项目总结本次项目我使用了VGG19模型、AlexNet模型和已使用的VGG16模型进行对比，在已有的条件下，对代码进行更改是，结果展示中，VGG19模型的
二维码识别OCR接口：开启高效信息提取的新篇章安静的小员 ocr java javascript python 前端后端
前言在数字化时代，二维码作为一种高效的信息传递工具，已经广泛应用于各个领域。而二维码识别OCR接口的出现，更是为企业和开发者提供了一种快速、准确地提取信息的解决方案。技术原理：图像识别与数据解析的完美结合二维码识别OCR接口的核心在于其独特的技术架构。系统首先通过图像采集模块获取二维码图像，经过预处理后，利用定位算法精确识别二维码的位置和角度。随后，解码模块对二维码数据进行解析，最终输出可读的信息
基于FPGA的图像中值滤波Verilog实现及MATLAB辅助验证 CodeWG fpga开发 matlab 开发语言
基于FPGA的图像中值滤波Verilog实现及MATLAB辅助验证图像处理是计算机视觉和图像识别领域的重要组成部分。其中，中值滤波是一种常用的图像去噪方法，广泛应用于图像增强、边缘检测和特征提取等任务中。本文将介绍基于FPGA的图像中值滤波Verilog实现，并通过MATLAB进行辅助验证。首先，我们需要了解什么是中值滤波。中值滤波是一种非线性滤波器，它的原理是将图像中每个像素的灰度值替换为该像素
利用Python爬虫按图搜索1688商品（拍立淘）：实战指南小爬虫程序猿 python 爬虫图搜索算法
在电商领域，按图搜索商品（类似“拍立淘”功能）是一种非常实用的功能，尤其适合用户通过图片快速查找相似商品。1688开放平台提供了按图搜索商品的API接口，允许开发者通过图片获取相关的商品信息。本文将详细介绍如何使用Python爬虫技术调用1688的按图搜索API接口，并解析返回的数据。一、技术背景按图搜索功能通常依赖于图像识别技术和搜索引擎。1688的“拍立淘”功能允许用户上传图片，系统会通过图像
神经网络图像识别技术,神经网络如何识别图像小浣熊的技术神经网络机器学习深度学习
什么是神经网络神经网络可以指向两种，一个是生物神经网络，一个是人工神经网络。生物神经网络：一般指生物的大脑神经元，细胞，触点等组成的网络，用于产生生物的意识，帮助生物进行思考和行动。人工神经网络（ArtificialNeuralNetworks，简写为ANNs）也简称为神经网络（NNs）或称作连接模型（ConnectionModel），它是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法
《基于yolov5s的水稻病虫害图像识别应用》开题报告大数据蟒行探索者毕业论文/研究报告 YOLO 软件工程自动化运维软件构建性能优化
1.研究的目的和意义一、研究目的农作物病虫害是全球农业生产中的主要威胁之一，每年因病虫害造成的作物减产和经济损失相当巨大。随着世界人口的增长，对粮食的需求不断增加，如何提高农作物产量、减少病虫害损失，成为农业生产中需要解决的核心问题。传统的病虫害识别方法主要依赖于农民的经验或农业专家的现场诊断，这种方式不仅耗费大量时间和人力，而且易受人为因素影响，准确率不高，且不具备可持续性，特别是在大规模农业生
企业AI数据安全白皮书：深寻模型会话保护与安当TDE实战安当加密人工智能
一、引言人工智能正在重塑企业的业务流程与创新模式，从智能客服到辅助决策，从图像识别到自然语言处理，AI模型正逐步渗透到企业运营的各个环节。然而，随着AI技术的深入应用，数据安全问题也如影随形。对于部署在企业内网的DeepSeek模型而言，员工与模型的会话内容往往包含企业的核心商业信息、敏感技术参数以及员工个人隐私等关键数据。一旦这些数据遭到泄露、篡改或恶意利用，不仅会给企业带来巨大的经济损失，还可
深度学习模型：原理、应用与代码实践 accurater c++算法笔记人工智能深度学习
引言深度学习作为人工智能的核心技术，已在图像识别、自然语言处理、代码生成等领域取得突破性进展。其核心在于通过多层神经网络自动提取数据特征，解决复杂任务。本文将从基础理论、模型架构、优化策略、应用场景及挑战等多个维度展开，结合代码示例，系统解析深度学习模型的技术脉络与实践方法。一、深度学习基础理论神经网络基本原理神经网络由输入层、隐藏层和输出层构成，通过反向传播算法调整权重。以全连接网络为例，前向传
二维码识别OCR接口：开启高效信息提取的新篇章 api
前言在数字化时代，二维码作为一种高效的信息传递工具，已经广泛应用于各个领域。而二维码识别OCR接口的出现，更是为企业和开发者提供了一种快速、准确地提取信息的解决方案。技术原理：图像识别与数据解析的完美结合二维码识别OCR接口的核心在于其独特的技术架构。系统首先通过图像采集模块获取二维码图像，经过预处理后，利用定位算法精确识别二维码的位置和角度。随后，解码模块对二维码数据进行解析，最终输出可读的信息
Python图片识别脚本：从零开始实现图像识别！ Python_trys python 开发语言编程 Python入门 Python基础 Python识别 Python学习
包含编程籽料、学习路线图、爬虫代码、安装包等！【点击领取！】图像识别是计算机视觉领域的一个重要应用，Python凭借其丰富的库和工具，成为了实现图像识别的首选语言之一。本文将带你从零开始，使用Python编写一个简单的图片识别脚本。我们将使用OpenCV和TensorFlow来实现这个功能。1.环境准备在开始之前，我们需要安装一些必要的Python库。你可以使用pip来安装这些库：pipinsta
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能图像识别人工智能深度学习
一、介绍害虫识别系统，本系统使用Python作为主要开发语言，基于TensorFlow搭建卷积神经网络算法，并收集了12种常见的害虫种类数据集【"蚂蚁（ants）","蜜蜂（bees）","甲虫（beetle）","毛虫（catterpillar）","蚯蚓（earthworms）","蜚蠊（earwig）","蚱蜢（grasshopper）","飞蛾（moth）","鼻涕虫（slug）","蜗牛
图像识别技术与应用课后总结（14）一元钱面包人工智能
训练模型加载预处理数据集：可以借助PyTorch的数据处理工具，如torch.utils和torchvision等定义损失函数：既可以自定义，也能使用PyTorch内置的，像回归任务常用nn.MSELoss()，分类任务常用nn.BCELoss()定义优化方法：PyTorch的优化方法封装在torch.optim中，基于基类optim.Optimizer，能实现自定义优化步骤。常用的优化算法如梯度
如何利用Python爬虫按图搜索1688商品（拍立淘）：实战指南数据小小爬虫 python 爬虫图搜索算法
在电商领域，按图搜索商品（类似“拍立淘”功能）是一种非常实用的功能，尤其适合用户通过图片快速查找相似商品。1688开放平台提供了按图搜索商品的API接口，允许开发者通过图片获取相关的商品信息。本文将详细介绍如何使用Python爬虫技术调用1688的按图搜索API接口，并解析返回的数据。一、技术背景按图搜索功能通常依赖于图像识别技术和搜索引擎。1688的“拍立淘”功能允许用户上传图片，系统会通过图像
基于ESP32完成摄像头接入和调试研创通之逍遥峰单片机摄像头 ESP32 硬件开发
基于ESP32完成摄像头接入和调试是一个常见的物联网（IoT）项目，广泛应用于安防监控、智能家居、图像识别等场景。以下是实现摄像头接入和调试的详细步骤：1.硬件准备ESP32开发板：推荐使用带PSRAM的ESP32开发板（如ESP32-CAM），因为摄像头图像处理需要较大的内存。摄像头模块：常用的摄像头模块有OV2640和OV7670。OV2640支持更高的分辨率（如1600x1200），适合高质
图像识别技术与应用课后总结（12）一元钱面包人工智能
全局平均池化（GlobalAveragePooling）1.导入库和设备配置importtorch.nnasnnimporttorch.nn.functionalasFdevice=torch.device("cuda:0"iftorch.cuda.is_available()else"cpu")-importtorch.nnasnn：导入PyTorch的神经网络模块，用于构建神经网络层。-imp
按键精灵找图的原理及影响找图效率的因素学自动化的小白计算机视觉图像处理人工智能
按键精灵找图的原理主要是基于图像识别算法，具体涉及像素点的颜色值和位置比对。以下是对该原理的详细解释：一、图像像素点的基本概念图像是由一个个颜色块组成的，这些颜色块非常小，通常看不出有明显的分块界限。这些带有颜色的小方块就是图像的像素点。像素点是在一个二维平面上排列的，分为横向和纵向，大量的像素点排列在一起就组成了一张图像。二、找图原理的具体步骤确定找图区域：按键精灵在屏幕上指定的区域内进行找图操
《解锁HarmonyOS NEXT高阶玩法：艺术图像识别功能开发全攻略》人工智能深度学习
在当今数字化时代，AI技术不断拓展其应用边界，为各行业带来前所未有的变革。在艺术领域，AI图像识别技术能够帮助艺术从业者、爱好者快速识别艺术品风格、作者，甚至挖掘艺术品背后的历史文化信息。本文将结合HarmonyOSNEXTAPI12及以上版本，深入讲解如何开发一个具有艺术图像识别功能的应用，助力开发者掌握这一前沿技术，推动鸿蒙系统在艺术领域的创新应用。技术原理与关键知识点AI图像识别在艺术领域主
神经网络之CNN文本识别邪恶的贝利亚神经网络 cnn 人工智能
1.参考我的第一篇文章了解CNN概念神经网络之CNN图像识别(torchapi调用)-CSDN博客2.框架目前对NLP的研究分析应用最多的就是RNN系列的框架，比如RNN,GRU,LSTM等等，再加上Attention，基本可以认为是NLP的标配套餐了。但是在文本分类问题上，相比于RNN，CNN的构建和训练更为简单和快速，并且效果也不差，所以仍然会有一些研究。那么，CNN到底是怎么应用到NLP上的
AI大模型教程入门到精通，非常详细收藏我这一篇就够了！AI大模型零基础入门教程（适合小白） AGI大模型学习人工智能大模型应用大模型 AI产品经理学习 AI大模型大模型教程
什么是AI大模型？AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力，可以应用于各种领域，如自然语言处理、图像识别、语音识别等。为什么要学AI大模型？2024人工智能大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于
神经进化算法(Neuroevolution) 原理与代码实例讲解 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
神经进化算法,Neuroevolution,进化算法,深度学习,机器学习,遗传算法,神经网络,代码实例1.背景介绍在机器学习领域，神经网络凭借其强大的学习能力和泛化能力，在图像识别、自然语言处理、语音识别等领域取得了显著的成就。然而，传统的神经网络训练方法通常依赖于人工设计的网络结构和参数初始化，这往往需要大量的经验和试错，并且难以找到最优的网络结构和参数。神经进化算法(Neuroevolutio
Matlab 大量接单 matlabgoodboy matlab 开发语言
分享一个matlab接私活、兼职的平台1、技术方向满足任一即可2、技术要求3、最后技术方向满足即可MATLAB：熟练掌握MATLAB编程语言，能够使用MATLAB进行数据处理、机器学习和深度学习等相关工作。机器学习、深度学习、强化学习、仿真、复现、算法、神经网络、建模、图像识别、数据挖掘、数据获取、爬虫、数据分析、目标检测、算法创新、因子分析、相关分析、方差分析、判别分析、方程分析、线性回归、中介
图像识别-pytorch 星辰瑞云机器学习 cnn pytorch
Pytorch神经网络工具箱神经网络核心组件神经网络的基本组件层：包括卷积层、池化层、全连接层等。层是神经网络的基本结构，输入张量通过层后变为输出张量。模型：由层构成的网络结构，如AlexNet、VGG等。模型可以是预训练的，也可以自己搭建。损失函数：用于衡量预测值与真实值之间的差距，如均方误差。损失函数越小越好。优化器：用于调整权重和偏置，使损失函数最小化。优化器决定了参数的调整方式。误差反传（
Python深度学习实践：使用TensorFlow构建图像分类器 Evaporator Core Python开发经验 python 深度学习 tensorflow
摘要随着深度学习技术的飞速发展，图像识别已成为AI领域的热点应用之一。本篇文章将引导读者使用Python和Google的TensorFlow框架，从零开始构建一个简单的图像分类器。我们将深入探讨卷积神经网络（CNN）的基本原理，实现一个能够识别MNIST手写数字的数据集模型，并通过实战代码演示整个过程，最终展示模型的训练与评估。一、环境配置与库导入确保已安装Python3.7+版本，以及Tenso
从黑暗到光明：FPC让盲人辅助眼镜成为视障者的生活明灯！【新立电子】珠海新立电子科技有限公司盲人辅助智能眼镜智能眼镜新立电子 fpc柔性线路板
在科技日新月异的今天，智能技术正以前所未有的方式改变着我们的生活。对于视障人士而言，科技的进步更是为他们打开了一扇通往更加独立自主生活的大门。其中，盲人辅助智能眼镜可以成为视障人士日常生活中的得力助手。FPC在AR眼镜中的应用，更是为盲人辅助智能眼镜的性能提升和可靠性保障提供了坚实的技术基础。盲人辅助智能眼镜，通过内置的高性能摄像头和先进的图像识别算法，能够实时捕捉并分析周围环境中的信息。无论是道
在 Centos7 上部署 ASP.NET 8.0 + YOLOv11 的踩坑实录 Rverdoser asp.net YOLO 后端
在CentOS7上部署ASP.NET8.0应用（实际上截至目前最新的稳定版本是ASP.NETCore6，ASP.NET8.0目前并不存在，可能是指ASP.NETCore8.0，但考虑到您的问题，我将假定您指的是ASP.NETCore6）并结合YOLOv11模型进行图像识别，确实会遇到一些技术挑战。下面我将分步骤介绍如何配置环境、安装必要的组件以及解决可能遇到的问题。步骤1:安装.NETCore首先
深度学习：从神经网络到智能应用 Jason_Orton 深度学习神经网络人工智能机器学习
目录引言一.什么是深度学习？二.深度学习的基本原理1.神经网络的组成2.激活函数3.反向传播（Backpropagation）三.深度学习的常见模型四.深度学习的应用场景五.深度学习的挑战与未来结语引言深度学习（DeepLearning）作为机器学习的一个分支，近年来在人工智能领域取得了革命性的进展。无论是语音识别、图像识别，还是自动驾驶、自然语言处理，深度学习都在推动着技术的发展和行业的变革。那
pycharm中osgeo安装南宁师范大学的丙酸铜啊 python pycharm
osgeo图像识别下载错误可以到官网寻找指定的包这里的是python解释器3.8版本所适应的版本tmp和zip文件均可以解压之后放到对应位置网址https://www.lfd.uci.edu/~gohlke/pythonlibs/#gdal指定路径venv\lib\site-package
深度、机器学习算法 yzx991013 机器学习算法人工智能
机器学习典型算法SVM（支持向量机）：它通过寻找一个最优超平面来对数据进行分类。在二分类问题中，能找到一个平面（低维）或超平面（高维），使不同类别的数据点尽可能远地分布在超平面两侧。在小样本、非线性数据处理上有优势，常用于文本分类、图像识别等领域。决策树：以树形结构展示决策过程，从根节点开始，依据特征值逐步向下划分，直到叶子节点得出分类或回归结果。它易于理解和解释，可处理数值型和分类型数据，但容易
ai大模型自动化测试-TensorFlow Testing 测试模型实例小赖同学啊人工智能自动化测试(app pc API)python 人工智能 tensorflow python
AI大模型自动化测试是确保模型质量、可靠性和性能的关键环节，以下将从测试流程、测试内容、测试工具及测试挑战与应对几个方面进行详细介绍：测试流程测试计划制定确定测试目标：明确要测试的AI大模型的具体功能、性能、安全性等方面的目标，例如评估模型在特定任务上的准确率、召回率等。定义测试范围：界定测试所涵盖的模型功能模块、数据类型、应用场景等，比如是否包括图像识别、自然语言处理等不同功能。规划测试资源：确
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他