夜雨飘零1

《我的PaddlePaddle学习之路》笔记十——自定义图像数据集实现目标检测

原文博客：Doi技术团队
链接地址：https://blog.doiduoyi.com/authors/1584446358138
初心：记录优秀的Doi技术团队学习经历

*本篇文章基于 PaddlePaddle 0.11.0、Python 2.7

前言

在阅读这一篇文章之前，要先阅读上一篇文章使用VOC数据集的实现目标检测，因为大部分的程序都是使用上一篇文章所使用到的代码和数据集的格式。在这篇文章中介绍如何使用自定义的图像数据集来做目标检测。

数据集介绍

我们本次使用的到的数据集是自然场景下的车牌，不知读者是否还记得在车牌端到端的识别这篇文章中，我们使用到的车牌是如何裁剪的，我们是使用OpenCV经过多重的的图像处理才达到车牌定位的，而且定位的效果比较差。在这篇文章中我们尝试使用神经网络来定位车牌位置。

下载车牌

我们先从网络上下载车牌数据，来提供给我们进行训练，核心代码片段如下：

def start_download(self):
    self.download_sum = 0
    gsm = 80
    str_gsm = str(gsm)
    pn = 0
    if not os.path.exists(self.save_path):
        os.makedirs(self.save_path)
    while self.download_sum < self.download_max:
        str_pn = str(self.download_sum)
        url = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&' \
              'word=' + self.key_word + '&pn=' + str_pn + '&gsm=' + str_gsm + '&ct=&ic=0&lm=-1&width=0&height=0'
        print url
        result = requests.get(url)
        self.downloadImages(result.text)
    print '下载完成'

重命名图像

下载好的图像会存放在data/plate_number/images/这个路径下，其中下载的一下数据可能不是车牌的图像，我们需要把它删除掉。然后为了让我们的数据集更符合VOC数据集，我们要对图像重命名，命名程序如下：

# coding=utf-8
import os

def rename(images_dir):
    # 获取所有图像
    images = os.listdir(images_dir)
    i = 1
    for image in images:
        src_name = images_dir + image
        # 以六位数字命名，符合VOC数据集格式
        name = '%06d.jpg' % i
        dst_name = images_dir + name
        os.rename(src_name,dst_name)
        i += 1
    print '重命名完成'

if __name__ == '__main__':
    # 要重命名的文件所在的路径
    images_dir = '../data/plate_number/images/'
    rename(images_dir)

标注数据集

图像数据我们有了，也命名完成了，但是我们还缺少一个非常重要的标注信息，在VOC数据集中，每张图像的标注信息是存放在XML文件中的，并且命名跟图像是一样的（后缀名除外），所以我们要制作标注信息文件。当然，那么复杂的工作，肯定要一个程序来协助完成，我们使用的是LabelImg。下面就介绍使用LabelImg标注我们的图像。

安装LabelImg

在Ubuntu 16.04上安装LabelImg，操作非常简单，通过几行命名就可以完成安装了

# 获取管理员权限
sudo su
# 安装依赖库
apt-get install pyqt4-dev-tools
pip install lxml
# 安装labelImg
pip install labelImg
# 退出管理员权限
exit
# 运行labelImg
labelImg

使用LabelImg

运行程序之后，显示的界面如下：

然后我们点击Open Dir打开图像所在的文件夹data/plate_number/images/，程序显示如下：

到这里我们不要急于标注图像，我们要先设置保存标注文件存放的位置，点击Change Save Dir选择保存标注文件存放的位置data/plate_number/annotation/，然后在点击Create RectBox标注车牌的位置，并打上标签plate_number。最后别忘了保存标注文件，点击Save，就会以图像的名称命名标注文件并保存。然后就可以点击Next Image，标注下一个图像了。

标注的文件信息如下，符合VOC数据集格式要求：

<annotation>
	<folder>imagesfolder>
	<filename>000001.jpgfilename>
	<path>/home/yeyupiaoling/data/plate_number/images/000001.jpgpath>
	<source>
		<database>Unknowndatabase>
	source>
	<size>
		<width>750width>
		<height>562height>
		<depth>3depth>
	size>
	<segmented>0segmented>
	<object>
		<name>plate_numbername>
		<pose>Unspecifiedpose>
		<truncated>0truncated>
		<difficult>0difficult>
		<bndbox>
			<xmin>225xmin>
			<ymin>298ymin>
			<xmax>560xmax>
			<ymax>405ymax>
		bndbox>
	object>
annotation>

生成图像列表

有了图像和图像的标注文件，我们还需要两个图像列表，训练图像列表trainval.txt和测试图像列表test.txt，应为我们这次的数据集的文件夹的结构跟之前的不一样，所以我们生成图像列表的程序也不一样了。

首先要读取所有的图像和标注文件，并将他们一一对应：

for images in all_images:
    trainval = []
    test = []
    if data_num % 10 == 0:
        # 没10张图像取一个做测试集
        name = images.split('.')[0]
        annotation = os.path.join(annotation_path, name + '.xml')
        # 如果该图像的标注文件不存在，就不添加到图像列表中
        if not os.path.exists(annotation):
            continue
        test.append(os.path.join(images_path, images))
        test.append(annotation)
        # 添加到总的测试数据中
        test_list.append(test)
    else:
        # 其他的的图像做训练数据集
        name = images.split('.')[0]
        annotation = os.path.join(annotation_path, name + '.xml')
        # 如果该图像的标注文件不存在，就不添加到图像列表中
        if not os.path.exists(annotation):
            continue
        trainval.append(os.path.join(images_path, images))
        trainval.append(annotation)
        # 添加到总的训练数据中
        trainval_list.append(trainval)
    data_num += 1

然后把他们写入到图像列表的文件中，为了使得训练数据是随机性的，可以对训练的数据集打乱一下。

# 打乱训练数据
random.shuffle(trainval_list)
# 保存训练图像列表
with open(os.path.join(output_dir, 'trainval.txt'), 'w') as ftrainval:
    for item in trainval_list:
        ftrainval.write(item[0] + ' ' + item[1] + '\n')
# 保存测试图像列表
with open(os.path.join(output_dir, 'test.txt'), 'w') as ftest:
    for item in test_list:
        ftest.write(item[0] + ' ' + item[1] + '\n')

训练模型

有了图像数据和标注文件，也有了图像列表，我们就可以开始训练模型了，在训练之前，我们还有修改一下配置文件pascal_voc_conf.py，把类别改成2，因为我们只有车牌和背景，所以只有两个类别。

# 图像的分类种数
__C.CLASS_NUM = 2

预训练模型处理

如果直接训练是会出现浮点异常的，我们需要一个预训练的模型来初始化训练模型，我们这次使用的初始化模型同样是官方预训练的模型，但是不能直接使用，还有删除一些没用的文件，因为我们的类别数量更之前的不一样，官方预训练的模型的部分文件如下：

我们把文件名中包含mbox的文件都删掉就可以用来做我们的初始化模型了。

开始训练

最后开始训练使用的是2个GPU，因为使用到的神经网络仅支持CUDA GPU环境，所以只能使用GPU来进行训练。train_file_list是训练图像列表文件路径，dev_file_list是测试图像列表文件路径，data_args是数据集的设置信息，init_model_path使用预训练的模型初始化训练参数的模型。


if __name__ == "__main__":
    # 初始化PaddlePaddle
    paddle.init(use_gpu=True, trainer_count=2)
    # 设置数据参数
    data_args = data_provider.Settings(
        data_dir='../data',
        label_file='../data/label_list',
        resize_h=cfg.IMG_HEIGHT,
        resize_w=cfg.IMG_WIDTH,
        mean_value=[104, 117, 124])
    # 开始训练
    train(
        train_file_list='../data/trainval.txt',
        dev_file_list='../data/test.txt',
        data_args=data_args,
        init_model_path='../models/vgg_model.tar.gz')

训练的过程中输入以下的日志信息：


Pass 0, Batch 0, TrainCost 16.567970, Detection mAP=0.014627
......
Test with Pass 0, TestCost: 8.723172, Detection mAP=0.00609719

Pass 1, Batch 0, TrainCost 7.185760, Detection mAP=0.239866
......
Test with Pass 1, TestCost: 6.301503, Detection mAP=60.357

Pass 2, Batch 0, TrainCost 6.052617, Detection mAP=32.094097
......
Test with Pass 2, TestCost: 5.375503, Detection mAP=48.9882

评估模型

我们同样可以评估我们训练好的模型，了解模型收敛的情况。eval_file_list是要用来评估模型的数据集，我们使用的是训练是使用的测试数据集，batch_size是batch的大小，data_args是数据集的设置信息，model_path要评估模型的路径。

if __name__ == "__main__":
    paddle.init(use_gpu=True, trainer_count=2)
    # 设置数据参数
    data_args = data_provider.Settings(
        data_dir='../data',
        label_file='../data/label_list',
        resize_h=cfg.IMG_HEIGHT,
        resize_w=cfg.IMG_WIDTH,
        mean_value=[104, 117, 124])
    # 开始评估
    eval(eval_file_list='../data/test.txt',
         batch_size=4,
         data_args=data_args,
         model_path='../models/params_pass.tar.gz')

评估输出的结果如下：

TestCost: 1.813083, Detection mAP=90.5595

预测数据

获取预测数据

首先我们先要找几张图像来作为预测的数据，我们在网上下载几张之前没有使用到的图像，把它们存放在images/infer/目录下，并在images/infer.txt文件中写入它们的路径，如下：

infer/000001.jpg
infer/000002.jpg
infer/000003.jpg
infer/000004.jpg
infer/000005.jpg
infer/000006.jpg

获取预测结果

然后通过调用预测函数就可以获取到预测结果，并且把预测结果存放在images/infer.res。eval_file_list是要用来预测的数据集，就是上面获得的图像路径文件；save_path是保存预测结果的路径，预测的结果会存放在这个文件中；batch_size是batch的大小；data_args是数据集的设置信息；model_path要使用模型的路径；threshold筛选的最低得分。

if __name__ == "__main__":
    paddle.init(use_gpu=True, trainer_count=2)
    # 设置数据参数
    data_args = data_provider.Settings(
        data_dir='../images',
        label_file='../data/label_list',
        resize_h=cfg.IMG_HEIGHT,
        resize_w=cfg.IMG_WIDTH,
        mean_value=[104, 117, 124])
    # 开始预测,batch_size只能设置为1，否则会数据丢失
    infer(
        eval_file_list='../images/infer.txt',
        save_path='../images/infer.res',
        data_args=data_args,
        batch_size=1,
        model_path='../models/params_pass.tar.gz',
        threshold=0.3)

预测的结果保存的文件格式是：图像的路径分类的标签目标框的得分 xmin ymin xmax ymax，具体如下：

infer/000001.jpg        0       0.9999114       357.44736313819885 521.2164137363434 750.5996704101562 648.5584638118744
infer/000002.jpg        0       0.9970805       102.86840772628784 94.18213963508606 291.60091638565063 155.58562874794006
infer/000003.jpg        0       0.7187747       222.9731798171997 168.14028024673462 286.6227865219116 194.68939304351807
infer/000004.jpg        0       0.9988129       197.94835299253464 177.8149015903473 285.8962297439575 218.93768119812012
infer/000005.jpg        0       0.9149439       98.09065014123917 288.86341631412506 237.42297291755676 331.9027876853943
infer/000005.jpg        0       0.9114895       544.3056106567383 235.35346180200577 674.311637878418 283.9097347855568
infer/000006.jpg        0       0.92390853      265.203565120697 277.6864364147186 412.7485656738281 344.3739159107208

显示预测结果

预测的结果是一串数据，对于我们来说，并不是很直观，我们同样要编写一个程序，让它把每张图像的车牌框出来。程序的核心代码如下：

# 读取每张图像
for img_path in all_img_paht:
    im = cv2.imread('../images/' + img_path)
    # 为每张图像画上所有的框
    for label_1 in all_labels:
        label_img_path = label_1[0]
        # 判断是否是统一路径
        if img_path == label_img_path:
            xmin, ymin, xmax, ymax = label_1[3].split(' ')
            # 类型转换
            xmin = float(xmin)
            ymin = float(ymin)
            xmax = float(xmax)
            ymax = float(ymax)
            # 画框
            cv2.rectangle(im, (int(xmin), int(ymin)), (int(xmax), int(ymax)), (0, 255, 0), 3)
    # 保存画好的图像
    names = img_path.strip().split('/')
    name = names[len(names)-1]
    cv2.imwrite('../images/result/%s' % name, im)

最后通过在入口调用该方法就可以，画好的框的图像都会保存到images/result/目录下，代码如下：

if __name__ == '__main__':
    # 预测的图像路径文件
    img_path_list = '../images/infer.txt'
    # 预测结果的文件路径
    result_data_path = '../images/infer.res'
    # 保存画好的图像路径
    save_path = '../images/result'
    show(img_path_list, result_data_path, save_path)

预测前的图像：

预测后的图像：

上一章：《我的PaddlePaddle学习之路》笔记九——使用VOC数据集的实现目标检测

下一章：《我的PaddlePaddle学习之路》笔记十一——新版本Fluid的使用

项目代码

GitHub地址:https://github.com/yeyupiaoling/LearnPaddle

参考资料

http://paddlepaddle.org/
https://github.com/tzutalin/labelImg

PyTorch从入门到实战一次学会

百度飞桨（PaddlePaddle）案例分享：基于 PaddleOCR 的图像文字提取系统 univerbright 百度 paddlepaddle 人工智能 paddleocr 图像文字提取
一、案例背景在实际教学、办公及政务系统中，纸质材料（如手写作文、表格、试卷等）仍广泛存在。为提升信息处理效率，采用OCR（OpticalCharacterRecognition）技术将图像中的文字提取为可编辑文本已成为刚需。本项目基于开源深度学习库PaddleOCR，构建了一个轻量级的图像文字识别工具，能够自动识别图像中的中文文本，并提供置信度评估和可视化支持。该工具特别适用于作业扫描图像中的内容
视觉模型部署实践：低算力平台RV1106上高效部署paddlepaddle 的PicoDet目标检测模型的技术实践位东风视觉模型部署实践 paddlepaddle 目标检测人工智能 iot 物联网嵌入式硬件
在资源受限的嵌入式设备上实现高精度、低延迟的目标检测，是当前智能摄像头、边缘计算等应用中的关键挑战。本文以Rockchip的RV1106嵌入式平台为例，结合百度开源的轻量级检测模型PicoDet，探讨如何通过模型优化与硬件加速，在有限的计算资源下实现高效的实时目标检测。目前该模型测试可以达到25fps左右一、背景介绍1.1RV1106硬件特性主频：1.2GHzArmCortex-A55CPU内存：
使用PaddleOCR读取pdf内容，输出txt文本只有左边一个小酒窝 Paddle pdf paddle 人工智能
使用PaddleOCR读取PDF内容并输出为TXT文本，可以通过以下步骤实现。PaddleOCR是一个基于PaddlePaddle的OCR工具，支持多种语言的文本识别。一、安装依赖确保已安装PaddleOCR和相关的依赖库。以下是代码中涉及的依赖库及其功能说明：os所属语言：Python内置标准库功能：提供操作系统相关功能，如文件路径操作、目录管理等。示例用途：在处理文件时获取路径、创建目录等。f
如何制作属于自己的图片OCR功能 hit56笔记机器学习
文章目录一、百度的PaddlePaddle二、一个开源软件三、谷歌的OCR实践方案1.安装软件包2.安装语言包3.运行代码三、facebook的抠图模型四、参考文献经过本人的多次实践探索，已上线至我的网站：www.hit56.com，可以在上面直接体验图片OCR功能一、百度的PaddlePaddlehttps://github.com/PaddlePaddle/PaddleOCR二、一个开源软件h
百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13% 吴脑的键客人工智能百度 paddlepaddle ocr
百度飞桨PaddleOCR3.0开源发布2025年5月20日，百度飞桨团队正式发布了PaddleOCR3.0版本，并将其开源。这一新版本在文字识别精度、多语种支持、手写体识别以及高精度文档解析等方面取得了显著进展，进一步提升了PaddleOCR在OCR领域的技术实力和应用价值。开源地址:https://github.com/PaddlePaddle/PaddleOCR技术亮点全场景文字识别模型PP
Python、PyTorch、TensorFlow和飞桨（PaddlePaddle）的核心介绍及对比非小号 AI python pytorch tensorflow
以下是Python、PyTorch、TensorFlow和飞桨（PaddlePaddle）的核心介绍及对比，帮助你快速理解它们的定位与适用场景：一、Python：AI开发的基石语言定位：通用高级编程语言，以简洁语法和丰富库生态著称。核心优势：易学易用：代码可读性强，适合快速原型开发。生态丰富：拥有NumPy（科学计算）、Pandas（数据处理）、Matplotlib（可视化）等基础库，以及Scik
飞桨（PaddlePaddle）在机器学习全流程（数据采集、处理、标注、建模、分析、优化）非小号 AI paddlepaddle 机器学习人工智能
以下是飞桨（PaddlePaddle）在机器学习全流程（数据采集、处理、标注、建模、分析、优化）中常用的模型、函数及工具链，结合其生态特点分类说明：一、数据采集与标注1.数据采集工具PaddleX（图像/视频场景）功能：支持图像分类、目标检测、语义分割任务的数据标注，集成标注工具（如矩形框、多边形标注）。官网工具：PaddleX数据标注工具用法：通过图形化界面或命令行启动标注工具，输出标准VOC/
通过paddlehub简单几行代码实现OCR识别 bobfreedman AI ocr
一、前置条件1、ubuntu系统2、python3、pip已经安装完毕3、paddlepaddle、paddlehub、cv2、gradio、matplotlib安装完毕二、实现代码ocr.pyimportpaddlehubashubimportmatplotlib.pyplotaspltimportmatplotlib.imageasmpimgimportgradioasgrimportcv2o
PaddleHub一键OCR中文识别 jiabiao1602 ocr
PaddleHub是百度飞桨（PaddlePaddle）深度学习框架下的一个预训练模型应用工具，它为用户提供了丰富的高质量预训练模型和便捷的开发方式。这里我们仅介绍其在OCR中文识别方面的应用。一、PaddleHub介绍先让文心一言给我们介绍PaddleHub，以下是文心一言的答案。PaddleHub是百度飞桨（PaddlePaddle）深度学习框架下的一个预训练模型应用工具，它为用户提供了丰富的
搭建本地OCR服务(Paddlepaddle) Johannisberger_ numpy pip conda
1.先安装conda软件并创建conda虚拟环境指定好python版本下载conda：https://www.anaconda.com/download/安装并配置好环境变量创建虚拟环境：condacreate--nameocrpython=3.82.安装paddlepaddle下载paddlepaddlehttps://www.paddlepaddle.org.cn/根据设备情况安装cpu版本/
PaddleHub识别中文人名实战记录及心得 Jason-Lai NLP 人工智能 python 自然语言处理
一,简介与特性便捷地获取PaddlePaddle生态下的预训练模型，完成模型的管理和一键预测。配合使用Fine-tuneAPI，可以基于大规模预训练模型快速完成迁移学习，让预训练模型能更好地服务于用户特定场景的应用,PaddleHub旨在为开发者提供丰富的、高质量的、直接可用的预训练模型【模型种类丰富】:涵盖大模型、CV、NLP、Audio、Video、工业应用主流六大品类的400+预训练模型，全
2025转行指南：Java开发工程师转AI工程师，附全网最详细的大模型学习路线 AI小白熊 java 人工智能学习大模型程序员 ai 开发语言
关键要点研究表明，Java开发工程师转AI工程师需要学习数学、Python编程、机器学习和深度学习等技能。证据显示，掌握TensorFlow、PyTorch等框架和云部署技术（如Aliyun、AWS）也很重要。学习资源包括Coursera的免费课程、DiveintoDeepLearning书和国内平台如PaddlePaddle。技能和学习资料概述所需技能要从Java开发工程师成功转型为AI工程师，
paddle ocr本地化部署进行文字识别隐形喷火龙 Python paddle ocr
一、Paddle简介1.基本概念Paddle（全称PaddlePaddle，飞桨）是百度开发的开源深度学习平台，也是中国首个自主研发、功能丰富、技术领先的工业级深度学习平台。它覆盖了深度学习从数据准备、模型训练、模型部署到预测的全流程，旨在帮助开发者快速实现AI应用。2.核心特点全场景覆盖：支持云端、边缘端、移动端等多硬件环境，适配CPU、GPU、FPGA等多种芯片。易用性与高效性：提供简洁的AP
PaddlePaddle 和PyTorch选择与对比互斥不懂球的小胖 ai python 大模型 paddlepaddle pytorch 人工智能
你遇到的错误信息如下：RuntimeError:(PreconditionNotMet)Tensor'sdimensionisoutofbound.Tensor'sdimensionmustbeequalorlessthanthesizeofitsmemory.ButreceivedTensor'sdimensionis8,memory'ssizeis0.[Hint:Expectednumel()
使用paddlepaddle框架构建ViT用于CIFAR10图像分类 sherlockjjobs 深度学习 Python python 深度学习图像分类
使用paddlepaddle框架构建ViT用于CIFAR10图像分类硬件环境：GPU(1*NVIDIAT4)运行时间：一个epoch大概一分钟importpaddleimporttimeimportpaddle.nnasnnimportpaddle.nn.functionalasFimportpaddle.vision.transformsastransformsfrompaddle.ioimpo
Python基础paddlepaddle 愚昧之山绝望之谷开悟之坡 PaddlePaddle NLP基础知识 python
print(math.ceil(4.1))#返回数字的上入整数print(math.floor(4.9))#返回数字的下舍整数字符串单引号、双引号、三引号print(‘HelloWorld!’)print(“HelloWorld!”)转义字符\print(“The\tisatab”)print(‘I’mgoingtothemovies’)TheisatabI’mgoingtothemovies三引
PaddlePaddle最简单的例子：利用python api调用paddle实现模型加载与预测少安的砖厂 PaddlePaddle开发
调用fluid的python接口：importpaddle.fluidasfluid图片操作：fromPILimportImage矩阵操作：importnumpyasnpexe=fluid.Executor(fluid.CPUPlace())//设置model的地址，在model_path字符型变量中保存[inference_program,feed_target_names,fetch_targ
深度学习框架：PaddlePaddle基础白拾ShiroX #深度学习网络 python 机器学习人工智能深度学习
介于CSDN的排版问题，这里附个人博客连接。https://discover304.top/2021/12/02/2021q4/107-4-dl-pdpd-base/说明本页面无手机端适配，强制缩放阅读。使用纯html格式，保存教学用ppt，添加了部分个人笔记。目录工作正常，可以跳转。b{color:rgba(0,0,0,0.75)}PaddlePaddle概述PaddlePaddle概述Padd
AI同声传译基于PaddlePaddle框架的开源方案介绍 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介随着人工智能技术的不断发展，越来越多的人将注意力集中在语音识别、机器翻译等领域，而这些技术虽然有其优点，但也面临着一些挑战。其中之一就是长文本翻译、多语言语音合成的难题，特别是在大规模数据和大型模型的情况下。为了解决这个问题，业界提出了许多有效的技术措施，如同声传译、分词对齐、强制教学等。在最近几年里，随着深度学习框架的火爆，出现了一系列基于神经网络的开源技术方
转行指南：Java开发工程师转AI工程师，附大模型学习路线和老莫一起学AI java 人工智能学习 langchain 语言模型 ai 大模型
关键要点研究表明，Java开发工程师转AI工程师需要学习数学、Python编程、机器学习和深度学习等技能。证据显示，掌握TensorFlow、PyTorch等框架和云部署技术（如Aliyun、AWS）也很重要。学习资源包括Coursera的免费课程、DiveintoDeepLearning书和国内平台如PaddlePaddle。技能和学习资料概述所需技能要从Java开发工程师成功转型为AI工程师，
python批量去除图片文字水印数据服务生 python 开发语言
#!/usr/bin/envpython#-*-coding:utf-8-*-#需要安装的库#pipinstallpaddlepaddle-ihttps://mirrors.aliyun.com/pypi/simple/#pipinstallpaddleocr-ihttps://mirrors.aliyun.com/pypi/simple/#pipinstallcv2-ihttps://mirro
探索高效目标检测新境界：PyTorch版PP-YOLOE全面解析与应用指南乌芬维Maisie
探索高效目标检测新境界：PyTorch版PP-YOLOE全面解析与应用指南PPYOLOE_pytorch项目地址:https://gitcode.com/gh_mirrors/pp/PPYOLOE_pytorch在目标检测的浩瀚星空里，有一颗璀璨的新星——PP-YOLOE。这个基于Pytorch实现的项目，不仅承袭了PaddlePaddle版PP-YOLOE和Megvii的YOLOX的精粹，还实现
深度学习篇---模型GPU训练 Ronin-Lotus 图像处理篇深度学习篇上位机知识篇深度学习人工智能 python openmp paddlepaddle pytorch 并行
文章目录前言一、在PaddlePaddle框架下使用GPU训练模型步骤1：确保环境准备就绪硬件软件步骤2：确认GPU可用步骤3：设置使用的GPU设备步骤4：定义模型步骤5：将模型移到GPU步骤6：准备数据并移到GPU步骤7：定义损失函数和优化器步骤8：训练模型二、在PyTorch框架下使用GPU训练模型步骤1：确保环境准备就绪硬件软件步骤2：确认GPU可用步骤3：设置使用的GPU设备步骤4：定义模
PaddlePaddle Uie-Base 信息抽取 weixin_37806923 paddlepaddle 人工智能
微调代码，打标签后的文件放在work目录下不会被删除，若放在data下重启环境后会被删掉pythondoccano.py\--doccano_file./work/admin.jsonl\--task_typeext\--save_dir./data\--splits0.80.20\--schema_langchexportfinetuned_model=./checkpoint/model_be
深度学习篇---PaddleDetection&PaddleOCR Ronin-Lotus 程序代码篇深度学习篇上位机知识篇深度学习 paddlepaddle 人工智能 python paddledetection paddleocr
文章目录前言1.代码2.代码介绍2.1**导入模块**2.2**配置区域**2.3ExpressInfoProcessor类2.4**主程序**：3.使用说明3.1环境准备3.2模型准备3.3数据库初始化3.4串口配置3.5信息提取优化3.6注意事项前言本文简单介绍了PaddleDetection和PaddleOCR相结合的示例代码，通过两个PaddlePaddle框架下的工具包结合使用同时达到图
飞桨Paddle Inference模型转ONNX模型的方法 Sweet锦 AI paddlepaddle 人工智能 AI编程
ONNX是个好东西，其全称OpenNeuralNetworkExchange，是一种用于表示和交换深度学习模型的开放标准格式。由Microsoft和Facebook在2017年共同推出的一个开放标准，旨在促进不同深度学习框架之间的互操作性，并采用相同格式存储模型数据。ONNX有诸多优势，简直让人爱不释手呀。以下简单列举几个：在不同深度学习框架（如PaddlePaddle、PyTorch、Tenso
1.1PaddleTS_环境配置：一个易用的深度时序建模的Python库 pythonQA python paddlepaddle
PaddleTS是一个易用的深度时序建模的Python库，它基于飞桨深度学习框架PaddlePaddle，专注业界领先的深度模型，旨在为领域专家和行业用户提供可扩展的时序建模能力和便捷易用的用户体验。PaddleTS的主要特性包括：设计统一数据结构，实现对多样化时序数据的表达，支持单目标与多目标变量，支持多类型协变量封装基础模型功能，如数据加载、回调设置、损失函数、训练过程控制等公共方法，帮助开发
安装cpu版本的paddleocr NO1212 python
1.CPU版的PaddlePaddlepython-mpipinstallpaddlepaddle==2.6.1-ihttps://mirror.baidu.com/pypi/simple2、验证安装安装完成后您可以使用python进入python解释器，输入importpaddle，再输入paddle.utils.run_check()如果出现PaddlePaddleisinstalledsuc
Windows下的PaddleOCR本地部署 wangkun_cl 开源软件
目录一、环境配置（一）PaddlePaddle运行环境部署1.安装anaconda（网上教程很多很详细）2.创建环境3.激活环境并在该环境下安装PaddlePaddle框架4.下载requirments.txt中的库（二）PaddleOCR安装【非重点】二、在自己的数据集上训练模型（一）制作自己的数据集1.安装PPOCRLabel并为自己的数据打标签，构建数据集2.数据集的划分（二）训练1.文本检
paddleOCR处理PDF遇到问题被编程为难的小娃娃 pdf paddlepaddle ocr 笔记
前提安装是上一篇，langchain的加载和分割参考博客：使用paddleOCR批量识别pdf_paddleocrpdf-CSDN博客遇到问题如下图。个人怀疑文档中有长表内容（是倒立的那种长表）--补充编辑，确实如此，解决方案后续优化了再发状态：目前未解决。在上一篇博客的基础上新增pippipinstallpaddlepaddlepipinstallpaddlehub(这里本来参考的这位博主，但是
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin