bikede

用PaddleDetection做一个完整的目标检测项目（上）

文章转载自：微信公众号：飞桨PaddlePaddle的微信文章
原文章中由于排版问题，导致文字遮挡，不便阅读，因此对文章格式稍作更改，增加了一些关键词加粗，便于后续阅读。

PaddleDetection 是百度飞桨推出的物体检测统一框架。支持现有的RCNN、SSD、YOLO等系列模型、支持 ResNet、ResNet-VD、ResNeXt、ResNeXt-VD、SENet、MobileNet、DarkNet等主干网络。针对不同的业务场景（性能、目标大小、准确率等）可以选择框架中的不同模块组合得到最适合的模型，实现任务。相比于tensorflow的Object_Detection,优势之一就是将YOLOv3这一目标检测的快速算法融合到了框架下。
文章将以一个Yolov3 识别水果的例子为说明，详解如何利用PaddleDetection完成一个项目。

项目用到的工具
硬件： Win10(RTX2060)笔记本、某品牌服务器（4*T4）工业相机（Hikvision）
软件： pycharm、VS2019。

目录：
01 环境部署
- 1.1 安装PaddlePaddle
- 1.2 安装COCO-API
- 1.3 选择一个文件夹，下载PaddleDetection
- 1.4 安装所需的Python其他依赖库
- 1.5 确认测试通过
02 数据集的准备
- 2.1 数据标注：
- 2.2 创建VOC数据集格式
03 训练
- 3.1 修改配置文件
- 3.2 训练相关可选参数说明
- 3.3 预训练模型来源
- 3.4 常见错误
04 训练过程可视化
05 模型导出
06 模型推断
- 6.1 修改配置文件
- 6.2 使用单张图片进行预测
- - 1）主要参数说明：
  - 2）更多参数
  - 3）注意
- 6.2 使用一个文件夹中图片进行预测

01 环境部署

1.1 安装PaddlePaddle

利用anaconda创建一个名字叫做paddle-detection的Paddle环境（备注：下文中命令提示窗口出现的（paddle）是指该项目环境的名称叫做paddle）。安装链接如下：PaddlePaddle

1.2 安装COCO-API

pip install Cython
pip install git+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI

1.3 选择一个文件夹，下载PaddleDetection

第一种方式：直接从github官网上进行下载：PaddleDetection

第二种方式：使用git进行下载：

git clone https://github.com/PaddlePaddle/PaddleDetection.git

1.4 安装所需的Python其他依赖库

依赖库文档在requirements.txt中给出，可使用

pip install -r requirements.txt

如下图所示是requirements.txt文档中的内容。

如图为requirements文件中的内容，图中所示的均为PaddleDetection的依赖库。
在下图所示内容中打 “cmd”，然后出现在该路径的命令提示符。

激活环境，并且 pip install -r requirements.txt

然后运行
当显示Successfully…… ，基本上表示安装完成了，具体是否成功，下一步的测试验证。

1.5 确认测试通过

set PYTHONPATH=`pwd`<在这里插入地址>:$PYTHONPATH
python ppdet/modeling/tests/test_architectures.py

备注： 在paddle自带的文档中为export PYTHONPATH=pwd:$PYTHONPATH

export是Linux下的用法，在Windows下将exoprt改成set。

但是发现运行报错，报错内容如下：

错误提示发现缺少 “ppdet” 这个模块，ppdet（其实就是paddle detection的一个缩写），但是我们在项目的路径里面可以发现有这个模块，原因就是，我们的代码所在的路径无法读取到该文件下的代码，因此，我们需要在代码中进行改进一下。
找到 ppdet/modeling/tests/test_architectures.py这个文件，然后添加红框所示的代码。
备注： 第二个红框里面的路径是我的项目路径。

出现如图所示的代码，表示运行成功。

至此，所有的运行环境已经配置成功。

02 数据集的准备

2.1 数据标注：

目前项目使用的数据集格式是VOC数据格式，使用labelimg作为标注工具，标注工具的下载安装见链接：labelimg

特别说明： 项目中使用的数据集是PaddleDetection提供的演示示例数据集，下文将通过使用该数据集来说明。
首先，下载该数据集，下载地址：水果数据集百度盘地址 提取码： vw3b
下载后如下图所示：
标注方式如下：

打开软件，并导入图片：

选取标注文件的保存路径：

点击Change Save Dir ，然后将标注文件保存在某一个路径下。

开始标注：点击Create\nRectBo—框选目标–命名（下图中命名为apple）–点击OK—点击Save（完成一张）–点击Next Image 标注下一张。

所有标注完成以后会生成很多的xml文件。

打开一个xml文件：

具体信息如下：

2.2 创建VOC数据集格式

其中Annotations存放标注生成的xml文件，JPEGImage存放图片，ImageSets存放对训练集和数据集的划分。ImageSet下有Main文件，Mian下需要建立一个label_list.txt。label_list.txt是指标注的目标的名称。其内容如下：

备注： train.txt、val.txt是根据下文中代码（该代码会命名为：get_list.py，放置在了数据集链接的文件里面）生成，分别是对训练集和验证集的划分：

接上文所述，是生成生成train.txt、val.txt的代码，该代码会将300张水果图片分成240张训练集和60张验证集。

import os
import random

train_precent=0.7
xml="C:/Users/zhili/Desktop/fruit-detection/Annotations"
save="C:/Users/zhili/Desktop/fruit-detection/ImageSets/Main"
total_xml=os.listdir(xml)

num=len(total_xml)
tr=int(num*train_precent)
train=range(0,tr)

ftrain=open("C:/Users/zhili/Desktop/fruit-detection/ImageSets/Main/train.txt","w")
ftest=open("C:/Users/zhili/Desktop/fruit-detection/ImageSets/Main/test.txt","w")

for i in range(num):
    name=total_xml[i][:-4]+"\n"
    if i in train:
        ftrain.write(name)
    else:
        ftest.write(name)
ftrain.close()
ftest.close()

如下图是生成的train文件。

备注： 在Main文件夹中生成的train.txt文件和val.txt文件仅仅是对数据集的划分，还需要进一步的利用如下代码（create_list.py，该代码是paddle提供的）生成含有路径信息以及图像和xml文件一一对应的文件。

import osimport os.path as osp
import re
import random

devkit_dir = './'
years = ['2007', '2012']


def get_dir(devkit_dir,  type):
    return osp.join(devkit_dir, type)


def walk_dir(devkit_dir):
    filelist_dir = get_dir(devkit_dir, 'ImageSets/Main')
    annotation_dir = get_dir(devkit_dir, 'Annotations')
    img_dir = get_dir(devkit_dir, 'JPEGImages')
    trainval_list = []
    test_list = []
    added = set()

    for _, _, files in os.walk(filelist_dir):
        for fname in files:
            img_ann_list = []
            if re.match('train\.txt', fname):
                img_ann_list = trainval_list
            elif re.match('val\.txt', fname):
                img_ann_list = test_list
            else:
                continue
            fpath = osp.join(filelist_dir, fname)
            for line in open(fpath):
                name_prefix = line.strip().split()[0]
                if name_prefix in added:
                    continue
                added.add(name_prefix)
                ann_path = osp.join(annotation_dir, name_prefix + '.xml')
                img_path = osp.join(img_dir, name_prefix + '.jpg')
                assert os.path.isfile(ann_path), 'file %s not found.' % ann_path
                assert os.path.isfile(img_path), 'file %s not found.' % img_path
                img_ann_list.append((img_path, ann_path))

    return trainval_list, test_list


def prepare_filelist(devkit_dir, output_dir):
    trainval_list = []
    test_list = []
    trainval, test = walk_dir(devkit_dir)
    trainval_list.extend(trainval)
    test_list.extend(test)
    random.shuffle(trainval_list)
    with open(osp.join(output_dir, 'train.txt'), 'w') as ftrainval:
        for item in trainval_list:
            ftrainval.write(item[0] + ' ' + item[1] + '\n')

    with open(osp.join(output_dir, 'val.txt'), 'w') as ftest:
        for item in test_list:
            ftest.write(item[0] + ' ' + item[1] + '\n')


if __name__ == '__main__':
    prepare_filelist(devkit_dir, '.')

这个时候的新生成的train.txt的内容如下：

最终生成如下所示的数据集格式如下，其中label_list.txt和Mian中的label_list.txt一致。train.txt文件和val.txt是新生成的图像-xml的名称路径对应文件。

该完成后的数据集作者放置在了项目文件夹下：dataset/fruit下，并命名为该文件夹为fruit-detection，如下图所示。
数据集生成后就可以根据如下的命令进行训练。

03 训练

3.1 修改配置文件

在训练之前，首先了解模型的配置文件，如文章开头所述：PaddleDetection 是飞桨推出的物体检测统一框架。支持现有的RCNN、SSD、YOLO等系列模型、支持 ResNet、ResNet-VD、ResNeXt、ResNeXt-VD、SENet、MobileNet、DarkNet等主干网络。而实现我们如何快速的完成不同模型的训练体验，就是需要依靠配置文件的切换。
如下所示就是该项目配置文件 （config文件） 的路径：

如图下图就是我们选取的深度学习的配置文件，我们选取yolov3_mobilenet_v1_fruit.yml做为本项目的训练配置文件。该配置文件是使用YOLO v3的模型结构，同时主干网络为 Mobilenrt V1。
这些参数可以根据我们自己的数据情况进行设计。
如设置：
最大迭代步数：max_iters
预训练模型的来源：pretrain_weights
数据路径：dataset_dir
Batch_size的大小：batch_size
数据集类别：num_classes

需要着重关注点如下：需要根据自己的不同数据集进行训练。

3.2 训练相关可选参数说明

在将config文件配置好了以后，就可以进行训练

set PYTHONPATH=$PYTHONPATH:.
set CUDA_VISIBLE_DEVICES=0（默认只有一个GPU） 
python -u tools/train.py -c configs/yolov3_mobilenet_v1_fruit.yml --use_tb=True --tb_log_dir=tb_fruit_dir/scalar --eval

运行如下命令，即可开始训练

出现如下图所示现象，可以表示为训练正常，可等待训练结束。

关于训练命令的阐述：

-c configs/yolov3_mobilenet_v1_fruit.yml 用来指定配置文件

–use_tb 是否使用tb-paddle记录数据，进而在TensorBoard中显示，默认值是False

–tb_log_dir 指定 tb-paddle 记录数据的存储路径

–eval 是否边训练边测试

备注：
关于–eval参数的使用：
在训练中交替执行评估, 评估在每个snapshot_iter时开始。每次评估后还会评出最佳mAP模型保存到best_model文件夹下，建议训练时候使用该参数，可以使得完成训练后快速找到最好的模型。

可选参数列表
以下列表可以通过 –help 查看

FLAG	支持脚本	用途	默认值	备注
-c	ALL	指定配置文件	None
-o	ALL	设置配置文件里的参数内容	None	使用-o配置相较于-c选择的配置文件具有更高的优先级。例如：-o use_gpu=False max_iter=10000
-r/–resume_checkpoint	train	从某一检查点恢复训练	None	-r output/faster_rcnn_r50_1x/10000
–eval	train	是否边训练边测试	False
–output_eval	train/eval	编辑评测保存json路径	当前路径	–output_eval ./json_result
–fp16	train	是否使用混合精度训练模式	False	需使用GPU训练
–loss_scale	train	设置混合精度训练模式中损失值的缩放比例	8.0	需先开启–fp16后使用
–json_eval	eval	是否通过已存在的bbox.json或者mask.json进行评估	False	json文件路径在–output_eval中设置
–output_dir	infer	输出推断后可视化文件	./output	–output_dir output
–draw_threshold	infer 可视化时分数阈值	0.5	–draw_threshold 0.7
–infer_dir	infer	用于推断的图片文件夹路径	None
–infer_img	infer	用于推断的图片路径	None	相较于–infer_dir具有更高优先级
–use_tb	train/infer	是否使用tb-paddle记录数据，进而在TensorBoard中显示	False

Fine-tune其他任务
使用预训练模型fine-tune其他任务时，可采用如下两种方式：

在YAML配置文件中设置finetune_exclude_pretrained_params
在命令行中添加-o finetune_exclude_pretrained_params对预训练模型进行选择性加载。

python -u tools/train.py -c configs/faster_rcnn_r50_1x.yml \
                       -o pretrain_weights=output/faster_rcnn_r50_1x/model_final/ \
                          finetune_exclude_pretrained_params=['cls_score','bbox_pred']

提示:

CUDA_VISIBLE_DEVICES 参数可以指定不同的GPU。例如: export CUDA_VISIBLE_DEVICES=0,1,2,3. GPU计算规则可以参考 FAQ
若本地未找到数据集，将自动下载数据集并保存在~/.cache/paddle/dataset中。
预训练模型自动下载并保存在〜/.cache/paddle/weights中。
模型checkpoints默认保存在output中，可通过修改配置文件中save_dir进行配置。
RCNN系列模型CPU训练在PaddlePaddle 1.5.1及以下版本暂不支持。

混合精度训练
通过设置 --fp16 命令行选项可以启用混合精度训练。目前混合精度训练已经在Faster-FPN, Mask-FPN 及 Yolov3 上进行验证，几乎没有精度损失（小于0.2 mAP)。
建议使用多进程方式来进一步加速混合精度训练。示例如下。

python -m paddle.distributed.launch --selected_gpus 0,1,2,3,4,5,6,7 tools/train.py --fp16 -c configs/faster_rcnn_r50_fpn_1x.yml

3.3 预训练模型来源

关于预训练模型的来源：
在本案例中，预训练模型是通过一个链接方式在训练开始时候加载进行下载的，其实飞桨提供了丰富的预训练模型库，具体链接为：
MODEL_ZOO

3.4 常见错误

训练过程出现的一个错误：
作者使用的电脑是笔记本，显卡型号是RTX2060 显存为6G。在训练过程中出现如下错误。

通过命令提示符中发现，竟然出现了(7184, 7184, 3)这样大的图片，而本身数据像素多数为1000*1000左右。解决改问题的方式有两个:

第一个是修改配置文件中的bufsize这个参数，将该值由128改成64（备注，PaddleDetection新更新的配置文件文档中，已经将该值设置成为32），即可正常运行。在这里解释一下：PaddleDetection YOLOv3系列模型训练时，由于图像增强等预处理方式较多，默认会开启多进程加速，子进程完成图像读取，图像增强等预处理后，会将输出结果放到一个队列里面等待模型训练时获取，bufsize这个参数即为该队列的最大长度，该队列存储在内存中，若机器内存较小并且队列长度bufsize设置得较大，就会有上述报错，报错内容为内存不够，无法给队列继续分配内存。这个时候只要把bufsize调小一些保存内存足够放下队列即可。

第二个方式是修改配置文件中的ratio的参数，将该值由4.0改成了2.0，即可正常运行。PaddleDetection中设置了数据增强功能：在RandomExpand这种数据增强里，首先新建一张(原图大小 * ratio)大小的空白图片，然后在这张空白图片上随机找个位置，把原图贴上去，之后再把这张新图片缩放成原图大小。当然如果显存足够大的话，也可以按照默认值来。

04 训练过程可视化

训练期间可以通过tensorboard实时观察loss和精度值，启动命令如下：

tensorboard --logdir tb_fruit_dir/scalar

05 模型导出

当我们训练完成后，在项目文件的output中可以看到我们生成的模型文件，在代码中我们设置模型每迭代200步保存一次，训练总共有20000步，因此会生成100个训练文件，由于我们使用 --eval参数进行边训练边测试，因此我们可以获得训练过程中最好的模型文件，我们将做好的模型进行导出。

执行如下命令：

python tools/export_model.py -c configs/yolov3_mobilenet_v1_fruit.yml --output_dir=./inference_model -o weights=output/yolov3_mobilenet_v1_fruit/best_mode

最终导出如下所示：

特别备注 ：目前导出的模型使用是为了后面C++预测的，python预测目前不支持加载导出的模型。

06 模型推断

PaddleDetection给出的模型预测代码是infer.py。该文件在项目文件夹tools里面。改代码提供了两种预测方式第一种是单张图片预测，第二种是以一个文件夹中的图片进行预测。
通过设置不同的预测方式达到自己的目的。如下，使用 –infer_img=demo/xxx.jpg 为单张图片进行预测，使用 –infer_dir=demo 为用一个文件夹进行预测。其中demo是放置测试图片的地方

6.1 修改配置文件

推断使用的配置文件与训练不同，格式可以参考tools/cpp_demo.yml文件，更改后重命名为yolov3_mobilenet_v1_fruit.yml，保存到out文件夹下。

# demo for cpp_infer.py

use_python_inference: true # whether to use python inference
mode: FP16 # trt_fp32, trt_fp16, trt_int8, fluid
arch: YOLO # YOLO, SSD, RCNN, RetinaNet
min_subgraph_size: 3 # need 3 for YOLO arch

# visualize the predicted image
metric: COCO # COCO, VOC
draw_threshold: 0.5

Preprocess:
- type: Resize
  target_size: 608
  max_size: 640
- type: Normalize
  mean:
  - 0.485
  - 0.456
  - 0.406
  std:
  - 0.229
  - 0.224
  - 0.225
  is_scale: True
- type: Permute
  to_bgr: False
- type: PadStride
  stride: 0 # set 32 on FPN and 128 on RetinaNet

6.2 使用单张图片进行预测

测试的结果保存在output这个文件夹中

python -u tools/infer.py --model_path=output/model/ --config_path=out/yolov3_mobilenet_v1_fruit.yml --infer_img=demo/orange_71.jpg --visualize

1）主要参数说明：

model_path: inference_model保存路径
config_path: 参数配置、数据预处理配置文件，注意不是训练时的配置文件
infer_img: 待预测图片
visualize: 是否保存可视化结果，默认保存路径为output/

2）更多参数

更多参数可在tools/cpp_demo.yml中查看，主要参数：

use_python_inference:若为true，使用fluid.io.load_inference_model接口，走训练引擎分支预测。
mode:支持fluid、trt_fp32、trt_fp16、trt_int8，当use_python_inference为false时起作用。fluid是通过预测引擎分支预测，trt_fp32、trt_fp16、 trt_int8是通过预测引擎分支预测，后端基于TensorRT的FP32、FP16精度。
min_subgraph_size:当设置mode采用TensorRT时，注意设置此参数。设置与模型arch相关，对部分arch需要调大该参数，一般设置为40适用于所有模型。适当的调小min_subgraph_size会对预测有加速效果，例如YOLO中该参数可设置为3。
Preprocess:数据预处理配置，一般来说顺序为Resize -> Normalize -> Permute，对于FPN模型还需配置PadStride。不同模型的数据预处理参考训练配置中的TestReader部分。

3）注意

基于TensorRT预测，数据预处理Resize设置的shape必须保持与模型导出时shape大小一致。
预处理中PadStride为输入图片右下角填充0，默认设置stride为0，即不对输入图片做padding操作。模型中包含FPN结构时，stride应设置为32。模型为RetinaNet系列模型时，stride应设置为128.
PaddlePaddle默认的GPU安装包(<=1.7)，是不支持基于TensorRT进行预测，如果想基于TensorRT加速预测，需要自行编译，详细可参考预测库编译教程。

特别注意： 类似这种在命令提示符下输入时候，一定注意自己输入过程中的出现的多余空格问题：如下图所示，weights=后面出现了一个多的空格，导致模型文件读不到。

6.2 使用一个文件夹中图片进行预测

测试的结果保存在infer_output这个文件夹中：

python -u tools/infer.py -c configs/yolov3_mobilenet_v1_fruit.yml -o weights=output/yolov3_mobilenet_v1_fruit/best_model --infer_img=demo/test --output_dir=infer_output/testout

说明：

1、该文章多数内容来源于PaddleDetection的文档，链接
PaddleDetection的文档

2、该文章运行环境为Windows10 ，在原有文档基础上修改了一些Linux的用法。增加了创建VOC数据集以及如何划分训练集和验证集。

3、该文章写作过程中，受到了高松鹤同学、百度飞桨同学的大力帮助。

如果您加入官方 QQ 群，您将遇上大批志同道合的深度学习同学。官方 QQ 群：703252161。

你可能感兴趣的:(PaddlePaddle)

「源力觉醒创作者计划」_以FastDeploy为例部署ERNIE-4.5-21B大模型全流程实践 cooldream2009 大模型基础 AI技术文心大模型 FastDeploy
目录前言1环境准备与依赖安装1.1硬件要求1.2Python环境与pip升级2下载ERNIE-4.5模型权重2.1安装HuggingFaceCLI工具2.2设置国内镜像加速（可选）2.3下载模型文件3安装FastDeploy与Paddle推理引擎3.1安装PaddlePaddle-GPU版本3.2安装FastDeploy-GPU4启动ERNIE-4.5本地服务4.1启动OpenAI兼容API服务4
PaddleOCR 3.0全面解析：五大核心能力与实战应用指南经优英
PaddleOCR3.0全面解析：五大核心能力与实战应用指南PaddleOCRAwesomemultilingualOCRtoolkitsbasedonPaddlePaddle(practicalultralightweightOCRsystem,support80+languagesrecognition,providedataannotationandsynthesistools,suppor
python --飞浆离线ocr使用/paddleocr
依赖#python==3.7.3paddleocr==2.7.0.2paddlepaddle==2.5.2loguru==0.7.3frompaddleocrimportPaddleOCRimportcv2importnumpyasnpif__name__=='__main__':OCR=PaddleOCR(use_doc_orientation_classify=False,#检测文档方向use
paddleOCR模型的安装和使用九日卯贝 paddle ocr
paddleOCR仓库：https://github.com/PaddlePaddle/PaddleOCR?tab=readme-ov-file文档：https://paddlepaddle.github.io/PaddleOCR/main/quick_start.html#2-paddleocr环境安装python-mpipinstallpaddlepaddle-gpu==3.0.0b1-iht
paddlepaddle测试安装_python3.7中安装paddleocr及paddlepaddle包的多种方法瓦啦
升级pippip版本必须升级到20.0.4版本才能应用；方法一、在pycharm中对pip进行升级；方法二、通过命令进行升级python3.7-mpipinstall--upgradepip下载paddleOCR下载链接：https://github.com/PaddlePaddle/PaddleOCR打开paddleOCR文件夹中requirements.txt文件，更改文件中opencv-py
ali docker部属paddleocr 大熊程序猿 ASP.NET Core docker 容器运维
dockerpullregistry.baidubce.com/paddlepaddle/paddle:2.6.0nano/root/projects/paddleocr_server.py========================fromflaskimportFlask,requestfromwerkzeug.utilsimportsecure_filenameimportuuidfrom
百度飞桨（PaddlePaddle）案例分享：基于 PaddleOCR 的图像文字提取系统 univerbright 百度 paddlepaddle 人工智能 paddleocr 图像文字提取
一、案例背景在实际教学、办公及政务系统中，纸质材料（如手写作文、表格、试卷等）仍广泛存在。为提升信息处理效率，采用OCR（OpticalCharacterRecognition）技术将图像中的文字提取为可编辑文本已成为刚需。本项目基于开源深度学习库PaddleOCR，构建了一个轻量级的图像文字识别工具，能够自动识别图像中的中文文本，并提供置信度评估和可视化支持。该工具特别适用于作业扫描图像中的内容
视觉模型部署实践：低算力平台RV1106上高效部署paddlepaddle 的PicoDet目标检测模型的技术实践位东风视觉模型部署实践 paddlepaddle 目标检测人工智能 iot 物联网嵌入式硬件
在资源受限的嵌入式设备上实现高精度、低延迟的目标检测，是当前智能摄像头、边缘计算等应用中的关键挑战。本文以Rockchip的RV1106嵌入式平台为例，结合百度开源的轻量级检测模型PicoDet，探讨如何通过模型优化与硬件加速，在有限的计算资源下实现高效的实时目标检测。目前该模型测试可以达到25fps左右一、背景介绍1.1RV1106硬件特性主频：1.2GHzArmCortex-A55CPU内存：
使用PaddleOCR读取pdf内容，输出txt文本只有左边一个小酒窝 Paddle pdf paddle 人工智能
使用PaddleOCR读取PDF内容并输出为TXT文本，可以通过以下步骤实现。PaddleOCR是一个基于PaddlePaddle的OCR工具，支持多种语言的文本识别。一、安装依赖确保已安装PaddleOCR和相关的依赖库。以下是代码中涉及的依赖库及其功能说明：os所属语言：Python内置标准库功能：提供操作系统相关功能，如文件路径操作、目录管理等。示例用途：在处理文件时获取路径、创建目录等。f
如何制作属于自己的图片OCR功能 hit56笔记机器学习
文章目录一、百度的PaddlePaddle二、一个开源软件三、谷歌的OCR实践方案1.安装软件包2.安装语言包3.运行代码三、facebook的抠图模型四、参考文献经过本人的多次实践探索，已上线至我的网站：www.hit56.com，可以在上面直接体验图片OCR功能一、百度的PaddlePaddlehttps://github.com/PaddlePaddle/PaddleOCR二、一个开源软件h
百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13% 吴脑的键客人工智能百度 paddlepaddle ocr
百度飞桨PaddleOCR3.0开源发布2025年5月20日，百度飞桨团队正式发布了PaddleOCR3.0版本，并将其开源。这一新版本在文字识别精度、多语种支持、手写体识别以及高精度文档解析等方面取得了显著进展，进一步提升了PaddleOCR在OCR领域的技术实力和应用价值。开源地址:https://github.com/PaddlePaddle/PaddleOCR技术亮点全场景文字识别模型PP
Python、PyTorch、TensorFlow和飞桨（PaddlePaddle）的核心介绍及对比非小号 AI python pytorch tensorflow
以下是Python、PyTorch、TensorFlow和飞桨（PaddlePaddle）的核心介绍及对比，帮助你快速理解它们的定位与适用场景：一、Python：AI开发的基石语言定位：通用高级编程语言，以简洁语法和丰富库生态著称。核心优势：易学易用：代码可读性强，适合快速原型开发。生态丰富：拥有NumPy（科学计算）、Pandas（数据处理）、Matplotlib（可视化）等基础库，以及Scik
飞桨（PaddlePaddle）在机器学习全流程（数据采集、处理、标注、建模、分析、优化）非小号 AI paddlepaddle 机器学习人工智能
以下是飞桨（PaddlePaddle）在机器学习全流程（数据采集、处理、标注、建模、分析、优化）中常用的模型、函数及工具链，结合其生态特点分类说明：一、数据采集与标注1.数据采集工具PaddleX（图像/视频场景）功能：支持图像分类、目标检测、语义分割任务的数据标注，集成标注工具（如矩形框、多边形标注）。官网工具：PaddleX数据标注工具用法：通过图形化界面或命令行启动标注工具，输出标准VOC/
通过paddlehub简单几行代码实现OCR识别 bobfreedman AI ocr
一、前置条件1、ubuntu系统2、python3、pip已经安装完毕3、paddlepaddle、paddlehub、cv2、gradio、matplotlib安装完毕二、实现代码ocr.pyimportpaddlehubashubimportmatplotlib.pyplotaspltimportmatplotlib.imageasmpimgimportgradioasgrimportcv2o
PaddleHub一键OCR中文识别 jiabiao1602 ocr
PaddleHub是百度飞桨（PaddlePaddle）深度学习框架下的一个预训练模型应用工具，它为用户提供了丰富的高质量预训练模型和便捷的开发方式。这里我们仅介绍其在OCR中文识别方面的应用。一、PaddleHub介绍先让文心一言给我们介绍PaddleHub，以下是文心一言的答案。PaddleHub是百度飞桨（PaddlePaddle）深度学习框架下的一个预训练模型应用工具，它为用户提供了丰富的
搭建本地OCR服务(Paddlepaddle) Johannisberger_ numpy pip conda
1.先安装conda软件并创建conda虚拟环境指定好python版本下载conda：https://www.anaconda.com/download/安装并配置好环境变量创建虚拟环境：condacreate--nameocrpython=3.82.安装paddlepaddle下载paddlepaddlehttps://www.paddlepaddle.org.cn/根据设备情况安装cpu版本/
PaddleHub识别中文人名实战记录及心得 Jason-Lai NLP 人工智能 python 自然语言处理
一,简介与特性便捷地获取PaddlePaddle生态下的预训练模型，完成模型的管理和一键预测。配合使用Fine-tuneAPI，可以基于大规模预训练模型快速完成迁移学习，让预训练模型能更好地服务于用户特定场景的应用,PaddleHub旨在为开发者提供丰富的、高质量的、直接可用的预训练模型【模型种类丰富】:涵盖大模型、CV、NLP、Audio、Video、工业应用主流六大品类的400+预训练模型，全
2025转行指南：Java开发工程师转AI工程师，附全网最详细的大模型学习路线 AI小白熊 java 人工智能学习大模型程序员 ai 开发语言
关键要点研究表明，Java开发工程师转AI工程师需要学习数学、Python编程、机器学习和深度学习等技能。证据显示，掌握TensorFlow、PyTorch等框架和云部署技术（如Aliyun、AWS）也很重要。学习资源包括Coursera的免费课程、DiveintoDeepLearning书和国内平台如PaddlePaddle。技能和学习资料概述所需技能要从Java开发工程师成功转型为AI工程师，
paddle ocr本地化部署进行文字识别隐形喷火龙 Python paddle ocr
一、Paddle简介1.基本概念Paddle（全称PaddlePaddle，飞桨）是百度开发的开源深度学习平台，也是中国首个自主研发、功能丰富、技术领先的工业级深度学习平台。它覆盖了深度学习从数据准备、模型训练、模型部署到预测的全流程，旨在帮助开发者快速实现AI应用。2.核心特点全场景覆盖：支持云端、边缘端、移动端等多硬件环境，适配CPU、GPU、FPGA等多种芯片。易用性与高效性：提供简洁的AP
PaddlePaddle 和PyTorch选择与对比互斥不懂球的小胖 ai python 大模型 paddlepaddle pytorch 人工智能
你遇到的错误信息如下：RuntimeError:(PreconditionNotMet)Tensor'sdimensionisoutofbound.Tensor'sdimensionmustbeequalorlessthanthesizeofitsmemory.ButreceivedTensor'sdimensionis8,memory'ssizeis0.[Hint:Expectednumel()
使用paddlepaddle框架构建ViT用于CIFAR10图像分类 sherlockjjobs 深度学习 Python python 深度学习图像分类
使用paddlepaddle框架构建ViT用于CIFAR10图像分类硬件环境：GPU(1*NVIDIAT4)运行时间：一个epoch大概一分钟importpaddleimporttimeimportpaddle.nnasnnimportpaddle.nn.functionalasFimportpaddle.vision.transformsastransformsfrompaddle.ioimpo
Python基础paddlepaddle 愚昧之山绝望之谷开悟之坡 PaddlePaddle NLP基础知识 python
print(math.ceil(4.1))#返回数字的上入整数print(math.floor(4.9))#返回数字的下舍整数字符串单引号、双引号、三引号print(‘HelloWorld!’)print(“HelloWorld!”)转义字符\print(“The\tisatab”)print(‘I’mgoingtothemovies’)TheisatabI’mgoingtothemovies三引
PaddlePaddle最简单的例子：利用python api调用paddle实现模型加载与预测少安的砖厂 PaddlePaddle开发
调用fluid的python接口：importpaddle.fluidasfluid图片操作：fromPILimportImage矩阵操作：importnumpyasnpexe=fluid.Executor(fluid.CPUPlace())//设置model的地址，在model_path字符型变量中保存[inference_program,feed_target_names,fetch_targ
深度学习框架：PaddlePaddle基础白拾ShiroX #深度学习网络 python 机器学习人工智能深度学习
介于CSDN的排版问题，这里附个人博客连接。https://discover304.top/2021/12/02/2021q4/107-4-dl-pdpd-base/说明本页面无手机端适配，强制缩放阅读。使用纯html格式，保存教学用ppt，添加了部分个人笔记。目录工作正常，可以跳转。b{color:rgba(0,0,0,0.75)}PaddlePaddle概述PaddlePaddle概述Padd
AI同声传译基于PaddlePaddle框架的开源方案介绍 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介随着人工智能技术的不断发展，越来越多的人将注意力集中在语音识别、机器翻译等领域，而这些技术虽然有其优点，但也面临着一些挑战。其中之一就是长文本翻译、多语言语音合成的难题，特别是在大规模数据和大型模型的情况下。为了解决这个问题，业界提出了许多有效的技术措施，如同声传译、分词对齐、强制教学等。在最近几年里，随着深度学习框架的火爆，出现了一系列基于神经网络的开源技术方
转行指南：Java开发工程师转AI工程师，附大模型学习路线和老莫一起学AI java 人工智能学习 langchain 语言模型 ai 大模型
关键要点研究表明，Java开发工程师转AI工程师需要学习数学、Python编程、机器学习和深度学习等技能。证据显示，掌握TensorFlow、PyTorch等框架和云部署技术（如Aliyun、AWS）也很重要。学习资源包括Coursera的免费课程、DiveintoDeepLearning书和国内平台如PaddlePaddle。技能和学习资料概述所需技能要从Java开发工程师成功转型为AI工程师，
python批量去除图片文字水印数据服务生 python 开发语言
#!/usr/bin/envpython#-*-coding:utf-8-*-#需要安装的库#pipinstallpaddlepaddle-ihttps://mirrors.aliyun.com/pypi/simple/#pipinstallpaddleocr-ihttps://mirrors.aliyun.com/pypi/simple/#pipinstallcv2-ihttps://mirro
探索高效目标检测新境界：PyTorch版PP-YOLOE全面解析与应用指南乌芬维Maisie
探索高效目标检测新境界：PyTorch版PP-YOLOE全面解析与应用指南PPYOLOE_pytorch项目地址:https://gitcode.com/gh_mirrors/pp/PPYOLOE_pytorch在目标检测的浩瀚星空里，有一颗璀璨的新星——PP-YOLOE。这个基于Pytorch实现的项目，不仅承袭了PaddlePaddle版PP-YOLOE和Megvii的YOLOX的精粹，还实现
深度学习篇---模型GPU训练 Ronin-Lotus 图像处理篇深度学习篇上位机知识篇深度学习人工智能 python openmp paddlepaddle pytorch 并行
文章目录前言一、在PaddlePaddle框架下使用GPU训练模型步骤1：确保环境准备就绪硬件软件步骤2：确认GPU可用步骤3：设置使用的GPU设备步骤4：定义模型步骤5：将模型移到GPU步骤6：准备数据并移到GPU步骤7：定义损失函数和优化器步骤8：训练模型二、在PyTorch框架下使用GPU训练模型步骤1：确保环境准备就绪硬件软件步骤2：确认GPU可用步骤3：设置使用的GPU设备步骤4：定义模
PaddlePaddle Uie-Base 信息抽取 weixin_37806923 paddlepaddle 人工智能
微调代码，打标签后的文件放在work目录下不会被删除，若放在data下重启环境后会被删掉pythondoccano.py\--doccano_file./work/admin.jsonl\--task_typeext\--save_dir./data\--splits0.80.20\--schema_langchexportfinetuned_model=./checkpoint/model_be
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl