图像算法AI

PaddleDetection 快速上手

本项目以路标数据集roadsign为例，详细说明了如何使用PaddleDetection训练一个目标检测模型，并对模型进行评估和预测。

本项目提供voc格式的roadsign数据集和coco格式的roadsign数据集。

本项目提供 YOLOv3、FasterRCNN、FCOS这几个算法的配置文件。

您可以选择其中一个配置开始训练，快速体验PaddleDeteciton。

效果请戳这里：

PaddleDetection

欢迎到PaddleDetection主页查看更快更好的模型。

您也可以扫下面的二维码访问PaddleDetection github主页，欢迎关注和点赞^_。

环境安装

1. AiStudio环境设置

# 查看当前挂载的数据集目录, 该目录下的变更重启环境后会自动还原
# View dataset directory. This directory will be recovered automatically after resetting environment. 
!ls /home/aistudio/data

# 查看工作区文件, 该目录下的变更将会持久保存. 请及时清理不必要的文件, 避免加载过慢.
# View personal work directory. All changes under this directory will be kept even after reset. Please clean unnecessary files in time to speed up environment loading.
!ls /home/aistudio/work

# 如果需要进行持久化安装, 需要使用持久化路径, 如下方代码示例:
# If a persistence installation is required, you need to use the persistence path as the following:
!mkdir /home/aistudio/external-libraries
!pip install beautifulsoup4 -t /home/aistudio/external-libraries

# 同时添加如下代码, 这样每次环境(kernel)启动的时候只要运行下方代码即可:
# Also add the following code, so that every time the environment (kernel) starts, just run the following code:
import sys
sys.path.append('/home/aistudio/external-libraries')

2. 安装Paddle

AIStudio上已经安装好paddlepaddle 1.8.4。

import paddle
print(paddle.__version__)

3. 克隆PaddleDetection

通过以下命令克隆最新的PaddleDetection代码库。

! git clone https://github.com/PaddlePaddle/PaddleDetection

如果因为网络问题clone较慢，可以：

通过github加速通道clone

git clone https://hub.fastgit.org/PaddlePaddle/PaddleDetection.git

选择使用码云上的托管

git clone https://gitee.com/paddlepaddle/PaddleDetection

注：码云托管代码可能无法实时同步本github项目更新，存在3~5天延时，请优先从github上克隆。

使用本项目提供的代码库，存放路径work/PaddleDetection.zip

这里采用项目提供的代码库

! ls ~/work/PaddleDetection.zip

%cd ~/work/
! unzip -o PaddleDetection.zip

4. PaddleDetection依赖安装及设置

通过如下方式安装PaddleDetection依赖，并设置环境变量

安装 cocoapi

如果因为网络问题clone较慢，可以：

通过github加速通道clone

pip install "git+https://hub.fastgit.org/cocodataset/cocoapi.git#subdirectory=PythonAPI"

# github
#! pip install "git+https://github.com/cocodataset/cocoapi.git#subdirectory=PythonAPI"

# fast github
# ! pip install "git+https://hub.fastgit.org/cocodataset/cocoapi.git#subdirectory=PythonAPI"

# 
! pip install pycocotools

设置环境

%cd ~/work/PaddleDetection/
!pip install -r requirements.txt

%env PYTHONPATH=.:$PYTHONPATH
%env CUDA_VISIBLE_DEVICES=0

验证安装

! python ppdet/modeling/tests/test_architectures.py

准备数据

本项目使用road-sign-detection 比赛数据，检测4种路标：

speedlimit
crosswalk
trafficlight
stop

划分成训练集和测试集，总共877张图，其中训练集701张图、测试集176张图。

本项目提供voc格式和coco格式的数据：

voc格式：

划分好的数据下载地址为： roadsign_voc.tar。

AiStudio上数据地址：roadsign_voc
coco格式：

划分好的数据下载地址为：：roadsign_coco.tar。

AiStudio上数据地址：roadsign_coco

将~/data/文件夹下的数据解压到PaddleDetection/dataset/文件夹下。

%cd ~/work/PaddleDetection/dataset/
! pwd
! ls ~/data -l

1. voc格式数介绍

VOC数据格式的目标检测数据，是指每个图像文件对应一个同名的xml文件，xml文件中标记物体框的坐标和类别等信息。

Pascal VOC比赛对目标检测任务，对目标物体是否遮挡、是否被截断、是否是难检测物体进行了标注。对于用户自定义数据可根据实际情况对这些字段进行标注。

xml文件中包含以下字段：

filename，表示图像名称。

road650.png

size，表示图像尺寸。包括：图像宽度、图像高度、图像深度


	300
	400
	3

object字段，表示每个物体。包括
- name: 目标物体类别名称
- pose: 关于目标物体姿态描述（非必须字段）
- truncated: 目标物体目标因为各种原因被截断（非必须字段）
- occluded: 目标物体是否被遮挡（非必须字段）
- difficult: 目标物体是否是很难识别（非必须字段）
- bndbox: 物体位置坐标，用左上角坐标和右下角坐标表示：xmin、ymin、xmax、ymax

将~/data/data49531/roadsign_voc.tar解压到PaddleDetection/dataset/roadsign_voc下

%cd ~/work/PaddleDetection/dataset/roadsign_voc/
! pwd

# copy roadsign_voc.tar and extract
! cp ~/data/data49531/roadsign_voc.tar .
! tar -xvf roadsign_voc.tar
! rm -rf roadsign_voc.tar

# 查看一条数据
! cat ./annotations/road650.xml

2. coco格式数介绍

coco数据格式，是指将所有训练图像的标注都存放到一个json文件中。数据以字典嵌套的形式存放。

json文件中存放了 info licenses images annotations categories的信息:

info中存放标注文件标注时间、版本等信息。
licenses中存放数据许可信息。
images中存放一个list，存放所有图像的图像名，下载地址，图像宽度，图像高度，图像在数据集中的id等信息。
annotations中存放一个list，存放所有图像的所有物体区域的标注信息，每个目标物体标注以下信息：

    {
    	'area': 899, 
    	'iscrowd': 0, 
        'image_id': 839, 
        'bbox': [114, 126, 31, 29], 
        'category_id': 0, 'id': 1, 
        'ignore': 0, 
        'segmentation': []
    }

将~/data/data49531/roadsign_coco.tar解压到PaddleDetection/dataset/roadsign_coco下

%cd ~/work/PaddleDetection/dataset/
! mkdir roadsign_coco
%cd ~/work/PaddleDetection/dataset/roadsign_coco/
! pwd

# copy roadsign_coco.tar and extract
! cp ~/data/data52968/roadsign_coco.tar .
! tar -xvf roadsign_coco.tar
! rm -rf roadsign_coco.tar

# 查看一条数据
import json
coco_anno = json.load(open('./annotations/train.json'))

# coco_anno.keys
print('\nkeys:', coco_anno.keys())

# 查看类别信息
print('\n物体类别:', coco_anno['categories'])

# 查看一共多少张图
print('\n图像数量：', len(coco_anno['images']))

# 查看一共多少个目标物体
print('\n标注物体数量：', len(coco_anno['annotations']))

# 查看一条目标物体标注信息
print('\n查看一条目标物体标注信息：', coco_anno['annotations'][0])

开始训练

本项目在work/hw_configs/目录下提供以下配置文件

yolov3_mobilenet_v1_roadsign_voc_template.yml
yolov3_mobilenet_v1_roadsign_coco_template.yml
ppyolo_resnet50_vd_roadsign_coco_template.yml
faster_rcnn_r50_roadsign_coco_template.yml
faster_rcnn_r50_vd_fpn_roadsign_coco_template.yml
fcos_r50_roadsign_coco_template.yml

将~/work/hw_configs.zip解压到 configs 文件夹下

%cd ~/work/PaddleDetection/

!unzip -o ~/work/hw_configs.zip -d configs/

! ls configs/hw_configs/

# 选择配置开始训练。可以通过 -o 选项覆盖配置文件中的参数

# faster_rcnn_r50_vd_fpn
! python -u tools/train.py -c configs/hw_configs/faster_rcnn_r50_vd_fpn_roadsign_coco_template.yml -o use_gpu=True --eval

# yolov3
#! python -u tools/train.py -c configs/hw_configs/yolov3_mobilenet_v1_roadsign_voc_template.yml -o use_gpu=True --eval

# fcos
#! python -u tools/train.py -c configs/hw_configs/fcos_r50_roadsign_coco_template.yml -o use_gpu=True --eval

您可以通过指定visualDL可视化工具，对loss变化曲线可视化。您仅需要指定 use_vdl 参数和 vdl_log_dir 参加即可。

点击左侧 可视化 按钮，设置 logdir 和模型文件，就可以对训练过程loss变化曲线和模型进行可视化。

# 选择配置开始训练。可以通过 -o 选项覆盖配置文件中的参数 vdl_log_dir 设置vdl日志文件保存路径

# faster_rcnn_r50_vd_fpn
! python -u tools/train.py -c configs/hw_configs/faster_rcnn_r50_vd_fpn_roadsign_coco_template.yml -o use_gpu=True --use_vdl=True --vdl_log_dir=vdl_dir/scalar --eval

# yolov3
#! python -u tools/train.py -c configs/hw_configs/yolov3_mobilenet_v1_roadsign_voc_template.yml -o use_gpu=True --use_vdl=True --vdl_log_dir=vdl_dir/scalar --eval

# fcos
#! python -u tools/train.py -c configs/hw_configs/fcos_r50_roadsign_coco_template.yml -o use_gpu=True --use_vdl=True --vdl_log_dir=vdl_dir/scalar --eval

评估和预测

PaddleDetection也提供了tools/eval.py脚本用于评估模型，评估是可以通过-o weights=指定待评估权重。

PaddleDetection训练过程中若开始了--eval，会将所有checkpoint中评估结果最好的checkpoint保存为best_model.pdparams，可以通过如下命令一键式评估最优checkpoint

这里我们加载预训练好的权重进行预测：

https://paddlemodels.bj.bcebos.com/object_detection/yolov3_best_model_roadsign.pdparams
https://paddlemodels.bj.bcebos.com/object_detection/faster_r50_fpn_best_model_roadsign.pdparams
https://paddlemodels.bj.bcebos.com/object_detection/fcos_best_model_roadsign.pdparams

# 评估

# faster_rcnn_r50_vd_fpn
! python -u tools/eval.py -c configs/hw_configs/faster_rcnn_r50_vd_fpn_roadsign_coco_template.yml -o use_gpu=True weights=https://paddlemodels.bj.bcebos.com/object_detection/faster_r50_fpn_best_model_roadsign.pdparams

# yolov3
#! python -u tools/eval.py -c configs/hw_configs/yolov3_mobilenet_v1_roadsign_coco_template.yml -o use_gpu=True weights=https://paddlemodels.bj.bcebos.com/object_detection/yolov3_best_model_roadsign.pdparams

# fcos
#! python -u tools/eval.py -c configs/hw_configs/fcos_r50_roadsign_coco_template.yml -o use_gpu=True weights=https://paddlemodels.bj.bcebos.com/object_detection/fcos_best_model_roadsign.pdparams

PaddleDetection提供了tools/infer.py预测工具，可以使用训练好的模型预测图像并可视化，通过-o weights=指定加载训练过程中保存的权重。

预测脚本如下：

img_path = './dataset/roadsign_voc/images/road554.png'

# faster_rcnn_r50_vd_fpn
! python tools/infer.py -c configs/hw_configs/faster_rcnn_r50_vd_fpn_roadsign_coco_template.yml -o use_gpu=True weights=https://paddlemodels.bj.bcebos.com/object_detection/faster_r50_fpn_best_model_roadsign.pdparams --infer_img=dataset/roadsign_voc/images/road554.png

# yolov3
#! python tools/infer.py -c configs/hw_configs/yolov3_mobilenet_v1_roadsign_voc_template.yml -o use_gpu=True weights=https://paddlemodels.bj.bcebos.com/object_detection/yolov3_best_model_roadsign.pdparams --infer_img=dataset/roadsign_voc/images/road554.png

# fcos
#! python tools/infer.py -c configs/hw_configs/fcos_r50_roadsign_coco_template.yml -o use_gpu=True weights=https://paddlemodels.bj.bcebos.com/object_detection/fcos_best_model_roadsign.pdparams --infer_img=dataset/roadsign_voc/images/road554.png

%matplotlib inline
import matplotlib.pyplot as plt 
import cv2

infer_img = cv2.imread("output/road554.png")
plt.figure(figsize=(15,10))
plt.imshow(cv2.cvtColor(infer_img, cv2.COLOR_BGR2RGB))
plt.show()

模型压缩

如果您要对模型进行压缩，PaddleDetection中模型压缩部分提供以下模型压缩方式：

量化
剪枝
蒸馏
搜索

模型部署

如果您要部署模型，请参考模型部署部分提供以下部署方式：

服务器端Python部署
服务器端C++部署
移动端部署
在线Serving部署

「源力觉醒创作者计划」_以FastDeploy为例部署ERNIE-4.5-21B大模型全流程实践 cooldream2009 大模型基础 AI技术文心大模型 FastDeploy
目录前言1环境准备与依赖安装1.1硬件要求1.2Python环境与pip升级2下载ERNIE-4.5模型权重2.1安装HuggingFaceCLI工具2.2设置国内镜像加速（可选）2.3下载模型文件3安装FastDeploy与Paddle推理引擎3.1安装PaddlePaddle-GPU版本3.2安装FastDeploy-GPU4启动ERNIE-4.5本地服务4.1启动OpenAI兼容API服务4
PaddleOCR 3.0全面解析：五大核心能力与实战应用指南经优英
PaddleOCR3.0全面解析：五大核心能力与实战应用指南PaddleOCRAwesomemultilingualOCRtoolkitsbasedonPaddlePaddle(practicalultralightweightOCRsystem,support80+languagesrecognition,providedataannotationandsynthesistools,suppor
python --飞浆离线ocr使用/paddleocr
依赖#python==3.7.3paddleocr==2.7.0.2paddlepaddle==2.5.2loguru==0.7.3frompaddleocrimportPaddleOCRimportcv2importnumpyasnpif__name__=='__main__':OCR=PaddleOCR(use_doc_orientation_classify=False,#检测文档方向use
paddleOCR模型的安装和使用九日卯贝 paddle ocr
paddleOCR仓库：https://github.com/PaddlePaddle/PaddleOCR?tab=readme-ov-file文档：https://paddlepaddle.github.io/PaddleOCR/main/quick_start.html#2-paddleocr环境安装python-mpipinstallpaddlepaddle-gpu==3.0.0b1-iht
paddlepaddle测试安装_python3.7中安装paddleocr及paddlepaddle包的多种方法瓦啦
升级pippip版本必须升级到20.0.4版本才能应用；方法一、在pycharm中对pip进行升级；方法二、通过命令进行升级python3.7-mpipinstall--upgradepip下载paddleOCR下载链接：https://github.com/PaddlePaddle/PaddleOCR打开paddleOCR文件夹中requirements.txt文件，更改文件中opencv-py
ali docker部属paddleocr 大熊程序猿 ASP.NET Core docker 容器运维
dockerpullregistry.baidubce.com/paddlepaddle/paddle:2.6.0nano/root/projects/paddleocr_server.py========================fromflaskimportFlask,requestfromwerkzeug.utilsimportsecure_filenameimportuuidfrom
百度飞桨（PaddlePaddle）案例分享：基于 PaddleOCR 的图像文字提取系统 univerbright 百度 paddlepaddle 人工智能 paddleocr 图像文字提取
一、案例背景在实际教学、办公及政务系统中，纸质材料（如手写作文、表格、试卷等）仍广泛存在。为提升信息处理效率，采用OCR（OpticalCharacterRecognition）技术将图像中的文字提取为可编辑文本已成为刚需。本项目基于开源深度学习库PaddleOCR，构建了一个轻量级的图像文字识别工具，能够自动识别图像中的中文文本，并提供置信度评估和可视化支持。该工具特别适用于作业扫描图像中的内容
视觉模型部署实践：低算力平台RV1106上高效部署paddlepaddle 的PicoDet目标检测模型的技术实践位东风视觉模型部署实践 paddlepaddle 目标检测人工智能 iot 物联网嵌入式硬件
在资源受限的嵌入式设备上实现高精度、低延迟的目标检测，是当前智能摄像头、边缘计算等应用中的关键挑战。本文以Rockchip的RV1106嵌入式平台为例，结合百度开源的轻量级检测模型PicoDet，探讨如何通过模型优化与硬件加速，在有限的计算资源下实现高效的实时目标检测。目前该模型测试可以达到25fps左右一、背景介绍1.1RV1106硬件特性主频：1.2GHzArmCortex-A55CPU内存：
使用PaddleOCR读取pdf内容，输出txt文本只有左边一个小酒窝 Paddle pdf paddle 人工智能
使用PaddleOCR读取PDF内容并输出为TXT文本，可以通过以下步骤实现。PaddleOCR是一个基于PaddlePaddle的OCR工具，支持多种语言的文本识别。一、安装依赖确保已安装PaddleOCR和相关的依赖库。以下是代码中涉及的依赖库及其功能说明：os所属语言：Python内置标准库功能：提供操作系统相关功能，如文件路径操作、目录管理等。示例用途：在处理文件时获取路径、创建目录等。f
如何制作属于自己的图片OCR功能 hit56笔记机器学习
文章目录一、百度的PaddlePaddle二、一个开源软件三、谷歌的OCR实践方案1.安装软件包2.安装语言包3.运行代码三、facebook的抠图模型四、参考文献经过本人的多次实践探索，已上线至我的网站：www.hit56.com，可以在上面直接体验图片OCR功能一、百度的PaddlePaddlehttps://github.com/PaddlePaddle/PaddleOCR二、一个开源软件h
百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13% 吴脑的键客人工智能百度 paddlepaddle ocr
百度飞桨PaddleOCR3.0开源发布2025年5月20日，百度飞桨团队正式发布了PaddleOCR3.0版本，并将其开源。这一新版本在文字识别精度、多语种支持、手写体识别以及高精度文档解析等方面取得了显著进展，进一步提升了PaddleOCR在OCR领域的技术实力和应用价值。开源地址:https://github.com/PaddlePaddle/PaddleOCR技术亮点全场景文字识别模型PP
Python、PyTorch、TensorFlow和飞桨（PaddlePaddle）的核心介绍及对比非小号 AI python pytorch tensorflow
以下是Python、PyTorch、TensorFlow和飞桨（PaddlePaddle）的核心介绍及对比，帮助你快速理解它们的定位与适用场景：一、Python：AI开发的基石语言定位：通用高级编程语言，以简洁语法和丰富库生态著称。核心优势：易学易用：代码可读性强，适合快速原型开发。生态丰富：拥有NumPy（科学计算）、Pandas（数据处理）、Matplotlib（可视化）等基础库，以及Scik
飞桨（PaddlePaddle）在机器学习全流程（数据采集、处理、标注、建模、分析、优化）非小号 AI paddlepaddle 机器学习人工智能
以下是飞桨（PaddlePaddle）在机器学习全流程（数据采集、处理、标注、建模、分析、优化）中常用的模型、函数及工具链，结合其生态特点分类说明：一、数据采集与标注1.数据采集工具PaddleX（图像/视频场景）功能：支持图像分类、目标检测、语义分割任务的数据标注，集成标注工具（如矩形框、多边形标注）。官网工具：PaddleX数据标注工具用法：通过图形化界面或命令行启动标注工具，输出标准VOC/
通过paddlehub简单几行代码实现OCR识别 bobfreedman AI ocr
一、前置条件1、ubuntu系统2、python3、pip已经安装完毕3、paddlepaddle、paddlehub、cv2、gradio、matplotlib安装完毕二、实现代码ocr.pyimportpaddlehubashubimportmatplotlib.pyplotaspltimportmatplotlib.imageasmpimgimportgradioasgrimportcv2o
PaddleHub一键OCR中文识别 jiabiao1602 ocr
PaddleHub是百度飞桨（PaddlePaddle）深度学习框架下的一个预训练模型应用工具，它为用户提供了丰富的高质量预训练模型和便捷的开发方式。这里我们仅介绍其在OCR中文识别方面的应用。一、PaddleHub介绍先让文心一言给我们介绍PaddleHub，以下是文心一言的答案。PaddleHub是百度飞桨（PaddlePaddle）深度学习框架下的一个预训练模型应用工具，它为用户提供了丰富的
搭建本地OCR服务(Paddlepaddle) Johannisberger_ numpy pip conda
1.先安装conda软件并创建conda虚拟环境指定好python版本下载conda：https://www.anaconda.com/download/安装并配置好环境变量创建虚拟环境：condacreate--nameocrpython=3.82.安装paddlepaddle下载paddlepaddlehttps://www.paddlepaddle.org.cn/根据设备情况安装cpu版本/
PaddleHub识别中文人名实战记录及心得 Jason-Lai NLP 人工智能 python 自然语言处理
一,简介与特性便捷地获取PaddlePaddle生态下的预训练模型，完成模型的管理和一键预测。配合使用Fine-tuneAPI，可以基于大规模预训练模型快速完成迁移学习，让预训练模型能更好地服务于用户特定场景的应用,PaddleHub旨在为开发者提供丰富的、高质量的、直接可用的预训练模型【模型种类丰富】:涵盖大模型、CV、NLP、Audio、Video、工业应用主流六大品类的400+预训练模型，全
2025转行指南：Java开发工程师转AI工程师，附全网最详细的大模型学习路线 AI小白熊 java 人工智能学习大模型程序员 ai 开发语言
关键要点研究表明，Java开发工程师转AI工程师需要学习数学、Python编程、机器学习和深度学习等技能。证据显示，掌握TensorFlow、PyTorch等框架和云部署技术（如Aliyun、AWS）也很重要。学习资源包括Coursera的免费课程、DiveintoDeepLearning书和国内平台如PaddlePaddle。技能和学习资料概述所需技能要从Java开发工程师成功转型为AI工程师，
paddle ocr本地化部署进行文字识别隐形喷火龙 Python paddle ocr
一、Paddle简介1.基本概念Paddle（全称PaddlePaddle，飞桨）是百度开发的开源深度学习平台，也是中国首个自主研发、功能丰富、技术领先的工业级深度学习平台。它覆盖了深度学习从数据准备、模型训练、模型部署到预测的全流程，旨在帮助开发者快速实现AI应用。2.核心特点全场景覆盖：支持云端、边缘端、移动端等多硬件环境，适配CPU、GPU、FPGA等多种芯片。易用性与高效性：提供简洁的AP
PaddlePaddle 和PyTorch选择与对比互斥不懂球的小胖 ai python 大模型 paddlepaddle pytorch 人工智能
你遇到的错误信息如下：RuntimeError:(PreconditionNotMet)Tensor'sdimensionisoutofbound.Tensor'sdimensionmustbeequalorlessthanthesizeofitsmemory.ButreceivedTensor'sdimensionis8,memory'ssizeis0.[Hint:Expectednumel()
使用paddlepaddle框架构建ViT用于CIFAR10图像分类 sherlockjjobs 深度学习 Python python 深度学习图像分类
使用paddlepaddle框架构建ViT用于CIFAR10图像分类硬件环境：GPU(1*NVIDIAT4)运行时间：一个epoch大概一分钟importpaddleimporttimeimportpaddle.nnasnnimportpaddle.nn.functionalasFimportpaddle.vision.transformsastransformsfrompaddle.ioimpo
Python基础paddlepaddle 愚昧之山绝望之谷开悟之坡 PaddlePaddle NLP基础知识 python
print(math.ceil(4.1))#返回数字的上入整数print(math.floor(4.9))#返回数字的下舍整数字符串单引号、双引号、三引号print(‘HelloWorld!’)print(“HelloWorld!”)转义字符\print(“The\tisatab”)print(‘I’mgoingtothemovies’)TheisatabI’mgoingtothemovies三引
PaddlePaddle最简单的例子：利用python api调用paddle实现模型加载与预测少安的砖厂 PaddlePaddle开发
调用fluid的python接口：importpaddle.fluidasfluid图片操作：fromPILimportImage矩阵操作：importnumpyasnpexe=fluid.Executor(fluid.CPUPlace())//设置model的地址，在model_path字符型变量中保存[inference_program,feed_target_names,fetch_targ
深度学习框架：PaddlePaddle基础白拾ShiroX #深度学习网络 python 机器学习人工智能深度学习
介于CSDN的排版问题，这里附个人博客连接。https://discover304.top/2021/12/02/2021q4/107-4-dl-pdpd-base/说明本页面无手机端适配，强制缩放阅读。使用纯html格式，保存教学用ppt，添加了部分个人笔记。目录工作正常，可以跳转。b{color:rgba(0,0,0,0.75)}PaddlePaddle概述PaddlePaddle概述Padd
AI同声传译基于PaddlePaddle框架的开源方案介绍 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介随着人工智能技术的不断发展，越来越多的人将注意力集中在语音识别、机器翻译等领域，而这些技术虽然有其优点，但也面临着一些挑战。其中之一就是长文本翻译、多语言语音合成的难题，特别是在大规模数据和大型模型的情况下。为了解决这个问题，业界提出了许多有效的技术措施，如同声传译、分词对齐、强制教学等。在最近几年里，随着深度学习框架的火爆，出现了一系列基于神经网络的开源技术方
转行指南：Java开发工程师转AI工程师，附大模型学习路线和老莫一起学AI java 人工智能学习 langchain 语言模型 ai 大模型
关键要点研究表明，Java开发工程师转AI工程师需要学习数学、Python编程、机器学习和深度学习等技能。证据显示，掌握TensorFlow、PyTorch等框架和云部署技术（如Aliyun、AWS）也很重要。学习资源包括Coursera的免费课程、DiveintoDeepLearning书和国内平台如PaddlePaddle。技能和学习资料概述所需技能要从Java开发工程师成功转型为AI工程师，
python批量去除图片文字水印数据服务生 python 开发语言
#!/usr/bin/envpython#-*-coding:utf-8-*-#需要安装的库#pipinstallpaddlepaddle-ihttps://mirrors.aliyun.com/pypi/simple/#pipinstallpaddleocr-ihttps://mirrors.aliyun.com/pypi/simple/#pipinstallcv2-ihttps://mirro
探索高效目标检测新境界：PyTorch版PP-YOLOE全面解析与应用指南乌芬维Maisie
探索高效目标检测新境界：PyTorch版PP-YOLOE全面解析与应用指南PPYOLOE_pytorch项目地址:https://gitcode.com/gh_mirrors/pp/PPYOLOE_pytorch在目标检测的浩瀚星空里，有一颗璀璨的新星——PP-YOLOE。这个基于Pytorch实现的项目，不仅承袭了PaddlePaddle版PP-YOLOE和Megvii的YOLOX的精粹，还实现
深度学习篇---模型GPU训练 Ronin-Lotus 图像处理篇深度学习篇上位机知识篇深度学习人工智能 python openmp paddlepaddle pytorch 并行
文章目录前言一、在PaddlePaddle框架下使用GPU训练模型步骤1：确保环境准备就绪硬件软件步骤2：确认GPU可用步骤3：设置使用的GPU设备步骤4：定义模型步骤5：将模型移到GPU步骤6：准备数据并移到GPU步骤7：定义损失函数和优化器步骤8：训练模型二、在PyTorch框架下使用GPU训练模型步骤1：确保环境准备就绪硬件软件步骤2：确认GPU可用步骤3：设置使用的GPU设备步骤4：定义模
PaddlePaddle Uie-Base 信息抽取 weixin_37806923 paddlepaddle 人工智能
微调代码，打标签后的文件放在work目录下不会被删除，若放在data下重启环境后会被删掉pythondoccano.py\--doccano_file./work/admin.jsonl\--task_typeext\--save_dir./data\--splits0.80.20\--schema_langchexportfinetuned_model=./checkpoint/model_be
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include

PaddleDetection 快速上手

PaddleDetection 快速上手

欢迎到PaddleDetection主页查看更快更好的模型。

您也可以扫下面的二维码访问PaddleDetection github主页，欢迎关注和点赞_。

环境安装

1. AiStudio环境设置

2. 安装Paddle

3. 克隆PaddleDetection

4. PaddleDetection依赖安装及设置

准备数据

1. voc格式数介绍

2. coco格式数介绍

开始训练

评估和预测

模型压缩

如果您要对模型进行压缩，PaddleDetection中模型压缩部分提供以下模型压缩方式：

模型部署

如果您要部署模型，请参考模型部署部分提供以下部署方式：

你可能感兴趣的:(PaddlePaddle)

您也可以扫下面的二维码访问PaddleDetection github主页，欢迎关注和点赞^_。