RanceGru

视觉学习笔记12——百度飞浆框架的PaddleOCR 安装、标注、训练以及测试

系列文章目录

虚拟环境部署
参考博客1
参考博客2
参考博客3
参考博客4

文章目录

系列文章目录
一、简单介绍
- 1.OCR介绍
- 2.PaddleOCR介绍
二、安装
- 1.anaconda基础环境
- - 1）anaconda的基本操作
  - 2）搭建飞浆的基础环境
- 2.安装paddlepaddle-gpu版本
- - 1）安装
  - 2）验证
- 3.pip安装paddleocr whl包
- - 1）2.6版本的paddleocr安装
  - 2）验证
- 4.安装PPOCRLabel
- - 1）2.6版本paddleocr和PPOCRLabel的版本对应
  - 2）2.7版本paddleocr和PPOCRLabel的版本对应
三、PPOCRLabel标注
四、PaddleOCR训练与测试
- 1.文本检测模型训练与测试
- - 1）下载预训练模型
  - 2）修改参数配置文件
  - 3）可视化训练过程
  - 4）模型评估测试
- 2.文本识别模型训练
- - 1）下载预训练模型
  - 2）修改参数配置文件
  - 3）可视化训练过程
  - 4）模型评估测试
五、补充

一、简单介绍

1.OCR介绍

OCR（光学字符识别）是一种将图像中的文字自动转换为可编辑文本的技术。现在，各大厂商均有提供各种场景的OCR识别的API。但是，也有一些开源的OCR框架和工具，可以支持自我定制和训练，使得开发人员能够更加灵活地应对不同场景下的OCR需求。

OCR（光学字符识别）的简单实现流程通常包括以下步骤：

1、图像预处理：首先，对输入的图像进行预处理，包括灰度化、二值化、去噪等操作。这些操作有助于提高字符识别的准确性和稳定性。
2、文本区域检测：使用图像处理技术（如边缘检测、轮廓分析等），找到图像中可能包含文本的区域。这些区域通常是字符或文本行的边界。
3、字符分割：对于文本行，需要将其分割为单个字符。这可以通过字符之间的间距、连通性等特征进行分割。
4、特征提取：对于每个字符，提取其特征表示。常见的特征包括形状、角度、纹理等。特征提取有助于将字符转化为可供分类器处理的数值表示。
5、字符分类：使用分类器（如机器学习算法或深度学习模型）对提取的字符特征进行分类，将其识别为相应的字符类别。分类器可以是预训练模型，也可以是自定义训练的模型。
6、后处理：对识别的字符进行后处理，如纠正错误、校正倾斜、去除冗余等。这可以提高最终结果的准确性和可读性。
7、输出结果：将识别的字符组合成最终的文本输出，可以是单个字符、单词或完整的文本。

2.PaddleOCR介绍

飞桨首次开源文字识别模型套件PaddleOCR，目标是打造丰富、领先、实用的文本识别模型/工具库。 PaddleOCR是一个基于飞桨开发的OCR（Optical Character Recognition，光学字符识别）系统。其技术体系包括文字检测、文字识别、文本方向检测和图像处理等模块。以下是其优点：

高精度：PaddleOCR采用深度学习算法进行训练，可以在不同场景下实现高精度的文字检测和文字识别。

多语种支持：PaddleOCR支持多种语言的文字识别，包括中文、英文、日语、韩语等。同时，它还支持多种不同文字类型的识别，如手写字、印刷体、表格等。

高效性：PaddleOCR的训练和推理过程都采用了高效的并行计算方法，可大幅提高处理速度。同时，其轻量化设计也使得PaddleOCR能够在移动设备上进行部署，适用于各种场景的应用。

易用性：PaddleOCR提供了丰富的API接口和文档说明，用户可以快速进行模型集成和部署，实现自定义的OCR功能。同时，其开源代码也为用户提供了更好的灵活性和可扩展性。

鲁棒性：PaddleOCR采用了多种数据增强技术和模型融合策略，能够有效地应对图像噪声、光照变化等干扰因素，并提高模型的鲁棒性和稳定性。

总之，PaddleOCR具有高精度、高效性、易用性和鲁棒性等优点，为用户提供了一个强大的OCR解决方案。

对比其他开源的OCR项目：

优点：
轻量模型，执行速度快
支持pip直接安装
ocr识别效果好，效果基本可以比肩大厂收费ocr（非高精版）
支持表格和方向识别
支持补充训练且很方便

缺点：
部分符号识别效果一般，如 '|‘识别为’1’
对于部分加粗字体可能出现误识别，需要自己补充训练
偶尔会出现部分内容丢失的情况

二、安装

1.anaconda基础环境

1）anaconda的基本操作

查看conda环境：
conda info --envs

创建虚拟环境
conda create -n your_env_name python=x.x

激活或者切换虚拟环境
 source activate your_env_nam

 查看虚拟环境中的库
 conda list

关闭虚拟环境
source deactivate 

删除虚拟环境
conda remove -n your_env_name --all

2）搭建飞浆的基础环境

因为是新项目，所以专门使用anaconda搭建该项目的基本环境
使用anaconda的环境复制命令，复制一个已经安装好常用库的虚拟环境，这样就可以省下重新安装大部分库的工作了，可以参考虚拟环境部署

假设已有环境名为A，需要生成的环境名为B：（我自己用过，在同一台机器上克隆原始环境到另一个环境，挺好用的）
conda create -n B --clone A

比如：
conda create -n ocr --clone py36

2.安装paddlepaddle-gpu版本

1）安装

进入准备好的anaconda环境
根据对应的cuda和cudnn版本，安装对应的paddlepaddle版本
建议不要安装最新的paddlepaddle版本，我安装最新的一直失败
飞浆官网提供的旧版本安装命令

一定要根据自己的环境，选择正确的命令，比如：

# CUDA 10.2
python3 -m pip install paddlepaddle-gpu==2.4.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

2）验证

验证安装是否成功，终端输入python，然后分别输入以下两行代码

import paddle
 
paddle.utils.run_check()

3.pip安装paddleocr whl包

1）2.6版本的paddleocr安装

推荐使用2.0.1+版本，最新版本为2.7，我选择2.6版本，但是2.6版本的paddleocr和PPOCRLabel之间出现一些未解决环境bug，所以关于2.6版本的paddleocr安装仅供参考，安装命令如下：

pip install "paddleocr>=2.6"

使用了以上命令安装却出现PyMuPDF错误，如下：

 Building wheel for PyMuPDF (setup.py) ... error
 ......
 ......
 ......
 ERROR: Failed building wheel for PyMuPDF

github查到具体解决方案

使用如下命令重新安装：

pip install "paddleocr>=2.6" --upgrade PyMuPDF==1.18.0

2）验证

首先使用以下命令查看虚拟环境中的paddleocr是不是2.6版本：

conda list

其次下载以下官方提供的推理测试模型进行测试：

det_model_dir是文本检测的位置，

rec_model_dir是文本识别的位置，

cls_model_dir是方向分类的位置，

最后使用以下代码，更新模型与图片路径进行测试：

import os
import time

from paddleocr import PaddleOCR
import pandas as pd
import numpy as np
import cv2


def ocr_predict(img):
    '''
    det_model_dir:文本检测
    rec_model_dir:文本识别
    cls_model_dir:方向分类
    '''
    ocr = PaddleOCR(det_model_dir="路径/det/ch/ch_PP-OCRv4_det_infer/",
                    rec_model_dir="路径/rec/ch/ch_PP-OCRv4_rec_infer/",
                    cls_model_dir="路径/cls/ch_ppocr_mobile_v2.0_cls_infer/",
                    lang='ch', use_angle_cls=True,
                    use_gpu=False)
    result = ocr.ocr(img)
    print(result)


if __name__ == '__main__':
    img_path = "路径/ys.jpeg"
    ocr_predict(img_path)

测试图片：

测试结果：

[[[[[57.0, 31.0], [977.0, 32.0], [977.0, 75.0], [57.0, 74.0]],
(‘椰树集团直接从椰子农户收购海南自种老椰子’, 0.98974609375)], [[[54.0, 93.0], [976.0,
95.0], [976.0, 138.0], [54.0, 136.0]], (‘每个致富价五元，比原来收购价提高两倍’, 0.994292140007019)], [[[172.0, 163.0], [855.0, 163.0], [855.0, 205.0], [172.0, 205.0]], (‘转手收购的椰子不享受致富价’, 0.9931609630584717)], [[[61.0,
230.0], [961.0, 230.0], [961.0, 309.0], [61.0, 309.0]], (‘致富价保证30年不降’, 0.9948785901069641)], [[[128.0, 341.0], [985.0, 341.0], [985.0, 380.0], [128.0, 380.0]], (‘为助力乡村经济振兴，响应省政府大力发展’, 0.9951123595237732)], [[[35.0, 394.0], [745.0, 394.0], [745.0, 437.0], [35.0, 437.0]],
(‘三棵树（椰子树、橡胶树、槟榔树）’, 0.9626081585884094)], [[[757.0, 396.0], [983.0,
396.0], [983.0, 436.0], [757.0, 436.0]], (‘的号召，让’, 0.9951451420783997)], [[[37.0, 451.0], [982.0, 451.0], [982.0, 490.0], [37.0, 490.0]], (‘农民致富，实现椰树集团年产值百亿元，打造’, 0.9915739893913269)],
[[[80.0, 507.0], [980.0, 507.0], [980.0, 546.0], [80.0, 546.0]],
(‘百年椰树”，决定从2021年7月10日开始按’, 0.981215238571167)], [[[33.0, 558.0],
[692.0, 562.0], [692.0, 604.0], [33.0, 601.0]], (‘致富价收购海南农民自种老椰子。’,
0.992202877998352)], [[[35.0, 629.0], [526.0, 629.0], [526.0, 654.0], [35.0, 654.0]], (‘四组收购地址：文昌市东郊镇码头村码头路113号’, 0.9902203679084778)],
[[[754.0, 630.0], [983.0, 630.0], [983.0, 652.0], [754.0, 652.0]],
(‘收购电话：13322039539’, 0.9966092109680176)], [[[35.0, 667.0], [327.0,
667.0], [327.0, 692.0], [35.0, 692.0]], (‘六组收购地址：琼海市合石村’, 0.99151611328125)], [[[754.0, 666.0], [985.0, 666.0], [985.0, 691.0], [754.0, 691.0]], (‘收购电话：13627592295’, 0.9962812662124634)], [[[35.0,
705.0], [562.0, 705.0], [562.0, 730.0], [35.0, 730.0]], (‘八组收购地址：文昌市东郊镇、万宁市长丰镇牛漏村’, 0.980197548866272)], [[[753.0, 704.0],
[983.0, 704.0], [983.0, 729.0], [753.0, 729.0]], (‘收购电话：13876033357’,
0.9965571165084839)], [[[34.0, 742.0], [398.0, 742.0], [398.0, 767.0], [34.0, 767.0]], (‘九组收购地址：文昌市东郊镇白石村’, 0.993116557598114)], [[[754.0,
743.0], [983.0, 743.0], [983.0, 765.0], [754.0, 765.0]], (‘收购电话：13976682778’, 0.9968530535697937)], [[[187.0, 780.0], [396.0,
780.0], [396.0, 805.0], [187.0, 805.0]], (‘文昌市会文镇冠南村’, 0.9976257681846619)], [[[753.0, 780.0], [986.0, 780.0], [986.0, 805.0], [753.0, 805.0]], (‘收购电话：18789985540’, 0.9975140690803528)], [[[35.0, 817.0], [727.0, 818.0], [727.0, 843.0], [35.0, 842.0]],
(‘十组收购地址：文昌市蓬莱镇绿涛收购点、琼海市塔洋镇里文收购点’, 0.9777908325195312)], [[[754.0,
819.0], [983.0, 819.0], [983.0, 841.0], [754.0, 841.0]], (‘收购电话：13907682168’, 0.9975283741950989)], [[[37.0, 856.0], [444.0,
856.0], [444.0, 881.0], [37.0, 881.0]], (‘十一组收购地址：文昌市铺前镇、万宁市’, 0.9792234897613525)], [[[753.0, 855.0], [982.0, 855.0], [982.0, 880.0], [753.0, 880.0]], (‘收购电话：13707557555’, 0.9971356987953186)]]]

4.安装PPOCRLabel

1）2.6版本paddleocr和PPOCRLabel的版本对应

以上完成了paddlepaddle和paddleocr的安装，并成功通过测试

接下来应该完成PPOCRLabel标注工具的安装与使用

打开paddleocr库选择2.6版本下载并解压
https://github.com/PaddlePaddle/PaddleOCR/archive/refs/heads/release/2.6.zip

接着直接进入PPOCRLabel文件夹：

cd PaddleOCR-release-2.6/PPOCRLabel

安装PPOCRLabel，为标注数据作准备，运行以下代码：

python setup.py bdist_wheel

该目录下dist文件夹中会生成一个whl文件
接着运行：

pip3 install dist/PPOCRLabel-2.1.3-py2.py3-none-any.whl

可能会提示缺少polygon 库，可以使用pip install Polygon3 -i https://pypi.tuna.tsinghua.edu.cn/simple命令安装。

如果还提示缺少其他包，同样是用pip install “packname” -i https://pypi.tuna.tsinghua.edu.cn/simple命令安装即可。

安装过程可能会出现的报错：

#无法导入str2int_tuple
ImportError: cannot import name 'str2int_tuple'

/anaconda3/envs/ocr/lib/python3.6/site-packages/paddleocr/tools/infer
目录下的utility.py文件内部缺少str2int_tuple函数，是因为源码安装与命令行安装的paddleocr所导致的，根据源码的utility.py文件去修改虚拟环境下的utility.py文件即可，主要进行以下修改：

# 查找str2bool函数
def str2bool(v):
    return v.lower() in ("true", "yes", "t", "y", "1")

#在str2bool函数后面添加str2int_tuple函数
def str2int_tuple(v):
    return tuple([int(i.strip()) for i in v.split(",")])

PPOCRLabel安装成功后，运行以下命令打开：

python PPOCRLabel --lang ch
或
PPOCRLabel --lang ch

在尝试打开PPOCRLabel时，出现了一个bug：

Got keys from plugin meta data ("xcb")
QFactoryLoader::QFactoryLoader() checking directory path "/anaconda3/envs/ocr/bin/platforms" ...
loaded library "/anaconda3/envs/ocr/lib/python3.8/site-packages/cv2/qt/plugins/platforms/libqxcb.so"
QObject::moveToThread: Current thread (0xeb24e0) is not the object's thread (0x5bcd480).
Cannot move to target thread (0xeb24e0)

qt.qpa.plugin: Could not load the Qt platform plugin "xcb" in "/anaconda3/envs/ocr/lib/python3.8/site-packages/cv2/qt/plugins" even though it was found.
This application failed to start because no Qt platform plugin could be initialized. Reinstalling the application may fix this problem.

Available platform plugins are: xcb, eglfs, linuxfb, minimal, minimalegl, offscreen, vnc, wayland-egl, wayland, wayland-xcomposite-egl, wayland-xcomposite-glx, webgl.

这是一个QT问题，很多人都遇见这个问题，常见的解决方法如下：

1、添加bashrc环境export QT_DEBUG_PLUGINS=1，查看是否缺少某些库文件，sudo apt-get install 安装补充
2、降低opencv-contrib-python和opencv-python的版本
3、调整pyqt5的版本或者使用conda安装不使用pip安装pyqt5
4、安装opencv-python-headless库
。。。。。。

我遇到的这个这个问题其实是pyqt5与cv2之间的冲突问题，pyqt5与anaconda3/envs/ocr/lib/python3.8/site-packages/cv2/qt/plugins/platforms发生了冲突，，以上的方法大多数也是倾向于解决掉cv2中的platforms。

官方提供的思路如下：

pip install opencv-python==4.2.0.32 -i https://pypi.tuna.tsinghua.edu.cn/simple

如果不想修改cv版本，那么就去把anaconda3/envs/ocr/lib/python3.8/site-packages/cv2/qt/plugins/platforms中的platforms重命名即可。

按理来说到这里就没有问题了，但是我在启动PPOCRLabel时又出现以下报错而且打不开PPOCRLabel，至今没有解决：

Got keys from plugin meta data ("xcb_glx")
QFactoryLoader::QFactoryLoader() checking directory path "/anaconda3/envs/ocr/bin/xcbglintegrations" ...
loaded library "/anaconda3/envs/ocr/lib/python3.8/site-packages/PyQt5/Qt5/plugins/xcbglintegrations/libqxcb-glx-integration.so"
[2023/12/06 09:42:12] ppocr WARNING: When args.layout is false, args.ocr is automatically set to false

折腾了几天后，觉得是2.6版本paddleocr和PPOCRLabel之间的bug导致的，因为使用2.7版本就能够打开PPOCRLabel。

2）2.7版本paddleocr和PPOCRLabel的版本对应

最新版本2.7，安装命令如下：

pip install "paddleocr==2.7"

与2.6版本的PPOCRLabel源码安装类似

打开paddleocr库选择2.7版本下载并解压

接着直接进入PPOCRLabel文件夹：

cd PaddleOCR-release-2.7/PPOCRLabel

安装PPOCRLabel，为标注数据作准备，运行以下代码：

python setup.py bdist_wheel

该目录下dist文件夹中会生成一个whl文件
接着运行：

#这里就有一些不同
pip3 install dist/paddleocr-2.7.0.1-py3-none-any.whl

可能会提示缺少polygon 库，可以使用pip install Polygon3 -i https://pypi.tuna.tsinghua.edu.cn/simple命令安装。

如果还提示缺少其他包，同样是用pip install “packname” -i https://pypi.tuna.tsinghua.edu.cn/simple命令安装即可。

PPOCRLabel安装成功后，运行以下命令打开：

python PPOCRLabel --lang ch
或
PPOCRLabel --lang ch

在尝试打开PPOCRLabel时，同样出现bug：

Got keys from plugin meta data ("xcb")
QFactoryLoader::QFactoryLoader() checking directory path "/anaconda3/envs/ocr/bin/platforms" ...
loaded library "/anaconda3/envs/ocr/lib/python3.8/site-packages/cv2/qt/plugins/platforms/libqxcb.so"
QObject::moveToThread: Current thread (0xeb24e0) is not the object's thread (0x5bcd480).
Cannot move to target thread (0xeb24e0)

qt.qpa.plugin: Could not load the Qt platform plugin "xcb" in "/anaconda3/envs/ocr/lib/python3.8/site-packages/cv2/qt/plugins" even though it was found.
This application failed to start because no Qt platform plugin could be initialized. Reinstalling the application may fix this problem.

Available platform plugins are: xcb, eglfs, linuxfb, minimal, minimalegl, offscreen, vnc, wayland-egl, wayland, wayland-xcomposite-egl, wayland-xcomposite-glx, webgl.

官方提供的思路如下：

pip install opencv-python==4.2.0.32 -i https://pypi.tuna.tsinghua.edu.cn/simple

如果不想修改cv版本，那么就去把anaconda3/envs/ocr/lib/python3.8/site-packages/cv2/qt/plugins/platforms中的platforms重命名即可。

启动PPOCRLabelPPOCRLabel --lang ch又出现以下报错：

Got keys from plugin meta data ("xcb_glx")
QFactoryLoader::QFactoryLoader() checking directory path "/anaconda3/envs/ocr/bin/xcbglintegrations" ...
loaded library "/anaconda3/envs/ocr/lib/python3.8/site-packages/PyQt5/Qt5/plugins/xcbglintegrations/libqxcb-glx-integration.so"
[2023/12/06 09:42:12] ppocr WARNING: When args.layout is false, args.ocr is automatically set to false

但是PPOCRLabel却能够成功开启。

三、PPOCRLabel标注

1）先命令行打开PPOCRLabel图形化界面

2）打开左上角的PaddleOCR选项列表，点击选择模型选项，然后选择中文&英文，确认

3）打开左上角的文件选项列表，点击打开目录选项，打开需要标注的图片所在文件夹

4）点击左下角的自动标注选项，PPOCRLabel会自动调用模型对每张图片进行标注，等待进度条100%，然后OK

5）自动标注结束以后，打开左上角的文件选项列表，点击导出标记结果和导出识别结果选项

6）开始对每张图片进行检查，点击矩形标注和多点标注选项，手动修改不好的检测框和标签，没问题的点击确认，不喜欢的点击删除图片选项，PPOCRLabel工具操作快捷键如下

7）标注结束以后，再次点击导出标记结果和导出识别结果选项，然后检查图片文件夹中是否生成以下文件

文件名	说明
Label.txt	检测标签，可直接用于PPOCR检测模型训练。用户每确认5张检测结果后，程序会进行自动写入。当用户关闭应用程序或切换文件路径后同样会进行写入。
fileState.txt	图片状态标记文件，保存当前文件夹下已经被用户手动确认过的图片名称。
Cache.cach	缓存文件，保存模型自动识别的结果。
rec_gt.txt	识别标签。可直接用于PPOCR识别模型训练。需用户手动点击菜单栏“文件” - "导出识别结果"后产生。
crop_img	识别数据。按照检测框切割后的图片。与rec_gt.txt同时产生。

8）输入以下命令执行数据集划分脚本：

trainValTestRatio 是训练集、验证集、测试集的图像数量划分比例，根据实际情况设定，默认是6:2:2

datasetRootPath 是PPOCRLabel标注的完整数据集存放路径。默认路径是 PaddleOCR/train_data 分割数据集前

cd ./PPOCRLabel # 将目录切换到PPOCRLabel文件夹下
python gen_ocr_train_val_test.py --trainValTestRatio 6:2:2 --datasetRootPath /home/完整数据集存放路径/train_data

train_data格式如下：

|-train_data
 	  |-crop_img
		    |- 001_crop_0.png
		    |- 002_crop_0.jpg
		    |- 003_crop_0.jpg
		    | ...
	  | Label.txt
	  | rec_gt.txt
	  |- 001.png
	  |- 002.jpg
	  |- 003.jpg
	  | ...

划分好的数据集会保存在PaddleOCR/train_data下面

此时文字检测和文字识别的数据集就都制作好了。

四、PaddleOCR训练与测试

为了加强垂直领域或者说特殊环境下的检测能力，所以会专门使用对应环境的数据集进行训练，得到我们理想中的的模型。

1.文本检测模型训练与测试

根据官方文本检测教程中最简单直接的思路进行训练，至于其他训练方法可以深入参考官方教程。

1）下载预训练模型

准备好数据集后，可以下载模型预训练文件：

MobileNetV3_large_x0_5_pretrained模型下载

还可以选择以下模型：

# 下载MobileNetV3的预训练模型
wget -P ./pretrain_models/ https://paddleocr.bj.bcebos.com/pretrained/MobileNetV3_large_x0_5_pretrained.pdparams
# 或，下载ResNet18_vd的预训练模型
wget -P ./pretrain_models/ https://paddleocr.bj.bcebos.com/pretrained/ResNet18_vd_pretrained.pdparams
# 或，下载ResNet50_vd的预训练模型
wget -P ./pretrain_models/ https://paddleocr.bj.bcebos.com/pretrained/ResNet50_vd_ssld_pretrained.pdparams

下载之后在paddleocr根目录下建立pretrain_models文件夹，并将训练模型放在该文件夹下并解压。

2）修改参数配置文件

修改/PaddleOCR/configs/det目录下的det_mv3_db.yml，或者复制一份重命名。

有关配置文件各项参数的详细解释，请参考官方文档

部分常见配置的修改，建议根据各自训练环境自定义配置文件

python tools/train.py -c configs/llw/det_mv3_db.yml -o Global.pretrained_model=./pretrain_models/MNV3_x0_5/MobileNetV3_large_x0_5_pretrained

如果提示RuntimeError: CUDA out of memory.就需要降低batch，或者清理GPU缓存，总会有奇奇怪怪的进程占着资源不放。

3）可视化训练过程

训练过程中，PaddleOCR文件夹下再开一个终端，输入以下命令+模型输出地址可视化训练过程：

visualdl --logdir "./output/db_mv3"

打开http://localhost:8040/，点击标量数据，即可看见实时信息

4）模型评估测试

评估模型，输入以下命令：

python tools/eval.py -c configs/det/det_mv3_db.yml  -o Global.checkpoints=./output/db_mv3/best_accuracy

对训练好的模型导出导出到/inference/det_db文件夹下，输入以下命令

python tools/export_model.py -c configs/det/det_mv3_db_ocr.yml -o Global.pretrained_model=./output/db_mv3/best_accuracy  Global.save_inference_dir=./inference/det_db

最后使用以下代码，把自己训练的模型更新到det_model_dir，进行测试：

import os
import time

from paddleocr import PaddleOCR
import pandas as pd
import numpy as np
import cv2


def ocr_predict(img):
    '''
    det_model_dir:文本检测
    rec_model_dir:文本识别
    cls_model_dir:方向分类
    '''
    ocr = PaddleOCR(det_model_dir="路径/inference/det_db/",
                    rec_model_dir="路径/rec/ch/ch_PP-OCRv4_rec_infer/",
                    cls_model_dir="路径/cls/ch_ppocr_mobile_v2.0_cls_infer/",
                    lang='ch', use_angle_cls=True,
                    use_gpu=False)
    result = ocr.ocr(img)
    print(result)


if __name__ == '__main__':
    img_path = "路径/ys.jpeg"
    ocr_predict(img_path)

同样成功获取到文本坐标，再根据坐标信息使用ch_PP-OCRv4_rec_infer模型进行识别，具体结果与上文一样，不在此复诉。

2.文本识别模型训练

根据官方文本识别教程中最简单直接的思路进行训练，至于其他训练方法可以深入参考官方教程。

1）下载预训练模型

准备好数据集后，可以下载模型预训练文件：

中英文超轻量ch_PP-OCRv3_rec_train模型下载

还可以选择以下模型：

# 下载中英文超轻量PP-OCRv4模型
wget -P ./pretrain_models/ https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_rec_train.tar
# 或，下载中英文超轻量PP-OCRv3模型
wget -P ./pretrain_models/ https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar
# 或，下载英文超轻量PP-OCRv3模型
wget -P ./pretrain_models/ https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_train.tar

下载之后将训练模型放在pretrain_models文件夹下并解压。

ch_PP-OCRv4_rec_train模型训练涉及到模型蒸馏，所以退而求其次使用ch_PP-OCRv3_rec_train模型。

2）修改参数配置文件

修改/PaddleOCR/configs/rec/PP-OCRv3/目录下的cn_PP-OCRv3_rec.yml，或者复制一份重命名。

有关配置文件各项参数的详细解释，请参考官方文档

部分常见配置的修改，建议根据各自训练环境自定义配置文件

python tools/train.py -c configs/llw/ch_PP-OCRv3_rec.yml -o Global.pretrained_model=./pretrain_models/ch_PP-OCRv3_rec_train/best_accuracy

如果提示RuntimeError: CUDA out of memory.就需要降低batch，或者清理GPU缓存，总会有奇奇怪怪的进程占着资源不放。

3）可视化训练过程

训练过程中，PaddleOCR文件夹下再开一个终端，输入以下命令+模型输出地址可视化训练过程：

visualdl --logdir "./output/rec_ppocr_v3"

打开http://localhost:8040/，点击标量数据，即可看见实时信息

4）模型评估测试

评估模型，输入以下命令：

python tools/eval.py -c configs/rec/ch_PP-OCRv3_rec.yml -o Global.checkpoints=./output/rec_ppocr_v3/latest

对训练好的模型导出导出到/inference/rec_v3文件夹下，输入以下命令

python tools/export_model.py -c configs/rec/ch_PP-OCRv3_rec.yml -o Global.pretrained_model=./output/rec_ppocr_v3/best_accuracy  Global.save_inference_dir=./inference/rec_v3

最后使用以下代码，把自己训练的模型更新到rec_model_dir，进行测试：

import os
import time

from paddleocr import PaddleOCR
import pandas as pd
import numpy as np
import cv2


def ocr_predict(img):
    '''
    det_model_dir:文本检测
    rec_model_dir:文本识别
    cls_model_dir:方向分类
    '''
    ocr = PaddleOCR(det_model_dir="路径/inference/det_db/",
                    rec_model_dir="路径inference/rec_v3/",
                    cls_model_dir="路径/cls/ch_ppocr_mobile_v2.0_cls_infer/",
                    lang='ch', use_angle_cls=True,
                    use_gpu=False)
    result = ocr.ocr(img)
    print(result)


if __name__ == '__main__':
    img_path = "路径/ys.jpeg"
    ocr_predict(img_path)

五、补充

更多官方模型链接

yml部分参数说明

你可能感兴趣的:(深度学习,计算机视觉,nlp,ocr,深度学习,人工智能,paddlepaddle,百度)

happy-llm 第一章 NLP 基础概念 weixin_38374194 自然语言处理人工智能学习
文章目录一、什么是NLP？二、NLP发展三大阶段三、NLP核心任务精要四、文本表示演进史1.传统方法：统计表征2.神经网络：语义向量化课程地址：happy-llmNLP基础概念一、什么是NLP？核心目标：让计算机理解、生成、处理人类语言，实现人机自然交互。现状与挑战：成就：深度学习推动文本分类、翻译等任务达到近人类水平。瓶颈：歧义性、隐喻理解、跨文化差异等。二、NLP发展三大阶段时期代表技术核心思
使用 C++/OpenCV 和 MFCC 构建双重认证智能门禁系统
使用C++/OpenCV和MFCC构建双重认证智能门禁系统引言随着物联网和人工智能技术的发展，智能门禁系统在安防领域的应用越来越广泛。相比于传统的钥匙、门禁卡或密码，生物识别技术（如人脸识别、指纹识别、虹膜识别等）提供了更高的安全性与便利性。然而，单一的生物识别方式在某些场景下可能存在安全隐患。例如，人脸识别可能被高清照片或视频欺骗（称为“欺骗攻击”），在光照、姿态变化剧烈时识别率也可能下降。为了
PHP接单涨薪系列（九）之计算机视觉实战：PHP+Stable Diffusion接单指南（2025高溢价秘籍）攻城狮凌霄 PHP PHP接单涨薪 AI php 计算机视觉 stable diffusion
案例场景某电商公司使用本方案后，产品图制作成本降低90%，广告转化率提升35%，单月节省设计费用超¥80,000。本文将彻底解密如何用PHP+AI视觉技术接取高单价设计外包，让你在竞争激烈的市场中脱颖而出！一、视觉设计市场的AI革命1.1传统设计vsAI设计设计任务传统流程AI流程需求沟通初稿设计反复修改最终交付AI生成微调即时交付2025年设计市场数据对比：指标传统设计AI设计提升幅度单图制作时
SurveyForge：AI自动撰写综述论文的革命性工具，助力科研效率跃升花生糖@ AIGC学习资料库人工智能 AI论文 AI助手
在学术研究领域，综述论文（SurveyPaper）的撰写是一项耗时且复杂的任务，通常需要数周甚至数月的文献调研与内容整合。如今，上海人工智能实验室、复旦大学与上海交通大学联合开源的SurveyForge，通过创新的AI技术，将这一过程压缩至10分钟内，且生成质量接近人工水平，成为科研人员的得力助手。项目简介SurveyForge是一款基于大语言模型（LLM）的自动综述论文生成工具，专为计算机科学领
【多线程】线程的引入，创建线程的方式，设置线程名字、获取名字，线程优先级priority，加入休眠的方法，，后台线程，礼让线程，Join，中断线程，某电影院，共有100张票线程流程图，3售票窗口，心盲i1 Java基础多线程 java
多线程1.线程的引入进程：正在运行的程序，是系统进行资源分配和调用的独立单位。每一个进程都有它自己的内存空间和资源。线程：是进程的单个顺序控制流，或者说就是一个单独执行的路径一个进程如果只有一条执行路径，称之为单线程一个进程如果有多条执行路径，称之为多线程线程是包含在进程中。举例：扫雷，360杀毒软件，百度网盘了解三个关键词：1、串行，指的是一个程序中所有的任务都是按照先后顺序执行的，在前一个任务
供应链风险管理：AI预测潜在风险 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,风险评估,供应链可视化1.背景介绍在当今全球化经济体系中，供应链的复杂性和脆弱性日益凸显。供应链风险是指任何可能对供应链正常运行造成负面影响的事件或因素。这些风险可能来自自然灾害、政治动荡、经济波动、技术故障、供应商违约等方面。一旦供应链风险爆发，可能会导致生产中断、产品短缺、成本飙升、品牌形象受损等严重后果。传统供应链风险管理方法主要依
百度文心一言4.5震撼发布：多模态大模型开源，4240亿参数，免费商用授权
在2025年7月1日，百度正式宣布开源文心4.5系列大模型。这不是一次普通的“模型权重公开”，而是百度给国产大模型行业交了一份“底座+生态+实战”的高质量答卷。文心4.5到底开源了什么？2025年7月1日，百度正式开源了其最新一代大模型——文心4.5系列。这次开源的并不是一个单一模型，而是一个完整的多模态MoE模型家族，包括：：47B和3B的多模态MoE大模型，具备多模态感知和高性能通用推理能力多
供应链风险管理：AI如何预测供应链风险 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,时间序列分析,风险评估1.背景介绍在当今全球化经济体系中，供应链风险已成为企业面临的重大挑战。供应链的复杂性和不可预测性使得企业更容易受到各种风险的影响，例如自然灾害、政治动荡、经济波动、疫情爆发等。这些风险可能导致供应中断、成本增加、交付延迟，甚至损害企业声誉。传统供应链风险管理方法主要依赖于经验和专家判断，缺乏数据驱动和预测能力。随着
【极光优化算法+分解对比】VMD-PLO-Transformer-LSTM多变量时间序列光伏功率预测Matlab代码 matlab科研助手算法 transformer lstm
✅作者简介：热爱数据处理、建模、算法设计的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍光伏发电作为一种清洁能源，其功率预测对于电网稳定运行和电力系统调度至关重要。然而，光伏功率具有高度的非线性和波动性，传统的预测方法难以准确捕捉其动态特性。近年来，深度学习技术在时间序列预测领域取得了显著进展，为提高光伏功率预测精度提供了新的途径
【AI】大语言模型（LLM）& NLP G皮T #大语言模型 LLM NLP 大模型大语言模型 AI 人工智能
大语言模型（LLM）&NLP1.大语言模型（LLM）1.1一句话解释1.2更形象的比喻1.3为什么叫“大”模型1.4它能做什么1.5现实中的例子2.对比NLP2.1用“汽车进化”比喻NLP→LLM2.2为什么说LLM属于NLP2.3LLM的“革命性突破”在哪里2.4总结1.大语言模型（LLM）1.1一句话解释大语言模型（LargeLanguageModel，LLM）是一个“超级文字预测器”，它通过
前端前置知识(笔记) codecat_yu html+css 前端
文章目录1.常见浏览器内核2.W3C标准2.2为什么要遵循WEB标准2.2Web标准的好处3.`SEO`优化1.常见浏览器内核浏览器内核css兼容性写法IE、360、百度trident-ms-firefoxGecko-moz-Safariwebkit-webkit-chromewebkit–>blink-webkit-Operablink-o-2.W3C标准万维网联盟（外语缩写：W3C）标准不是某
百度文心大模型4.5开源风暴！API同步开放！程序员辣条产品经理 langchain 语言模型程序员人工智能大模型学习大模型
百度文心大模型开源，如期而至。就在今天，百度官宣文心大模型4.5系列正式开源，还同步提供API服务。此番，百度一次性推出10款开源模型，涵盖从47B参数的混合专家（MoE）模型到轻量级0.3B稠密型模型，覆盖文本、多模态等多种任务需求。此次开源不仅权重与代码完全开放，还同步提供API服务，开发者可通过飞桨星河社区、HuggingFace、百度智能云千帆平台直接下载使用。文心大模型4.5系列开源模型
【python深度学习】DAY 51 复习日抽风的雨610 【打卡】Python训练营 python 深度学习开发语言
作业：day43的时候我们安排大家对自己找的数据集用简单cnn训练，现在可以尝试下借助这几天的知识来实现精度的进一步提高1.读取数据使用CIFAR-10图像数据importtorchfromtorchvisionimportdatasets,transforms#数据预处理transform=transforms.Compose([transforms.ToTensor(),transforms.
使用Python爬虫与自然语言处理技术抓取并分析网页内容 Python爬虫项目 python 爬虫自然语言处理 javascript 数据分析人工智能
1.引言在如今数据驱动的时代，网页爬虫（WebScraping）和自然语言处理（NLP）已成为处理大量网页数据的重要工具。利用Python爬虫抓取网页内容，结合NLP技术进行文本分析和信息抽取，能够从大量网页中提取有价值的信息。无论是新闻文章的情感分析、社交媒体的舆情分析，还是电商网站的商品评论挖掘，这些技术都发挥着至关重要的作用。本文将介绍如何利用Python爬虫与自然语言处理技术抓取并分析网页
用Python解锁图像处理之力：从基础到智能应用的深度探索熊猫钓鱼>_> python 图像处理开发语言
在像素构成的数字世界里，Python已成为解码图像奥秘的核心引擎。一、为何选择Python处理图像？超越工具的本质思考当人们谈论图像处理时，往往会陷入工具对比的漩涡（PythonvsMATLABvsC++）。但Python的真正价值在于其构建的完整生态闭环：科学计算基石：NumPy的ndarray结构完美对应图像的多维矩阵本质算法实现自由：从传统算子到深度学习模型的无缝衔接可视化即战力：Matpl
面向高校的人工智能通识教育课程实验设计方案武汉唯众智创人工智能人工智能通识教育课程实验人工智能通识教育人工智能通识课程人工智能通识
一、前言2018年，教育部发布《高等学校人工智能创新行动计划》，明确提出“重视人工智能与计算机、控制、数学、统计学、物理学、生物学、心理学、社会学、法学等学科专业教育的交叉融合，探索‘人工智能+X’的人才培养模式”。过去，人工智能教育多集中于研究生阶段，本科生接触机会相对有限。2019年，教育部批准35所高校增设“人工智能”本科专业，这标志着人工智能正式纳入本科教育体系。如今，人工智能课程大多是计
Power Platform VSCode扩展教程褚知茉Jade
PowerPlatformVSCode扩展教程powerplatform-vscodeThePowerPlatformVSCodeextensionmakesiteasytomanagePowerPlatformenvironmentsandallowsthedevelopertocreate,buildanddeployPowerPlatformsolutions,packagesandport
python多人聊天室跨主机_python+tcp实现多人聊天室
tcp介绍引用百度百科的介绍传输控制协议(TCP，TransmissionControlProtocol)是一种面向连接的、可靠的、基于字节流的传输层通信协议，由IETF的RFC793[1]定义。TCP旨在适应支持多网络应用的分层协议层次结构。连接到不同但互连的计算机通信网络的主计算机中的成对进程之间依靠TCP提供可靠的通信服务。TCP假设它可以从较低级别的协议获得简单的，可能不可靠的数据报服务。
深度学习数据集加载 Ethan@LM 深度学习人工智能
数据集结构E:\Mytest\test20250622\pythonProject\dataset├──rose│├──rose1.jpg│├──rose2.jpg│└──...└──sunflower├──sunflower1.jpg├──sunflower2.jpg└──...主要只有的两个类fromtorch.utils.dataimportDatasetfromtorchvisionimp
npm代理设置 + npm配置镜像源 whale fall 前端Vue npm 前端 node.js
npm代理设置输入以下几行命令：npmconfigrmproxynpmconfigrmhttp-proxynpmconfigrmhttps-proxynpmconfigsetregistryhttp://cmc-cd-mirror.rnd.huawei.com/npmnpmconfigsetstrict-ssl=falsesetregistry可以换为国内的其他开源镜像仓，比如阿里的，百度的，淘宝
纹理贴图算法研究论文综述点云SLAM 算法图形图像处理算法纹理贴图计算机图形学计算机视觉人工智能虚拟现实（VR）纹理贴图算法综述
纹理贴图（TextureMapping）是计算机图形学和计算机视觉中的核心技术，广泛应用于三维重建、游戏渲染、虚拟现实（VR）、增强现实（AR）等领域。对其算法的研究涵盖了纹理生成、映射、缝合、优化等多个方面。1.引言纹理贴图是指将二维图像纹理映射到三维几何表面上，以增强模型的视觉真实感。传统方法主要关注静态几何模型上的纹理生成与映射，而近年来，随着多视角图像重建、RGB-D扫描、神经渲染的发展，
ppocrv5训练参数设置完整配置(实测在2080ti可成功运行且f1＞85%)
Global:model_name:PP-OCRv5_server_det#Tousestaticmodelforinference.debug:falseuse_gpu:trueepoch_num:&epoch_num500log_smooth_window:20print_batch_step:5save_model_dir:./output/PP-OCRv5_server_detsave_e
小数据量在paddleocrv4/5训练精度不高的原因探讨
问题：训练集有69张，验证集有48张,每张图的尺寸为2592*1396或接近这个尺寸，每张图约有50到60个目标,且每张图有较多的密集小目标，这些目标区域分别是一些文字或字母或数字。电脑配置显卡是2080ti，运行内存是32g，cpu是9700k。以上条件下，在pp-ocrv3上采用ch_pp_ocrv3_det_student.yml配置并采用ch_pp_ocrv3_det_distill_tr
从Apollo record文件中提取坐标信息绘制地图轨迹 Hi20240217 代码片段学习 Apollo 自动驾驶地图
从Apollorecord文件中提取坐标信息绘制地图轨迹一、背景二、操作步骤2.1下载record文件并解压2.2查看record文件信息2.3查询Sunnyvale的经纬度2.4从record中提取position绘制地图轨迹2.5绘制卫星地图轨迹2.6运行脚本三、技术总结一、背景自动驾驶技术的发展离不开大量真实道路数据的收集和分析。百度Apollo平台使用record文件格式记录车辆在实际道路
使用TVM编译部署DarkNet模型：YOLO-V2和YOLO-V3实战指南周情津Raymond
使用TVM编译部署DarkNet模型：YOLO-V2和YOLO-V3实战指南tvm-cnTVMDocumentationinChineseSimplified/TVM中文文档项目地址:https://gitcode.com/gh_mirrors/tv/tvm-cn前言在深度学习模型部署领域，TVM作为一个高效的深度学习编译器栈，能够将训练好的模型优化并部署到各种硬件平台上。本文将详细介绍如何使用T
SpringBoot电商项目实战：从零搭建百万级架构
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot电商项目实战：从
ConvNeXT：面向 2020 年代的卷积神经网络
摘要视觉识别的“咆哮二十年代”始于VisionTransformer（ViT）的引入，ViT很快取代了ConvNet，成为图像分类任务中的最新最强模型。然而，vanillaViT在应用于目标检测、语义分割等通用计算机视觉任务时面临困难。HierarchicalTransformer（如SwinTransformer）重新引入了若干ConvNet的先验知识，使Transformer成为实用的通用视觉
人工智能赋能气象气候：从数据智能到预测创新的融合之路慌ZHANG 人工智能人工智能
个人主页：慌ZHANG-CSDN博客期待您的关注一、引言：气象气候与AI的“天然耦合”气象与气候系统是典型的复杂、多尺度、强非线性的自然系统，其建模、分析与预测依赖庞大观测数据和高性能计算资源。传统方法以数值天气预报（NWP）与物理建模为核心，虽然取得重要成就，但也面临计算代价大、精度不足、长期预测偏差大等瓶颈。与此同时，人工智能（AI），尤其是以深度学习为代表的机器学习方法，近年来在图像识别、自
【深度学习|冰川制图9】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构努力毕业的小土博^_^ 优秀论文推荐深度学习学习架构
【深度学习|冰川制图9】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构【深度学习|冰川制图9】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构文章目录【深度学习|冰川制图9】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构结果与讨论3.1消融区制图欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上岸上岸上岸！upupup大多数高校硕博生毕业要
python模拟内置函数reversed_Python内置函数reversed weixin_39594895
{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台；社区覆盖了云计算、大数据、人工智能、IoT、云原生、数据库、微服务、安全、开发与运维9大技术领域。","link1":
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多