PaddleOcr框架 win10安装流程(python Ocr 文字识别)

paddleOCR安装流程

paddle是百度的开源深度学习平台,非常优秀,这里贴一个我个人的安装流程

1.首先去github查看安装说明

https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/installation.md

下载完代码以后也可以去到doc_ch查看更详细的内容

PaddleOcr框架 win10安装流程(python Ocr 文字识别)_第1张图片

使用mac或者windows直接从第二点开始

2. 安装 paddlepaddle

我装在了pycharm环境下

当然也可以cmd运行:

pip install paddlepaddle==2.0.0b0 -i https://mirror.baidu.com/pypi/simple

PaddleOcr框架 win10安装流程(python Ocr 文字识别)_第2张图片

3. github下载PaddleOcr代码

https://github.com/PaddlePaddle/PaddleOCR

PaddleOcr框架 win10安装流程(python Ocr 文字识别)_第3张图片

4. 解压后用cmd安装第三方库

进入解压后的文件夹,进入cmd,输入:

pip install -r requirements.txt

PaddleOcr框架 win10安装流程(python Ocr 文字识别)_第4张图片

4.1 VC++ 14.0环境的处理

首次安装时,到Levenshtein时很有可能会报错

PaddleOcr框架 win10安装流程(python Ocr 文字识别)_第5张图片

查看错误原因,发现需要VC++ 14.0环境,到推荐的网址去下载安装器

https://visualstudio.microsoft.com/visual-cpp-build-tools/

 PaddleOcr框架 win10安装流程(python Ocr 文字识别)_第6张图片

 打开安装器,可选部分在默认以外多勾一个vc++14.0就行了,等待安装,安装后重启

PaddleOcr框架 win10安装流程(python Ocr 文字识别)_第7张图片

 PaddleOcr框架 win10安装流程(python Ocr 文字识别)_第8张图片

 PaddleOcr框架 win10安装流程(python Ocr 文字识别)_第9张图片

 重启后回到第4步,执行

pip install -r requirements.txt

5. 查看使用说明文档,安装paddleocr

# 文档位置
..\PaddleOCR-release-2.5\doc\doc_chwhl.md
# 用cmd安装这个
pip install "paddleocr>=2.0.1"

5.1 代码使用

paddleocr whl包会自动下载ppocr轻量级模型作为默认模型,可以根据第3节自定义模型进行自定义更换。

  • 检测+方向分类器+识别全流程

from paddleocr import PaddleOCR, draw_ocr

# Paddleocr目前支持中英文、英文、法语、德语、韩语、日语,可以通过修改lang参数进行切换
# 参数依次为`ch`, `en`, `french`, `german`, `korean`, `japan`。
ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # need to run only once to download and load model into memory
img_path = 'PaddleOCR/doc/imgs/11.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:
    print(line)

# 显示结果
from PIL import Image

image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='/path/to/PaddleOCR/doc/fonts/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')

结果是一个list,每个item包含了文本框,文字和识别置信度

[[[24.0, 36.0], [304.0, 34.0], [304.0, 72.0], [24.0, 74.0]], ['纯臻营养护发素', 0.964739]]
[[[24.0, 80.0], [172.0, 80.0], [172.0, 104.0], [24.0, 104.0]], ['产品信息/参数', 0.98069626]]
[[[24.0, 109.0], [333.0, 109.0], [333.0, 136.0], [24.0, 136.0]], ['(45元/每公斤,100公斤起订)', 0.9676722]]
......

结果可视化

剩下的请自己去看说明文档

你可能感兴趣的:(游戏脚本,paddlepaddle,python,深度学习)