【python】【OCR】安装飞浆paddle框架注意事项(个人向)

安装paddle注意事项

  • 前言
    • 1、对于paddle版本的选择
        • 1.1 CUDA官方下载:
        • 1.2 cuDnn官方下载(需要注册账号):
        • 1.3 根据CUDA版本(或者CPU版本)pip相应飞浆框架命令
    • 2、Anaconda安装失败(非必要)
    • 3、运行测试代码时出现“No module named 'paddle'”
        • 3.1 pip安装尝试
        • 3.2 pip paddle时缺少库
        • 3.3 还是重复出现“No module named 'paddle'
    • 4、运行测试代码时出现“cannot import name 'inference' from 'paddle'”
        • 4.1重新安装paddle框架命令
        • 4.2重新安装Shapely库
    • 5、测试代码
  • 使用感想。。。(2022.11.14补充)

前言

paddle要求非常严格!!!作为python小白,下面说说自己在安装paddle期间遇到过的问题。本文章由本人成功安装后编写,所以没有多少截图,时间为2022年6月,PaddleOCR最新版本为release2.5。飞浆最新版本2.3。
总结:多通过百度和CSDN搜索问题。

阅览本文前请先参照官方或各位大佬的文献进行安装
有时候按照大佬们的解决办法安装完后还有问题出现,此时可以尝试关闭项目重新打开尝试。

本人操作环境如下:
win10(新装的,以前一直用win7)
python 3.8
PaddleOCR最新版本为release2.5
GTX 1050 显卡(家用电脑)
渣渣显卡(办公电脑)

1、对于paddle版本的选择

参考官方:
链接: https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/windows-pip.html.

如果您的计算机没有 NVIDIA® GPU,请安装CPU版的PaddlePaddle

如果您的计算机有NVIDIA® GPU,请确保满足以下条件并且安装GPU版PaddlePaddle
CUDA 工具包10.1/10.2 配合 cuDNN v7.6.5
CUDA 工具包 11.0 配合 cuDNN v8.0.2
CUDA 工具包 11.1 配合 cuDNN v8.1.1
CUDA 工具包 11.2 配合 cuDNN v8.2.1
GPU运算能力超过3.5的硬件设备

*注:目前官方发布的windows安装包 仅包含 CUDA 10.1/10.2/11.0/11.1/11.2 ,如需使用其他cuda版本,请通过源码自行编译。您可参考NVIDIA官方文档了解CUDA和CUDNN的安装流程和配置方法,请见CUDA,cuDNN

注意 只能选择安装CUDA 10.1/10.2/11.0/11.1/11.2版本!!!不要安装CUDA最新版本!(本文编写时CUDA最新版本是11.7) 然后根据上述要求配套下载cuDnn版本!
已安装过最新版本的,可以搜索如何更换CUDA版本。

1.1 CUDA官方下载:

链接: https://developer.nvidia.com/cuda-toolkit-archive.

1.2 cuDnn官方下载(需要注册账号):

链接: https://developer.nvidia.com/rdp/cudnn-download.

1.3 根据CUDA版本(或者CPU版本)pip相应飞浆框架命令

本人家用电脑GTX1050显卡,选择了CUDA11.2版本。
办公电脑渣渣显卡所以选择了cpu2.3版本,在运行测试代码时遇到过不知名错误,重新安装了CPU2.2版本( 历史版本 )居然奇迹运行起来。。。

2、Anaconda安装失败(非必要)

如果你还在用win7,那么请你用win10,本人在使用win7时安装anaconda一直失败在“创建menu”上,查找相关大佬文章后理解到原因是安装时它在安装时会自主使用python3.9来执行创建的”.py“文件,而python3.9不支持win7。

3、运行测试代码时出现“No module named ‘paddle’”

在确保其他东西都pip好后(升级pip、官方框架PaddlePaddle、requirements.txt内的库),还出现该问题:

3.1 pip安装尝试

pip install paddle

3.2 pip paddle时缺少库

解决办法:根据提示安装相应的库,如“common, dual, tight, data, prox”等。

3.3 还是重复出现“No module named ‘paddle’

打开python终端时出现红色“Pycharm无法加载文件 xx\Scripts\Activate.ps1,因为在此系统上禁止运行脚本”(作为新装win10小白出现的问题)

解决办法参考:
链接: https://www.cnblogs.com/fuqian/p/16278162.html.
再重新回到上面的【3.1 pip安装尝试】

4、运行测试代码时出现“cannot import name ‘inference’ from ‘paddle’”

4.1重新安装paddle框架命令

参考1.3

4.2重新安装Shapely库

下载链接: https://www.lfd.uci.edu/~gohlke/pythonlibs/#shapely.
根据运行环境选择相应的Shapely库,比如我的环境是Python3.8、64位Windows系统,那么选择文件为CP38(python版本)下载:

Shapely‑1.8.2‑cp38‑cp38‑win_amd64.whl

将文件保存好后pip:

pip install 【自填路径】Shapely-1.8.2-cp38-cp38-win_amd64.whl

5、测试代码

import paddle  
paddle.utils.run_check()
from paddleocr import PaddleOCR, draw_ocr
from PIL import Image

# Paddleocr目前支持中英文、英文、法语、德语、韩语、日语,可以通过修改lang参数进行切换
# 参数依次为`ch`, `en`, `french`, `german`, `korean`, `japan`。
ocr = PaddleOCR(use_angle_cls=True, lang="ch") # need to run only once to download and load model into memory
img_path = '4.jpg'  # 不支持中文路径
result = ocr.ocr(img_path, cls=True)
for line in result:
   print(line)  # 列表list

   image = Image.open(img_path).convert('RGB')
   boxes = [line[0] for line in result]
   txts = [line[1][0] for line in result]
   scores = [line[1][1] for line in result]
   im_show = draw_ocr(image, boxes, txts, scores)  # , font_path='./fonts/simfang.ttf')   # 字体路径
   im_show = Image.fromarray(im_show)
   im_show.save('result.jpg')

im_show.show()

运行成功时,满满的泪水从眼眶流出。。。

使用感想。。。(2022.11.14补充)

11月1日左右对一些模糊程度一般的图进行识别(大概类似于BMG),识别准确度能达到90%左右,还是需要自行处理错别字。
今天电脑端VX更新了图像识别OCR功能,相同的图准确率高得离谱,有感而发,特意添加该补充。
(;´д`) 可是腾讯云文字识别貌似下个月就没有免费额度了,不然可以花点精神研究一下。

你可能感兴趣的:(python,python,paddle)