paddle要求非常严格!!!作为python小白,下面说说自己在安装paddle期间遇到过的问题。本文章由本人成功安装后编写,所以没有多少截图,时间为2022年6月,PaddleOCR最新版本为release2.5。飞浆最新版本2.3。
总结:多通过百度和CSDN搜索问题。
阅览本文前请先参照官方或各位大佬的文献进行安装
有时候按照大佬们的解决办法安装完后还有问题出现,此时可以尝试关闭项目重新打开尝试。
本人操作环境如下:
win10(新装的,以前一直用win7)
python 3.8
PaddleOCR最新版本为release2.5
GTX 1050 显卡(家用电脑)
渣渣显卡(办公电脑)
参考官方:
链接: https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/windows-pip.html.
如果您的计算机没有 NVIDIA® GPU,请安装CPU版的PaddlePaddle
如果您的计算机有NVIDIA® GPU,请确保满足以下条件并且安装GPU版PaddlePaddle
CUDA 工具包10.1/10.2 配合 cuDNN v7.6.5
CUDA 工具包 11.0 配合 cuDNN v8.0.2
CUDA 工具包 11.1 配合 cuDNN v8.1.1
CUDA 工具包 11.2 配合 cuDNN v8.2.1
GPU运算能力超过3.5的硬件设备*注:目前官方发布的windows安装包 仅包含 CUDA 10.1/10.2/11.0/11.1/11.2 ,如需使用其他cuda版本,请通过源码自行编译。您可参考NVIDIA官方文档了解CUDA和CUDNN的安装流程和配置方法,请见CUDA,cuDNN
注意 只能选择安装CUDA 10.1/10.2/11.0/11.1/11.2版本!!!不要安装CUDA最新版本!(本文编写时CUDA最新版本是11.7) 然后根据上述要求配套下载cuDnn版本!
已安装过最新版本的,可以搜索如何更换CUDA版本。
链接: https://developer.nvidia.com/cuda-toolkit-archive.
链接: https://developer.nvidia.com/rdp/cudnn-download.
本人家用电脑GTX1050显卡,选择了CUDA11.2版本。
办公电脑渣渣显卡所以选择了cpu2.3版本,在运行测试代码时遇到过不知名错误,重新安装了CPU2.2版本( 历史版本 )居然奇迹运行起来。。。
如果你还在用win7,那么请你用win10,本人在使用win7时安装anaconda一直失败在“创建menu”上,查找相关大佬文章后理解到原因是安装时它在安装时会自主使用python3.9来执行创建的”.py“文件,而python3.9不支持win7。
在确保其他东西都pip好后(升级pip、官方框架PaddlePaddle、requirements.txt内的库),还出现该问题:
pip install paddle
解决办法:根据提示安装相应的库,如“common, dual, tight, data, prox”等。
打开python终端时出现红色“Pycharm无法加载文件 xx\Scripts\Activate.ps1,因为在此系统上禁止运行脚本”(作为新装win10小白出现的问题)
解决办法参考:
链接: https://www.cnblogs.com/fuqian/p/16278162.html.
再重新回到上面的【3.1 pip安装尝试】
参考1.3
下载链接: https://www.lfd.uci.edu/~gohlke/pythonlibs/#shapely.
根据运行环境选择相应的Shapely库,比如我的环境是Python3.8、64位Windows系统,那么选择文件为CP38(python版本)下载:
Shapely‑1.8.2‑cp38‑cp38‑win_amd64.whl
将文件保存好后pip:
pip install 【自填路径】Shapely-1.8.2-cp38-cp38-win_amd64.whl
import paddle
paddle.utils.run_check()
from paddleocr import PaddleOCR, draw_ocr
from PIL import Image
# Paddleocr目前支持中英文、英文、法语、德语、韩语、日语,可以通过修改lang参数进行切换
# 参数依次为`ch`, `en`, `french`, `german`, `korean`, `japan`。
ocr = PaddleOCR(use_angle_cls=True, lang="ch") # need to run only once to download and load model into memory
img_path = '4.jpg' # 不支持中文路径
result = ocr.ocr(img_path, cls=True)
for line in result:
print(line) # 列表list
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores) # , font_path='./fonts/simfang.ttf') # 字体路径
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')
im_show.show()
运行成功时,满满的泪水从眼眶流出。。。
11月1日左右对一些模糊程度一般的图进行识别(大概类似于BMG),识别准确度能达到90%左右,还是需要自行处理错别字。
今天电脑端VX更新了图像识别OCR功能,相同的图准确率高得离谱,有感而发,特意添加该补充。
(;´д`) 可是腾讯云文字识别貌似下个月就没有免费额度了,不然可以花点精神研究一下。