Windows使用PPOCRLabel

问题

想使用PaddleOcr下面的标注工具PPOCRLabel进行图像文本检测标注,在windos下安装出现了一些问题,耗费了半天时间解决了这个问题

项目地址:https://github.com/PaddlePaddle/PaddleOCR

安装包requirements

shapely
scikit-image
imgaug==0.4.0
pyclipper
lmdb
tqdm
numpy
visualdl
python-Levenshtein
opencv-contrib-python==4.4.0.46
cython
lxml
premailer
openpyxl
fasttext==0.9.1

windows安装

安装PPOCRLabel
教程: https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/PPOCRLabel/README_ch.md

先安装PaddleOcr所需的包

pip install -r requrements.txt -i https://mirror.baidu.com/pypi/simple

在安装到python-Levenshtein时候报错:

building ‘Levenshtein._levenshtein’ extension error: Microsoft Visual C++ 14.0 or greater is required. Get it with “Microsoft C++ Build Tools”: https://visualstudio.microsoft.com/visual-cpp-build-tools/

查看问题,解决方法:

  • https://docs.microsoft.com/en-us/answers/questions/136595/error-microsoft-visual-c-140-or-greater-is-require.html

下载安装vs相关的东西之后再安装就不报错了,继续安装paddleLabel

按照教程安装环境

pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
pip install PPOCRLabel 

结果

Windows使用PPOCRLabel_第1张图片
会下载通用的模型进行自动标注,后续只需要人为的微调一些即可

文件名 说明
Label.txt 检测标签,可直接用于PPOCR检测模型训练。用户每确认5张检测结果后,程序会进行自动写入。当用户关闭应用程序或切换文件路径后同样会进行写入。
fileState.txt 图片状态标记文件,保存当前文件夹下已经被用户手动确认过的图片名称。
Cache.cach 缓存文件,保存模型自动识别的结果。
rec_gt.txt 识别标签。可直接用于PPOCR识别模型训练。需用户手动点击菜单栏“文件” - "导出识别结果"后产生。
crop_img 识别数据。按照检测框切割后的图片。与rec_gt.txt同时产生。
快捷键 说明
Ctrl + shift + R 对当前图片的所有标记重新识别
W 新建矩形框
Q 新建四点框
Ctrl + E 编辑所选框标签
Ctrl + R 重新识别所选标记
Ctrl + C 复制并粘贴选中的标记框
Ctrl + 鼠标左键 多选标记框
Backspace 删除所选框
Ctrl + V 确认本张图片标记
Ctrl + Shift + d 删除本张图片
D 下一张图片
A 上一张图片
Ctrl++ 缩小
Ctrl– 放大
↑→↓← 移动标记框

你可能感兴趣的:(OCR,windows,paddlepaddle,python)