半自动标注工具PPOCRLabel在Windows环境下的使用

项目代码地址:https://github.com/PaddlePaddle/PaddleOCR

  1. 创建虚拟环境(我装的python3.6)

  2. 更新pip: pip install --upgrade pip

  3. 安装paddle库: python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple(cpu版本)

    pip install paddlepaddle

  4. 安装PPOCRLabel: pip install PPOCRLabel -i https://mirrors.aliyun.com/pypi/simple

  5. 启动: python PPOCRLabel.py --lang ch

半自动标注工具PPOCRLabel在Windows环境下的使用_第1张图片

以上展示了一张图像的识别结果

文件的识别结果导出有三个文件:

半自动标注工具PPOCRLabel在Windows环境下的使用_第2张图片

Cache.cach是工具自动标注的结果

fileState.txt保存了人工确认过后的图片信息

Label.txt保存了确认过的图片中识别出来的文字信息以及标注框的位置信息

之所以称为“半自动”工具,是因为它识别也不可能达到百分百准确,也需要人眼去校对是否准确,查到有错误的,直接点击那个识别框,然后就可以在右边的识别结果中进行修改,确认后才算打标完成。

你可能感兴趣的:(OCR,python,windows,开发语言)