tesseract-ocr 4.0 安装及使用

Tesseract-ocr 4.0安装及使用

主要介绍linux,windows操作系统下的安装,后续补充macos。
简单介绍一下引擎的安装及使用,因为最近做的项目用到图片文本识别,于是从win10切换到ubuntu,都进行了安装。下一篇和大家分享在python使用tesseract。

目录

  • Tesseract-ocr 40安装及使用
    • 目录
    • Tesseract-ocr 40介绍
    • ubuntu1604
    • win10

Tesseract-ocr 4.0介绍

  • 2006年google负责研发这个引擎并开源
  • 目前稳定版本是3.05, 4.0仍处于研发
  • 4.0加入了基于LSTM的神经网络技术,提升了准确率
  • 别的就不介绍了可以看这个链接——[各版本说明]

ubuntu16.04

  1. 下载及安装

    这里采用的是第三方软件——[安装说明]

    terminal执行如下命令

    • sudo add-apt-repository ppa:alex-p/tesseract-ocr (添加软件源)
      tesseract-ocr 4.0 安装及使用_第1张图片

    • sudo apt-get update (更新)

    • sudo apt-get install tesseract-ocr (安装)
      tesseract-ocr 4.0 安装及使用_第2张图片

    • 测试安装是否成功: tesseract –version
      tesseract-ocr 4.0 安装及使用_第3张图片

    • 使用测试 : tesseract imagename|stdin outputbase|stdout [options…] [configfile…]

      • imagename-文件路径
      • outputbase-输出路径
      • options-可选控制参数
        • 语言,引擎等
      • configfile-配置

        使用测试

    • 字库文件tessdata下载
      直接安装的字库文件,默认在 /usr/share/tesseract-ocr /4.0/tessdata目录下,貌似只有英文的吧,明显不够用呀,于是下载字库文件添加到这个目录下。 [下载链接]

win10

  1. 下载 [github链接]

    tesseract-ocr 4.0 安装及使用_第4张图片

    选择第一个链接下载exe文件,点击安装。
    查看tessdata,有没有完整的字库文件,没有下载呀。 [下载链接]

    安装好以后,进入安装目录测试。
    因为在ubuntu下写的呀,就没有截图,后续补充!

你可能感兴趣的:(程序安装)