Tesseract简介

最近在做一个OCR识别相关项目,前期花了不少时间,最终用Tesseract这个比较成熟的开源项目,在研究Tesseract的过程中走了一些弯路,目前识别结果还比较满意,现在准备每天抽些时间,把自己的一些心得整理起来,以供大家参考,因为我也是才研究一两个月,理解不是很到位,欢迎大家指正。我准备从以下几个方面来介绍

  •    Tesseract简介
  •    Tesseract编译
    • Windows
    • Linux
  • 把Tesseract嵌入到OpenCV中
  • Tesseract训练
    • 如何提高图片识别质量
    • Tesseract v3 训练
    • Tesseract v4 训练
      • 如何从头开始训练
      • 如何做Fine Tuned
      • 需要注意的事项
    • VGSLSpecs 介绍
  • 如何针对具体项目使用Tesseract

Tesseract 的历史比较长了,在网上可以找到很多关于它的相关介绍,这里不做赘述,最早是惠普开发的一个OCR识别引擎,历经几十年,现在是谷歌在开发维护。要掌握它必须看官网的介绍,这是它的官网地址 https://github.com/tesseract-ocr,不懂的可以看wiki,或者在google的Tesseract-OCR论坛上发帖提问,很快会有响应。

 

 

 

 

先想这么多了,后面再做修正

你可能感兴趣的:(Tesseract-OCR)