【搭建OpenCV+Tesseract】

1.vcpkg学习使用

Step1:安装git
下载地址
【搭建OpenCV+Tesseract】_第1张图片
Step2:下载安装vcpkg
等待一段直到下载完成。

git clone https://github.com/microsoft/vcpkg

配置环境变量
【搭建OpenCV+Tesseract】_第2张图片
Step3:编译项目。即:下图右侧的黑框消失

bootstrap-vcpkg.sh

【搭建OpenCV+Tesseract】_第3张图片
step4:集成到系统环境

.\vcpkg.exe integrate install  (安装)
.\vcpkg.exe integrate remove   (移除)

2.基于vcpkg调用Tesseract第三方库

step1:下载第三方库

注:遇到下载半天的可以自己用迅雷去下载或者科学上网或者多多try again,在放到相应的文件夹如:D:\Code\vcpkg\downloads

 vcpkg install tesseract:x64-windows
vcpkg install tesseract:x86-windows

【搭建OpenCV+Tesseract】_第4张图片

【搭建OpenCV+Tesseract】_第5张图片
【搭建OpenCV+Tesseract】_第6张图片
API官网案例演示
step2:安装opencv

vcpkg install opencv:x86-windows
vcpkg install opencv:x64-windows

官网API学习手册
step3:配置Tesseract中文训练字符
下载地址
在这里插入图片描述

文件下载下来并放到项目输出目录下并新建文件夹命名为tessdata即可

#include 
#include 
#include 
#include
#include 
#include 
#include 
#include 
#include 

using namespace cv;
using namespace tesseract;
using namespace std;
int main()
{
	string outText;
	string imPath = "D:/1104dc4c2fef4d3fbc7ea939d9b35ced.jpg";

	// Create Tesseract object
	tesseract::TessBaseAPI *ocr = new tesseract::TessBaseAPI();

	/*
	 Initialize OCR engine to use English (eng) and The LSTM
	 OCR engine.


	 There are four OCR Engine Mode (oem) available

	 OEM_TESSERACT_ONLY             Legacy engine only.
	 OEM_LSTM_ONLY                  Neural nets LSTM engine only.
	 OEM_TESSERACT_LSTM_COMBINED    Legacy + LSTM engines.
	 OEM_DEFAULT                    Default, based on what is available.
	*/

	//中英文识别
	ocr->Init(NULL, "chi_sim", tesseract::OEM_LSTM_ONLY);

	//英文识别
	//ocr->Init("./tessdata", "eng", tesseract::OEM_LSTM_ONLY);

	// Set Page segmentation mode to PSM_AUTO (3)
	// Other important psm modes will be discussed in a future post.
	ocr->SetPageSegMode(tesseract::PSM_AUTO);

	// Open input image using OpenCV
	Mat im = cv::imread(imPath, IMREAD_COLOR);
	imshow("Image Source", im);
	// Set image data
	ocr->SetImage(im.data, im.cols, im.rows, 3, im.step);

	// Run Tesseract OCR on image
	outText = string(ocr->GetUTF8Text());

	std::ofstream fout("1.txt", std::ios::out);
	std::cout << "识别结果: " << string(outText) << std::endl;
	fout << outText;
	fout.close();

	// Destroy used object and release memory
	ocr->End();

	waitKey(0);
}

【搭建OpenCV+Tesseract】_第7张图片
解决方法:
方式一:网上找vs2017控制台出现中文乱码
方式二:网上找个utf-8转ansi码的代码自己转一下
方式三:解决方案,亲测可用

你可能感兴趣的:(【AI应用】,opencv,windows,人工智能)