weixin_30508241

[转]Tesseract-OCR学习系列

转载地址：http://www.jianshu.com/p/a53c732d8da3

Tesseract-OCR学习系列（三）简例

Tesseract API Basic Example using CMake Configuration

参考文档：https://github.com/tesseract-ocr/tesseract/wiki/APIExample

Tesseract提供的API可以在baseapi.h文件中找到。然而，如果没有个示例带我们飞一会儿，也是颇难搞懂到底该怎么调用tesseract的api。

我们知道，如果要调用一个第三方的库，那我们需要在工程的属性中增加：

第三方库头文件的位置。
第三方库库文件的位置。
第三方库中，需要链接的lib文件的文件名。

而且，Debug和Release需要分开来配置。手动配置真的是麻烦极了。而且，即使你配置好了，如果你第三方库的位置改变了，那对不起，请重新配置；如果你要把工程给别人来使用，而别人的第三方库所放的位置与你所放的不同，对不起，需要重新配置；如果你想要换一个操作系统进行开发，对不起，请重新配置！那有没有办法可以绕过这些麻烦事，使得只用麻烦一次，以后永远简单呢？答案是有。工具就是CMake。可参看我的另一篇文章：CMake简要教程。这里，我给大家举例介绍，如何使用CMake来添加第三方库。

首先，我们需要将第三方库Tesseract所提供的东西集中存放。比如，我在F盘的extralib中建立了一个Tesseract文件夹。文件夹中，有bin文件夹include文件夹，lib文件夹，以及tessdata文件夹。其中：

bin：存放.dll文件。
include：存放.h文件。
lib：存放.lib文件。
tessdata：存放.traineddata文件。

bin文件夹

include文件夹

其中，tesseract的.h文件比较分散。我是直接在原来的tessract中搜索所有的.h文件，然后再拷贝到这边来的。

lib文件夹

tessdata文件夹

其中，chi_sim代表简体中文，eng就不用说了，代表英文。tessdata文件夹中的内容可以在官方网站中下载到。

好了，现在有了这样一个文件夹，我们下面的目标是让CMake可以找到这些文件夹。为了达到这个目的，首先需要自己写名为TesseractConfig.cmake一个文件，放在刚刚建立的tesseract文件夹中。所以，tesseract文件夹最终看起来是这个样子的：

tesseract文件夹

如果CMake能找到TesseractConfig.cmake这个文件，就可以通过find_package函数来找到Tesseract的各个文件夹的路径了。但问题是，CMake如何找到TesseractConfig.cmake这个文件呢？在Windows操作系统的环境下，有两种方法：

将TesseractConfig.cmake这个文件所在的文件夹路径添加到系统环境变量的Path中。
在CMake的GUI界面中手动配置。

在正式介绍之前，先来看一看TesseractConfig.cmake中该怎么写：

# ===================================================================================
#  The Tesseract CMake configuration file
#
#  Usage from an external project:
# In your CMakeLists.txt, add these lines: # # FIND_PACKAGE(Tesseract REQUIRED) # TARGET_LINK_LIBRARIES(MY_TARGET_NAME ${Tesseract_LIBS}) # # This file will define the following variables: # - Tesseract_LIBS : The list of libraries to link against. # - Tesseract_LIB_DIR : The directory(es) where lib files are. Calling # LINK_DIRECTORIES with this path is NOT needed. # - Tesseract_INCLUDE_DIRS : The Tesseract include directories. # - Tesseract_VERSION : The version of this Tesseract build. Example: "2.4.0" # - Tesseract_VERSION_MAJOR : Major version part of Tesseract_VERSION. Example: "2" # - Tesseract_VERSION_MINOR : Minor version part of Tesseract_VERSION. Example: "4" # - Tesseract_VERSION_PATCH : Patch version part of Tesseract_VERSION. Example: "0" # # Advanced variables: # - Tesseract_CONFIG_PATH # # =================================================================================== set(Tesseract_VERSION_MAJOR 3) set(Tesseract_VERSION_MINOR 4) set(Tesseract_VERSION_PATCH 1) set(Tesseract_VERSION ${Tesseract_VERSION_MAJOR}.${Tesseract_VERSION_MINOR}.${Tesseract_VERSION_PATCH}) get_filename_component(Tesseract_CONFIG_PATH "${CMAKE_CURRENT_LIST_FILE}" PATH CACHE) set(Tesseract_LIB_DIR "${Tesseract_CONFIG_PATH}/lib") set(Tesseract_INCLUDE_DIRS "${Tesseract_CONFIG_PATH}/include") set(Tesseract_LIBS_DBG "liblept171d.lib" "libtesseract304d.lib") set(Tesseract_LIBS_OPT "liblept171.lib" "libtesseract304.lib") foreach(__tesslib ${Tesseract_LIBS_DBG}) list(APPEND Tesseract_LIBS debug "${Tesseract_LIB_DIR}/${__tesslib}") endforeach() foreach(__tesslib ${Tesseract_LIBS_OPT}) list(APPEND Tesseract_LIBS optimized "${Tesseract_LIB_DIR}/${__tesslib}") endforeach() set(Tesseract_FOUND TRUE CACHE BOOL "" FORCE)

好了，准备工作到此为之，接下来我们可以开始正式地构建示例程序Basic-example了。首先新建文件夹samples。然后在samples文件夹中新建文件夹Basic-example，新建文件CMakeLists.txt。

samples文件夹

这里的CMakeLists.txt可以很简单（当然也可以很复杂，但作为示例，理当简单一点）。

cmake_minimum_required(VERSION 3.0)
project(tesseract-api-examples) add_subdirectory(Basic-example)

第一句话表示，cmake的版本号最小为3.0（低于cmake 3.0则无法构建）。第二句话表示构建一个解决方案，名字叫做tesseract-api-examples。第三句表示添加子目录Basic-example。添加子目录的意思，其实是开始执行子目录中的CMakeLists.txt。所以，如果想通过add_subdirectory添加子目录，那就必须保证这个子目录中有CMakeLists.txt这个文件。

现在，我们进入Basic-example文件夹中，新建两个文件：Basic-example.cpp以及CMakeLists.txt

在Basic-example.cpp中，我们将官网上提供的代码粘上来：

#include 
#include  int main() { char *outText; tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI(); // Initialize tesseract-ocr with English, without specifying tessdata path if (api->Init(NULL, "eng")){ fprintf(stderr, "Could not initialize tesseract.\n"); exit(1); } // Open input image with leptonica library Pix *image = pixRead("D:\\open_source\\tesseract-3.04.01\\tesseract\\testing\\phototest.tif"); api->SetImage(image); // Get OCR result outText = api->GetUTF8Text(); printf("OCR output:\n%s", outText); // Destroy used object and release memory api->End(); delete [] outText; pixDestroy(&image); return 0; }

而在CMakeLists.txt中，可以用6句话来完成：

set(the_target "Basic-example")
find_package(Tesseract REQUIRED) aux_source_directory(. SRC_LIST) include_directories(${Tesseract_INCLUDE_DIRS}) add_executable(${the_target} ${SRC_LIST}) target_link_libraries(${the_target} ${Tesseract_LIBS})

其中，

第一行设定the_target名为"Basic-example"。
第二行寻找Tesseract第三方库。
第三行寻找当前文件夹下的所有.c文件和.cpp文件，并把文件名放在SRC_LIST中。
第四行添加第三方库目录Tesseract_INCLUDE_DIRS。
第五行设定项目Basic-example的生成目标是一个可执行文件。
第六行添加依赖的第三方库。

好了，一切准备就绪，就差构建了！打开CMake-GUI软件。

设定cmake的源路径和目标路径。如果对这两个路径不是很清楚的，还是请移步CMake简要教程。

点击config

出现一个选框，选择你所使用的C++编译器。我使用的是VS2012。点击Finish。

在一段时间的等待之后，出现如下的界面：

注意Tesseract_DIR那一行。我这边自动找到了。那是因为这个我已经把这个路径放置到环境变量的Path中了。你可以选择将你的路径放置到环境变量中，也可以在这里手动选择这个目录。如果是通过手动选择的方式，那么这个目录会保存在Cache中，下次配置也不需要再次选择了。

再次点击Configure。

红色条带消失，消息栏显示Configuring done。此时，点击Generate。

生成成功！接下来，就可以打开build文件夹下面的tesseract-api-examples.sln这一工程文件了。

将Basic-example设为启动项。生成，成功！

运行！啊哦！

唉，不好意思，太激动了，脑残了一把！我们现在还需要将Tesseract的bin文件夹放到环境变量的Path中，这样，程序才能找到dll文件。

现在可以开始调试程序了。

phototest.tif

OK。运行程序。

成功执行~

我们再回过头来看一看这个示例程序。看看它做了一些什么事。

#include 
#include  int main() { char *outText; tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI(); // Initialize tesseract-ocr with English, without specifying tessdata path if (api->Init(NULL, "eng")){ fprintf(stderr, "Could not initialize tesseract.\n"); exit(1); } // Open input image with leptonica library Pix *image = pixRead("D:\\open_source\\tesseract-3.04.01\\tesseract\\testing\\phototest.tif"); api->SetImage(image); // Get OCR result outText = api->GetUTF8Text(); printf("OCR output:\n%s", outText); // Destroy used object and release memory api->End(); delete [] outText; pixDestroy(&image); return 0; }

首先包含了两个头文件：

#include 
#include

这其实说明了，这个示例程序用到了两个库。一个是tesseract，一个是leptonica。tesseract用来做OCR。leptonica可以处理基本的图像处理的需求。

接下来，在main函数中，定义了一个对象：

tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();

其中，tesseract是命名空间。TessBaseAPI是一个类名。这个类的注释是这么写的：

/**
* Base class for all tesseract APIs.
* Specific classes can add ability to work on different inputs or produce
* different outputs.
* This class is mostly an interface layer on top of the Tesseract instance
* class to hide the data types so that users of this class don't have to
* include any other Tesseract headers.
*/

也就是说：

所有的tesseract的API都在这个类中。

所以，如果我们把这个类搞明白了，也就知道Tesseract的API的所有调用方法了。好事啊~这个类一会儿再回过来看。先把代码读完。

    // Initialize tesseract-ocr with English, without specifying tessdata path
    if (api->Init(NULL, "eng")){ fprintf(stderr, "Could not initialize tesseract.\n"); exit(1); }

来看一看Init的注释~

/**
   * Instances are now mostly thread-safe and totally independent,
   * but some global parameters remain. Basically it is safe to use multiple
   * TessBaseAPIs in different threads in parallel, UNLESS:
   * you use SetVariable on some of the Params in classify and textord.
   * If you do, then the effect will be to change it for all your instances.
   *
   * Start tesseract. Returns zero on success and -1 on failure.
   * NOTE that the only members that may be called before Init are those
   * listed above here in the class definition.
   *
   * The datapath must be the name of the parent directory of tessdata and
   * must end in / . Any name after the last / will be stripped.
   * The language is (usually) an ISO 639-3 string or NULL will default to eng.
   * It is entirely safe (and eventually will be efficient too) to call
   * Init multiple times on the same instance to change language, or just
   * to reset the classifier.
   * The language may be a string of the form [~][+[~]]* indicating
   * that multiple languages are to be loaded. Eg hin+eng will load Hindi and
   * English. Languages may specify internally that they want to be loaded
   * with one or more other languages, so the ~ sign is available to override
   * that. Eg if hin were set to load eng by default, then hin+~eng would force
   * loading only hin. The number of loaded languages is limited only by
   * memory, with the caveat that loading additional languages will impact
   * both speed and accuracy, as there is more work to do to decide on the
   * applicable language, and there is more chance of hallucinating incorrect
   * words.
   * WARNING: On changing languages, all Tesseract parameters are reset
   * back to their default values. (Which may vary between languages.)
   * If you have a rare need to set a Variable that controls
   * initialization for a second call to Init you should explicitly
   * call End() and then use SetVariable before Init. This is only a very
   * rare use case, since there are very few uses that require any parameters
   * to be set before Init.
   *
   * If set_only_non_debug_params is true, only params that do not contain
   * "debug" in the name will be set.
   */

看着这么长的英文估计还挺累，不如我来翻译一下：

实例大多数情况下是线程安全的，并且是完全独立的。但是仍然保留了一些全局参量。基本上在不同的线程中并行地使用多个TessBaseAPIs是安全的，除非：你使用了SetVariable改变了某些参数的值。如果你这么做了，那么你所有的实例的效果都会为之发生改变。

启动tesseract。如果成功返回0，如果失败返回-1。注意能在Init方法前面调用的成员函数是那些在类定义中列在Init之前的那些函数。

datapath必须为tessdata的父目录，并且必须以/终止。最后一个/后面所出现的字符将被全部删除。language参数通常是一个ISO639-3的字符串，如果是NULL将被默认设置为eng。在单个实例中，多次调用Init方法来改变语言或重置分类器是没有问题的，（并且会逐渐变地更快速）。

language参数可以写成[~][+[~]]*的形式，即表明可以加载多种语言。例如hin+eng会加载北印度语和英语。Languages可以在内部被设置为一种或多种语言，因此~符号可以用来覆盖。例如，如果hin被设置为默认加载eng，则hin+~eng会强制只加载hin。可以被加载的语言的数量仅仅由内存限制，但是加载多种语言会同时影响速度和准确率。因为这需要更多的工作来决定它是哪种语言，并且更有可能产生错误。

警告：一旦改变语言，所有的Tesseract参数被重置为默认值。（每种语言可能不一样。）

再接着看代码：

    // Open input image with leptonica library
    Pix *image = pixRead("D:\\open_source\\tesseract-3.04.01\\tesseract\\testing\\phototest.tif");

pixRead是Leptonica的函数，它读取一张图片，并将图片的结果保存在Pix结构体中。

    api->SetImage(image);

SetImage函数为Tesseract提供去识别的图片。

    // Get OCR result
    outText = api->GetUTF8Text();

GetUTF8Text函数识别图片中的文字，并返回char*数组。

    // Destroy used object and release memory
    api->End();
    delete [] outText;
    pixDestroy(&image);

最后一部分是释放和销毁。

关于End方法，代码中的注释是这么写的

  /**
   * Close down tesseract and free up all memory. End() is equivalent to
   * destructing and reconstructing your TessBaseAPI.
   * Once End() has been used, none of the other API functions may be used
   * other than Init and anything declared above it in the class definition.
   */
  void End();

最后释放数组和图像。合情合理，没有什么好说的。

如果需要完整的示例文件及CMakeLists.txt，可以点击此处下载。

转载于:https://www.cnblogs.com/Crysaty/p/6062267.html

架构验证的时间 (转) hyzhx 架构设计 soa 文档
架构设计的各种方法论是为把事情变得更简单易懂而准备的，它们帮我们梳理复杂应用的逻辑头绪，把我们不能一下子掌握的事情通过一种有条不紊的途径消化掉。可以说，把事情变得更简单是架构设计的远景和目标。但这种简单是有条件的，实用就是它的条件。所谓实用就是要满足各种各样外部环境并尽可能的提供更多的指标，这些指标包括可伸缩性、可维护性、学习曲线、稳定性等。所谓的尽可能就意味着需要有一个平衡点，我们需要通过各种努
HarmonyOS 开发实战 —— 模块化架构组件（使用系统路由表+注解+hvigor插件自动配置项目模块化） CTrup 鸿蒙开发 HarmonyOS 移动开发 harmonyos 架构 ui ArkUI 组件化插件化 hvigor
往期笔录记录：鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……@satis/oh-router简介@sati
HarmonyOS 开发实践——模块化架构组件（使用系统路由表+注解+hvigor插件自动配置项目模块化）我是你叶 HarmonyOS 鸿蒙开发移动开发 harmonyos 架构鸿蒙开发 ui Arkui 移动开发组件化
往期推文看点鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……@satis/oh-router简介@satis
【JVM-9】Java性能调优利器：jmap工具使用指南与应用案例 AllenBright #JVM jvm java 开发语言
在Java应用程序的性能调优和故障排查中，jmap（JavaMemoryMap）是一个不可或缺的工具。它可以帮助开发者分析Java堆内存的使用情况，生成堆转储文件（HeapDump），并查看内存中的对象分布。无论是内存泄漏、堆内存溢出，还是对象分布不均的问题，jmap都能提供关键的数据支持。本文将详细介绍jmap的使用方法，并结合实际案例展示其应用场景。1.什么是jmap？jmap是JDK自带的一
音视频开发——FFmpeg 实现MP4转FLV文件 C语言实现 Trump. yang 音视频开发音视频 ffmpeg c语言
文章目录转换步骤关键代码完整代码转换步骤初始化FFmpeg库打开输入文件找到输入文件的流信息打开输出文件并设置输出格式创建输出文件的流初始化解码器和编码器读取输入文件的帧并写入输出文件释放资源关键代码1初始化FFmpeg库：av_register_all();打开输入文件：if((ret=avformat_open_input(&input_format_ctx,input_filename,NU
python读取文件路径中有中文_转 python 读取中文文件名/中文路径 weixin_39845406
原博文2015-03-1322:22−python直接读取中文路径的文件时失败，可做如下处理：inpath='D:/work/yuanxx/在线导航/驾车导航/walk_log/20130619_172355.txt'uipath=unicode(ipath,"utf8")然后用"uipath"经...相关推荐2015-12-1421:45−前言：需要对某目录下的文件进行分类，目录是中文名字就会报
计算机基本操作（一） ——连接双显示器 Joyner2018 计算机综合连接双显示器显示器位置调整
本文是关于如何让一台电脑连接两个显示器，并且对于连接后的双显示器的各种后续操作的记录，不是教程。1.原材料两个显示器（支持VGA的输入）、一个主机（支持VGA和HDMI）、VGA线和HDMI线（或者HDMI转VGA线+VAG线）。如果没有独立显卡，则需要电脑主机的集成显卡上支持HDMI和VGA的输出接口如果有独立显卡，则需要独立显卡的输出上支持HDMI和VGA的输出接口2.接线电脑主机关机，显示器
数字化转型的三个阶段：信息化、数字化、数智化兴风键盘侠计算机行业知识大数据创业创新
数字化转型（DigitalTransformation）是当前企业和社会发展的核心驱动力。它不仅是技术层面的变革，更是一种系统性、战略性的转型，涵盖了业务流程、管理模式以及企业文化等多个维度。数字化转型通常可以划分为三个阶段：信息化、数字化和数智化。本文将对这三个阶段进行详细剖析，帮助您理解每个阶段的特征、目标及实施要点。第一阶段：信息化（Informatization）定义与目标信息化是数字化转
python str转bytes类型三希 python 开发语言
在Python中，将字符串（str）类型转换为字节（bytes）类型，通常可以使用以下几种方法：方法一：使用encode()方法这是最常用的方法，适用于任何类型的字符串，尤其是包含非ASCII字符的字符串。使用encode()方法时，需要指定编码方式，如utf-8、latin-1等。例如：pythonstring="Hello,World!"encoded_bytes=string.encode(
python之str与bytes互转 ancy_i_cv python python
#-*-coding:utf-8-*-bytes_object =b"example"#strobjectstr_object ="example"#方法（1）#str转bytesbytes(str_object,encoding="utf8")#bytes转strstr(bytes_object,encoding="utf-8")#方法（2）#str转bytesstr.encode(str_ob
PYTHON中字符串(str)类型和比特(bytes)类型转换齐柏林fly 艇 python
bytes主要是用于二进制的数据处理的数据类型，在网络编程中，由于服务器和浏览器只能识别bytes类型数据。所以就需要进行数据类型转换例如socket编程中的.send()和.recv()就需要用到str类型和bytes类型转换一、str转bytes:第一种：在str类型前加b，即b"str"第二种：在str后加.encode("utf-8")，即str.encode("utf-8")，编码方式默
Python中的十六进制字节转换为字符串时代在召唤吗 python 前端开发语言 Python
Python中的十六进制字节转换为字符串在Python编程中，有时我们需要将十六进制字节（hexbytes）转换为字符串。这种情况可能出现在网络通信、文件读取或加密解密等应用中。本文将介绍如何使用Python将十六进制字节转换为字符串，并提供相应的源代码示例。在Python中，可以使用binascii模块提供的函数来进行十六进制字节和字符串之间的转换。下面是一个示例代码，演示了如何将十六进制字节转
python str byte 转换 LI4836 Python 字符串 python
bytes转字符串方式一b=b'\xe9\x80\x86\xe7\x81\xab'string=str(b,'utf-8')print(string)#逆火bytes转字符串方式二b=b'\xe9\x80\x86\xe7\x81\xab'string=b.decode()#第一参数默认utf8，第二参数默认strictprint(string)#逆火bytes转字符串方式三b=b'\xe9\x80
idea大小写转换快捷键，及设置快捷转换格式小可乐-我一直在 intellij-idea java ide
idea给用户提供了大小写快速转换的快捷键shift+Alt+u,贴心的idea还给提供了7种转换方式，我一般只用a_bc转驼峰aBc本来挺好用的但每次要按快捷键5次才能达到我的效果，所以请看设置图：只勾选两个，保存后就只会在这两种格式之间互相转换了
小猿口算自动PK脚本小黄编程快乐屋人工智能 python
大家好，我是小黄。近期，众多大学生炸鱼小猿口算APP,把一众小学生都快虐哭了，小黄听闻后，也跃跃欲试。对此小黄也参考网上的资料写了一个自动Pk的脚步。首先大家需要安装一个pytorch环境过程中，如果小伙伴对此不熟悉的话可以参考网上的相关教程。我们需要用到Tesseract-OCR文本识别。他的原理就是先截图，之后框选出比较大小的两个数字所在的区域，使用Tesseract-OCR识别出来后进行判断
算法随笔_9:压缩字符串程序趣谈算法
上一篇:算法随笔_8:寻找重复数-CSDN博客题目描述如下:给你一个字符数组chars，请使用下述算法压缩：从一个空字符串s开始。对于chars中的每组连续重复字符：如果这一组长度为1，则将字符追加到s中。否则，需要向s追加字符，后跟这一组的长度。压缩后得到的字符串s不应该直接返回，需要转储到字符数组chars中。需要注意的是，如果组长度为10或10以上，则在chars数组中会被拆分为多个字符。请
TikTok专线流量：助力品牌全球化的利器 Loongproxy 大数据
在这个信息爆炸的时代，社交媒体已经成为了品牌传播的重要渠道，其中TikTok以其短视频的形式迅速占领了全球市场。TikTok专线流量，正是品牌在这一平台上实现突破的关键所在。想象一下，如果你的品牌能够在TikTok上获得大量的曝光，吸引到更多的潜在客户，这将是多么令人振奋的事情！然而，要实现这一目标，依靠传统的营销手段显然是不够的。借助专线流量，企业可以精准触达目标受众，提升品牌知名度，进而实现转
js utf8转jb2312 代码司江龙 jquery
functionUrlEncode(str){vari,c,ret="",strSpecial="!\"#$%&'()*+,/:;?@[\]^`{|}~%";for(i=0;i
MongoDB 客户端工具(图) IT古董 Mongodb mongodb 工具 couchdb 集群 php windows
转自:http://hi.baidu.com/shepherdnewage/blog/item/962368f05d1f427fdcc4747c.htmlhttp://www.javabloger.com/article/mongodb-gui-win-linux-mac.htmlNoSQL的运动不止，MongoDB作为其中的主力军发展迅猛，但是图形化工具少见，我在此做了一个简单的收集，如果将来有
LT8918 BT1120转mipi dsi/mipi csi；提供技术支持 Guo YongB7 MIPI TTL 龙讯经验分享音视频物联网嵌入式硬件
LT8918支持PatternMode和NormalMode两种工作模式，所谓的PatternMode就是LT8918内部生成Timing时序，等效于内部模拟RGB源；NormalMode则是采用外部的RGB输入。为了排除外部RGB输入的配置不匹配导致无法显示，一般建议先用PatternMode点亮再切换到外部RGB输入，FlagNormalMode=0时执行PatternMode配置，主循环配置
Modbus转Profinet网关：机器人内部系统的高效协议转换钡铼技术网关机器人
在现代工业自动化领域，机器人技术的应用越来越广泛，从汽车制造到电子装配，再到食品加工等行业，机器人的身影无处不在。为了确保机器人系统的运行，不同设备之间的数据交换必须快速、准确。在这个背景下，钡铼技术的Modbus转Profinet网关成为了解决机器人内部系统协议转换需求的理想方案。机器人内部系统的挑战机器人内部系统通常由多个组成部分构成，包括但不限于PLC（可编程逻辑控制器）、伺服驱动器、传感器
使用神经网络拟合6项参数 Andrew_Xzw 神经网络人工智能深度学习开发语言机器学习 python
使用神经网络拟合6项参数1.数据预处理1.1添加参数解析1.2数据预处理逻辑1.3数据归一化及划分1.4数据标签处理逻辑1.5数据转torch2.定义model2.1CNN_LSTM2.2Transformer3.定义train脚本3.1loss和optimizer3.2train3.3predict1.数据预处理1.1添加参数解析为了方便管理模型和训练等参数，统一用参数解析。defparse_a
我爱我的小自行车 tailwind-css
介绍自己心爱的小自行车。这辆小自行车是我过生日时爸爸送给我的礼物，它有着鲜艳的颜色和坚固的车身。每天放学后，我都会骑着它在小区里转几圈，感受风在耳边呼啸的感觉。骑自行车不仅可以锻炼身体，还能让我欣赏到沿途的风景。它是我童年的小伙伴，陪伴我度过了许多快乐的时光。
PDF转Word转换指南：避免乱码的实用方法你踩到我法袍了
本文还有配套的精品资源，点击获取简介：PDF转Word是教育、白领工作和文秘办公的常见需求。在转换过程中，可能会遇到文字乱码和排版错乱的问题。本文介绍有效进行PDF到Word转换的方法，包括使用专业工具、设置转换选项、手动复制粘贴、分页处理、后期校对以及确保字体兼容性等。掌握这些技巧可以提升工作效率，减少转换过程中的困扰。1.PDF转Word的需求背景数字化办公已经成为现代社会工作的重要组成部分，
试题转excel；word转excel；大风车excel(1.1更新) 流形填表 excel word
更新了大风车excel1.1版本主要优化在算法层面：1.0版本试题解析的成功率为95%，现在1.1版本已经优化到解析成功率为99%一、问题描述一名教师朋友，偶尔会需要整理一些高质量的题目到excel中以往都是手动复制搬运，几百道题几乎需要一个下午的时间关键这些事，枯燥无聊费眼睛，实在是看起来就很蠢的工作就想着做一个工具，可以自动处理这个工作，自动将word试题按照要求写入excel中，自动整理试题
试题转excel；试题整理；试卷转Excel，word试题转excel 流形填表 excel word
一、问题描述我父亲是一名教师，偶尔会需要整理一些高质量的题目到excel中以往都是手动复制搬运，几百道题几乎需要一个下午的时间关键这些事，枯燥无聊费眼睛，实在是看起来就很蠢的工作就想着做一个工具，可以自动处理这个工作，自动将word试题按照要求写入excel中，自动整理试题比如：图片中有550道选择题的文档，有很多不需要的信息，开头语，页眉页脚，还有广告、水印我也看了市面上一些处理方法大都是用正则
python实现pdf和word互转 cicif2006 python pdf 开发语言
首先，安装python-office包python3-mpipinstallpython-office-ihttps://pypi.tuna.tsinghua.edu.cn/simple第二步，撰写代码pdf转wordimportoffice#转单个文件office.pdf.pdf2docx(file_path=r'D:\税务\税务师\法律\【直播预习讲义】6月10日_涉税法律教材研读_第四章_行
java实现word转html（支持docx及doc文件） WAZYY0619 java word html word转html docx转html doc转html
privatefinalstaticStringtempPath="C:\\Users\\xxx\\Desktop\\Word2Html\\src\\test\\";//图片及相关文件保存的路径publicstaticvoidmain(Stringargv[]){try{JFileChooserfileChooser=newJFileChooser();fileChooser.setDialogT
Cortex-M3(转) oldbalck 嵌入式操作系统系统架构
原来一直在Cortex-A8上做相关算法的开发和移植，最近要在Cortex-M3上实现一小功能，所以要了解一下Cortex-M3架构，在网上看到这篇blog不错，特转载一下。http://blog.mcuol.com/User/share_119/Article/39534_1.htm首先，在学习Cortex-M3时，我们必须要知道必要的缩略语。整理如下：AMBA:先进单片机总线架构ADK:AMB
Go语言之路————func 一颗知足的心 golang 开发语言后端
Go语言之路————func前言1.最基本的方法定义2.方法中参数的传递3.方法中的返回值4.匿名方法5.闭包的概念6.defer关键词前言我是一名多年Java开发人员，因为工作需要现在要学习go语言，Go语言之路是一个系列，记录着我从0开始接触Go，到后面能正常完成工作上的业务开发的过程，如果你也是个小白或者转Go语言的，希望我这篇文章对你有所帮助。有关go其他基础的内容的文章大家可以查看我的主
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(

[转]Tesseract-OCR学习系列

转载地址：http://www.jianshu.com/p/a53c732d8da3

Tesseract-OCR学习系列（三）简例

Tesseract API Basic Example using CMake Configuration

你可能感兴趣的:([转]Tesseract-OCR学习系列)