2008nmj

Handbook of Document Image Processing and Recognition文档图像处理与识别手册前言&目录

编辑：David Doermann(马里兰大学)
Karl Tombre(洛林大学)

前言

In the beginning, there was only OCR. After some false starts, OCR became a competitive commercial enterprise in the 1950’s. A decade later there were more than 50 manufacturers in the US alone. With the advent of microprocessors and inexpensive optical scanners, the price of OCR dropped from tens and hundreds of thousands of dollars to that of a bottle of wine. Software displaced the racks of electronics. By 1985 anybody could program and test their ideas on a PC, and then write a paper about it (and perhaps even patent it).

最初，只有OCR。在经历了一些错误的开始之后，OCR在20世纪50年代成为了一家有竞争力的商业企业。10年后，仅在美国就有50多家制造商。随着微处理器和廉价的光学扫描仪的出现，光学字符识别的价格从几万和几十万美元降到了一瓶酒的价格。软件取代了电子设备的机架。到1985年，任何人都可以在个人电脑上编程和测试他们的想法，然后写一篇关于它的论文（甚至可能申请专利）。

We know, however, very little about current commercial methods or in-house experimental results. Competitive industries have scarce motivation to publish (and their patents may only be part of their legal arsenal). The dearth of industrial authors in our publications is painfully obvious. Herbert Schantz’s book, The History of OCR, was an exception: he traced the growth of REI, which was one of the major success stories of the 1960’s and 1970’s. He also told the story, widely mirrored in sundry wikis and treatises on OCR, of the previous fifty years’ attempts to mechanize reading. Among other manufacturers of the period, IBM may have stood alone in publishing detailed (though often delayed) information about its products.

然而，我们对目前的商业方法或内部实验结果知之甚少。竞争性行业很少有出版的动机（它们的专利可能只是其法律武器库的一部分）。我们的出版物中缺乏工业作者是显而易见的。赫伯特·桑茨的书《OCR的历史》是一个例外：他追溯了REI的成长，REI是60年代和70年代的主要成功案例之一。他还讲述了过去50年中各种各样的wiki和OCR论文中广泛反映的试图机械化阅读的故事。在这一时期的其他制造商中，IBM可能单独发布了有关其产品的详细信息（尽管常常被延迟）。

Of the 4000-8000 articles published since 1900 on character recognition (my estimate), at most a few hundred really bear on OCR (construed as machinery - now software - that converts visible language to a searchable digital format). The rest treat character recognition as a prototypical classification problem. It is, of course, researchers’ universal familiarity with at least some script that turned character recognition into the pre-eminent vehicle for demonstrating and illustrating new ideas in pattern recognition. Even though some of us cannot tell an azalea from a begonia, a sharp sign from a clef, a loop from a tented arch, an erythrocyte from a leukocyte, or an alluvium from an anticline, all of us know how to read.

在1900年以来出版的4000-8000篇关于字符识别（我估计）的文章中，最多有几百篇真正与OCR有关（被理解为将可视语言转换为可搜索数字格式的机器——现在是软件）。其余的将字符识别作为一个典型的分类问题。当然，正是由于研究人员对至少一些脚本的普遍熟悉，才使得字符识别成为展示和说明模式识别新思想的杰出工具。尽管我们中的一些人不能分辨杜鹃花和海棠，不能分辨裂缝的尖锐迹象，也不能分辨帐篷拱的环，不能分辨白细胞的红细胞，也不能分辨背斜的冲积层，但我们都知道如何阅读。

Until about 30 years ago, OCR meant recognizing mono-spaced OCR fonts and typewritten scripts one character at a time – eventually at the rate of several thousand characters per second. Word recognition followed for reading difficult-to-segment typeset matter. The value of language models more elaborate than letter n-gram frequencies and lexicons without word frequencies gradually became clear. Because more than half of the world population is polyglot, OCR too became multilingual (as Henry Baird predicted that it must). This triggered a movement to post all the cultural relics of the past on the Web. Much of the material awaiting conversion,ancient and modern, stretches the limits of human readability. Like humans, OCR must take full advantage of syntax, style, context, and semantics.

直到大约30年前，OCR还意味着一次只识别一个字符的单间距OCR字体和打字脚本，最终达到每秒几千个字符的速度。阅读困难的排版材料时采用的单词识别法。语言模型的价值比字母N-gram频率和没有词频率的词典更为精细。因为世界上一半以上的人口是多语种的，OCR也变成了多语种的（正如Henry Baird所预测的那样）。这引发了一场在网络上发布所有过去文物的运动。许多等待转换的材料，无论是古代还是现代，都超出了人类可读性的极限。与人类一样，OCR必须充分利用语法、样式、上下文和语义。

Although many academic researchers are aware that OCR is much more than classification, they have yet to develop a viable, broad-range, end-to-end OCR system (but they may be getting close). A complete OCR system, with language and script recognition, colored print capability, column and line layout analysis, accurate character/word, numeric, symbol and punctuation recognition, language models, document-wide consistency, tuneability and adaptability, graphics subsystems, effectively embedded interactive error correction, and multiple output formats, is far more than the sum of its parts. Furthermore, specialized systems - for postal address reading, check reading, litigation, and bureaucratic forms processing - also require high throughput and different error-reject trade-offs. Real OCR simply isn’t an appropriate PhD dissertation project.

尽管许多学术研究人员意识到OCR不仅仅是分类，他们还没有开发出一个可行的、范围广泛的、端到端的OCR系统（但他们可能正在接近）。一个完整的OCR系统，具有语言和脚本识别、彩色打印能力、列和行布局分析、精确的字符/词、数字、符号和标点符号识别、语言模型、文档范围一致性、可调性和适应性、图形子系统、有效嵌入的交互纠错和多重输出格式，远远超过其各部分的总和。此外，专门的系统——邮政地址读取、支票读取、诉讼和官僚表格处理——也需要高吞吐量和不同的错误拒绝权衡。真正的OCR根本不是一个合适的博士论文项目。

I never know whether to call hand print recognition and handwriting recognition “OCR.” but abhor intelligent as a qualifier for the latest wrinkle. No matter: they are here to stay until tracing glyphs with a stylus goes the way of the quill. Both human and machine legibility of manuscripts depend significantly on the motivation of the writer: a hand-printed income tax return requesting a refund is likely to be more legible than one reporting an underpayment. Immediate feedback, the main advantage of on-line recognition, is a powerful form of motivation. Humans still learn better than machines.

我不知道是否要将手写识别和手写识别称为“OCR”，但我讨厌智能作为最新皱纹的限定词。不管怎样：他们会一直呆在这里，直到用触控笔描绘出的字形沿着羽毛笔的方向移动。手稿的人和机器可读性在很大程度上取决于作者的动机：要求退款的手印所得税申报表可能比少付的更容易阅读。即时反馈是在线识别的主要优势，是一种强有力的激励形式。人类仍然比机器学习得更好。

Document Image Analysis (DIA) is a superset of OCR, but many of its other popular subfields require OCR. Almost all line drawings contain text. An E-sized telephone company drawing, for instance, has about 3000 words and numbers (including revision notices). Music scores contain numerals and instructions like pianissimo. A map without place names and elevations would have limited use. Mathematical expressions abound in digits and alphabetic fragments like log, limit, tan or argmin. Good lettering used to be a prime job qualification for the draftsmen who drew the legacy drawings that we are now converting to CAD. Unfortunately, commercial OCR systems, tuned to paragraph-length segments of text, do poorly on the alphanumeric fragments typical of such applications. When Open Source OCR matures, it will provide a fine opportunity for customization to specialized applications that have not yet attracted heavy-weight developers. In the meantime, the conversion of documents containing a mix of text and line art has given rise to distinct sub-disciplines with their own conference sessions and workshops that target graphics techniques like vectorization and complex symbol configurations.

文档图像分析（DIA）是OCR的一个超集，但它的许多其他流行的子字段都需要OCR。几乎所有的线条图都包含文本。例如，一个电子电话公司的图纸上有大约3000个字和数字（包括修订通知）。乐谱包含数字和指令，如pianissimo。一张没有地名和海拔的地图将有有限的用途。数学表达式中有大量的数字和字母片段，如log、limit、tan或argmin。良好的字体曾经是绘图员的主要工作资格，他们绘制了我们现在正在转换为CAD的传统图纸。不幸的是，商业OCR系统，调整到文本的段落长度段，在这类应用的典型字母数字片段上做得很差。当开源OCR成熟时，它将提供一个很好的机会来定制那些尚未吸引大量开发人员的专门应用程序。同时，包含文本和线条艺术混合的文档的转换产生了不同的子学科，它们有自己的会议和研讨会，以矢量化和复杂符号配置等图形技术为目标。

Another subfield of DIA investigates what to do with automatically or manually transcribed books, technical journals, magazines and newspapers. Although Information Retrieval (IR) is not generally considered part of DIA or vice-versa, the overlap between them includes “logical” document segmentation, extraction of tables of content, linking figures and illustrations to textual references, and word spotting. A recurring topic is assessing the effect of OCR errors on downstream applications. One factor that keeps the two disciplines apart is that IR experiments (e.g., TREC) typically involve orders of magnitude more documents than DIA experiments because the number of characters in any collection is far smaller than the number of pixels.

DIA的另一个子领域研究如何处理自动或手动抄写的书籍、技术期刊、杂志和报纸。尽管信息检索（IR）通常不被视为DIA的一部分，反之亦然，但它们之间的重叠包括“逻辑”文档分割、内容表提取、将图形和插图链接到文本引用以及单词识别。一个反复出现的主题是评估OCR错误对下游应用程序的影响。使这两个学科分开的一个因素是，红外实验（例如，TREC）通常比DIA实验涉及数量级的文档，因为任何集合中的字符数都远远小于像素数。

Computer vision used to be easily distinguished from the image processing aspects of DIA by its emphasis on illumination and camera position. The border is blurring because even cellphone cameras now offer sufficient spatial resolution for document image capture at several hundred dpi as well as for legible text in large scene images. The correction of the contrast and geometric distortions in the resulting images goes well beyond what is required for scanned documents

过去，计算机视觉以其对光照和摄像机位置的重视，很容易与DIA的图像处理方面区别开来。边界变得模糊，因为即使是手机摄像头现在也能提供足够的空间分辨率，以几百dpi的速度拍摄文档图像，以及在大型场景图像中显示清晰的文本。结果图像中对比度和几何畸变的校正远远超出了扫描文档的要求

This collection suggests that we are still far from a unified theory of DIA or even OCR. The Handbook is all the more useful because we have no choice except to rely on heuristics or algorithms based on questionable assumptions. The most useful methods available to us were all invented rather than derived from prime principles. When the time is ripe, many alternative methods are invented to fill the same need. They all remain entrenched candidates for “best practice”. This Handbook presents them fairly, but generally avoids picking winners and losers.

这个集合表明，我们还远远没有一个统一的理论，迪亚，甚至OCR。这本手册更有用，因为我们别无选择，只能依靠启发式或基于可疑假设的算法。我们所能得到的最有用的方法都是发明出来的，而不是从基本原理中衍生出来的。当时机成熟时，许多替代方法被发明来满足同样的需求。他们都是“最佳实践”的坚定候选人。这本手册公正地介绍了他们，但通常避免挑选赢家和输家。

“Noise” appears to be the principal obstacle to better results. This is all the more irritating because many types of noise (e.g. skew, bleed-through, underscore) barely slow down human readers. We have not yet succeeded in characterizing and quantifying signal and noise to the extent that communications science has. Although OCR and DIA are prime examples of information transfer, informationtheoretic concepts are seldom invoked. Are we moving in the right direction by accumulating empirical midstream comparisons – often on synthetic data – from contests organized by individual research groups in conjunction with our conferences?

“噪音”似乎是取得更好结果的主要障碍。这更让人恼火，因为许多类型的噪音（如歪斜、出血、下划线）几乎不能减慢人类读者的阅读速度。我们还没有像通信科学那样成功地描述和量化信号和噪声。虽然OCR和DIA是信息传递的主要例子，但很少引用信息论的概念。我们是否正在朝着正确的方向前进，通过积累经验中游比较——通常是综合数据——从各个研究小组与我们的会议一起组织的竞赛中得出？

Be that as it may, as one is getting increasingly forgetful it is reassuring to have most of the elusive information about one’s favorite topics at arm’s reach in a fat tome like this one. Much as on-line resources have improved over the past decade, I like to turn down the corner of the page and scribble a note in the margin. Younger folks, who prefer search-directed saccades to an old-fashioned linear presentation, may want the on-line version.

尽管如此，当一个人变得越来越健忘的时候，在这样一本厚厚的书中，把自己最喜欢的话题的大部分难以捉摸的信息放在手边是令人放心的。虽然在线资源在过去的十年里有了很大的改善，但我还是喜欢把页面的角落调低，在页边空白处潦草地写一条注释。比起老式的线性演示，年轻人更喜欢搜索导向的扫视，他们可能想要在线版本。

David Doermann and Karl Tombre were exceptionally well qualified to plan, select, solicit, and edit this compendium. Their contributions to DIA cover a broad swath and, as far as I know, they have never let the song of the sirens divert them from the muddy and winding channels of DIA. Their technical contributions are well referenced by the chapter authors and their voice is heard at the beginning of each section.

大卫·多尔曼和卡尔·汤姆布雷非常有资格策划、选择、征集和编辑这本简编。据我所知，他们对迪亚的贡献是巨大的，他们从未让警笛的歌声把他们从迪亚泥泞蜿蜒的河道中引开。他们的技术贡献被章节作者很好地引用，他们的声音在每个章节的开头都能听到。

Dave is the co-founding-editor of IJDAR, which became our flagship journal when PAMI veered towards computer vision and machine learning. Along with the venerable PR and the high-speed, high-volume PRL, IJDAR has served us well with a mixture of special issues, surveys, experimental reports, and new theories. Even earlier, with the encouragement of Azriel Rosenfeld, Dave organized and directed the Language and Media Processing Laboratory, which has become a major resource of DIA data sets, code, bibliographies, and expertise.

戴夫是IJDAR的联合创始编辑，当PAMI转向计算机视觉和机器学习时，IJDAR成为我们的旗舰期刊。伴随着古老的公共关系和高速、大容量的公共关系，IJDAR为我们提供了一系列的专题、调查、实验报告和新理论。更早些时候，在Azriel Rosenfeld的鼓励下，Dave组织并指导了语言和媒体处理实验室，该实验室已成为DIA数据集、代码、书目和专业知识的主要资源。

Karl, another IJDAR co-founder, put Nancy on the map as one of the premier global centers of DIA research and development. Beginning with a sustained drive to automate the conversion of legacy drawings to CAD formats (drawings for a bridge or a sewer line may have a lifetime of over a hundred years, and the plans for the still-flying Boeing 747 were drawn by hand), Karl brought together and expanded the horizons of University and INRIA researchers to form a critical mass of DIA.

另一位IJDAR联合创始人卡尔（Karl）将南希列为DIA研究与开发的主要全球中心之一。从持续推动将传统图纸自动转换为CAD格式开始（桥梁或下水道的图纸可能有超过100年的使用寿命，而仍在飞行的波音747的计划是手工绘制的），卡尔把大学和印度研究院的研究人员聚集在一起，拓展了他们的视野，形成了一个DIA的临界质量。

Dave and Karl have also done more than their share to bring our research community together, find common terminology and data, create benchmarks, and advance the state of the art. These big patient men have long been a familiar sight at our conferences, always ready to resolve a conundrum, provide a missing piece of information, fill in for an absentee session chair or speaker, or introduce folks who should know each other.

戴夫和卡尔也做了更多的工作，将我们的研究团体聚集在一起，找到共同的术语和数据，创建基准，并提高技术水平。在我们的会议上，这些有耐心的大人物一直是我们熟悉的景象，他们总是准备解决一个难题，提供缺失的信息，填补缺席会议的主席或发言人，或介绍应该相互认识的人。

The DIA community has every reason to be grateful to the editors and authors of this timely and comprehensive collection. Enjoy, and work hard to make a contribution to the next edition!

DIA社区有充分的理由感谢编辑和作者及时和全面的收集。好好享受，努力为下一版做贡献！

Part A Introduction, Background, Fundamentals .................... 1
1 A Brief History of Documents and Writing Systems ................... 3

2 Document Creation, Image Acquisition and Document Quality...... 11

3 The Evolution of Document Image Analysis ............................ 63

4 Imaging Techniques in Document Analysis Processes ................. 73

Part B Page Analysis........................................................ 133
5 Page Segmentation Techniques in Document Analysis ................ 135

6 Analysis of the Logical Layout of Documents........................... 177

7 Page Similarity and Classification........................................ 223

Part C Text Recognition .................................................... 255
8 Text Segmentation for Document Recognition.......................... 257

9 Language, Script, and Font Recognition ................................ 291

10 Machine-Printed Character Recognition................................ 331

11 Handprinted Character and Word Recognition ........................ 359

12 Continuous Handwritten Script Recognition ........................... 391

13 Middle Eastern Character Recognition ................................. 427

14 Asian Character Recognition ............................................. 459

Volume 2
Part D Processing of Non-textual Information ........................ 487
15 Graphics Recognition Techniques........................................ 489

16 An Overview of Symbol Recognition .................................... 523

17 Analysis and Interpretation of Graphical Documents ................. 553

18 Logo and Trademark Recognition ....................................... 591

19 Recognition of Tables and Forms ........................................ 647

20 Processing Mathematical Notation ....................................... 679

Part E Applications .......................................................... 703
21 Document Analysis in Postal Applications and Check
Processing ................................................................... 705

22 Analysis and Recognition of Music Scores .............................. 749

23 Analysis of Documents Born Digital ..................................... 775

24 Image Based Retrieval and Keyword Spotting in Documents ........ 805

25 Text Localization and Recognition in Images and Video .............. 843

Part F Analysis of Online Data............................................ 885
26 Online Handwriting Recognition......................................... 887

27 Online Signature Verification ............................................. 917

28 Sketching Interfaces ....................................................... 949

Part G Evaluation and Benchmarking .................................. 981
29 Datasets and Annotations for Document Analysis
and Recognition ............................................................ 983

30 Tools and Metrics for Document Analysis Systems Evaluation ....... 1011

Index......................................................................... 1037

ABP VNext + GitHub Actions：CI/CD 全流程自动化 Kookoos Abp vNext .net github ci/cd 自动化 ABP vNext
ABPVNext+GitHubActions：CI/CD全流程自动化目录ABPVNext+GitHubActions：CI/CD全流程自动化TL;DR全局流程概览1️⃣准备工作与项目结构1.1️工具链与Secrets1.2项目目录示例2️⃣Build&Test（并行编译与单测）子流程图3️⃣️StaticAnalysis（SonarCloud&CodeQL）子流程图4️⃣Package&Publi
现代前端开发流程：CI/CD与自动化部署实战天天进步2015 前端开发 ci/cd 自动化运维
目录引言现代前端开发面临的挑战CI/CD基础概念前端CI/CD流程设计实战案例：构建前端CI/CD管道自动化部署策略监控与回滚机制最佳实践与优化建议总结引言随着前端技术的飞速发展，现代Web应用变得越来越复杂。前端项目不再只是简单的HTML、CSS和JavaScript文件的集合，而是演变成了包含众多依赖项、构建工具和框架的复杂系统。在这种情况下，持续集成和持续部署（CI/CD）流程成为了确保前端
【重学MySQL】基础架构
笔记来自极客时间的MySQL45讲以及小林Coding目录整体架构Server层连接器使用长连接的局限性？如何解决长连接出现的问题查询缓存解析器预处理器优化器执行器小问题如果表T中没有字段k，而你执行了这个语句select*fromTwherek=1,那肯定是会报“不存在这个列”的错误：“Unknowncolumn‘k’in‘whereclause’”。你觉得这个错误是在我们上面提到的哪个阶段报出
C# 线程--Thread类
目录什么是线程？Thread类的定义创建和启动线程使用ThreadStart委托使用ParameterizedThreadStart委托Lambda简写使用线程池（ThreadPool）使用线程池的优点使用ThreadPool的一般步骤常用方法Start()Join()Sleep(intmillisecondsTimeout)Abort()IsAliveManagedThreadIdSetApar
Python 代码生成 LaTeX 数学公式：latexify 示例 examples
文中内容仅限技术学习与代码实践参考，市场存在不确定性，技术分析需谨慎验证，不构成任何投资建议。latexify示例本notebook提供了多个使用latexify的示例。更多细节请参阅官方文档。如有任何疑问，请在issuetracker中提出。安装latexify#运行下方示例前请先重启运行时。%pipinstalllatexify-pyCollectinglatexify-pyDownloadi
Rsync自动协商同步数据陈大为_d962
Rsync命令使用#rsync-av[源目录][目标目录]//归档方式进行全部文件复制#rsync-aruv[源目录][目标目录]//归档方式进行增量复制#rsync-aruv--delete[源目录][目标目录]//增量复制并会删除源目录中被删除的目录或文件，用于切换前的最后一次增量同步使用nohup可以将进程放置在后台并记录日志:nohup>/tmp/rsync-xxxx-xx-xx.logr
【C++强基篇】学习C++就看这篇---＞STL之vector使用及实现 HABuo C++入门到精通 c++c语言开发语言后端学习
主页：HABUO主页：HABUOC++入门到精通专栏如果再也不能见到你，祝你早安，午安，晚安目录一、vector的介绍二、vector的使用✨2.1vector的定义✨2.2vectoriterator（迭代器）的使用✨2.3vector空间增长问题✨2.4vector修改✨2.5迭代器失效问题三、vector的简单模拟实现四、总结前言：上篇博客我们了解了STL中的string类，本篇博客我们继续
【SpringCloud微服务实战09】Elasticsearch 搜索引擎李维山 Java elasticsearch spring cloud 搜索引擎
一、Elasticsearch安装1、Docker安装ES#创建一个网络dockernetworkcreatees-net#拉取ES镜像（这里使用7.17.18版本）dockerpullelasticsearch:7.17.18#新建一个目录存放es数据mkdirescdes#docker运行单机启动esdockerrun-d\--namees\-e"ES_JAVA_OPTS=-Xms512m-X
基于R、Python的Copula变量相关性分析及AI大语言模型应用阁楼里的小花儿 R语言 Python Copula变量相关性分析 AI大语言模型结构方程模型贝叶斯网络统计学
前言：在工程、水文和金融等各学科的研究中，总是会遇到很多变量，研究这些相互纠缠的变量间的相关关系是各学科的研究的重点。虽然皮尔逊相关、秩相关等相关系数提供了变量间相关关系的粗略结果，但这些系数都存在着无法克服的困难。例如，皮尔逊相关系数只能反映变量间的线性相关，而秩相关则更多的适用于等级变量。大多数情况下变量间的相关性非常复杂，而且随着变量取值的变化而变化，而这些相关系数都是全局性的，因此无法提供
C语言-动态内存管理第三世界的诗人动态内存管理 c语言 c语言
目录C语言-动态内存管理相关库函数内存耗尽野指针野指针产生原因：动态内存分配应用经验C语言-动态内存管理动态内存管理，就是程序执行的过程中，由程序编写者动态的申请和回收内存空间。C语言内存的动态分配一般通过库函数实现，主要有malloc和free函数。位置：在堆上。连接：https://blog.csdn.net/USA_AM_1966/article/details/89509589相关库函数1
基于单片机的住宅防盗报警系统的设计 QQ2193276455 单片机单片机嵌入式硬件
**单片机设计介绍，基于单片机的住宅防盗报警系统的设计文章目录一概要二、功能设计设计思路三、软件设计原理图五、程序六、文章目录一概要基于单片机的住宅防盗报警系统的设计概要主要涵盖硬件设计、软件设计、工作原理以及功能实现等方面。以下是对这一设计的简要概述：一、系统概述基于单片机的住宅防盗报警系统采用单片机作为核心控制器，结合传感器技术、通信技术及报警装置，实现对住宅环境的全面监控和安全防护。系统
基于STM32的ONENET物联网远程智能家居控制系统 QQ2193276455 单片机单片机嵌入式硬件
**单片机设计介绍，基于STM32的ONENET物联网远程智能家居控制系统文章目录一概要二、功能设计设计思路三、软件设计原理图五、程序六、文章目录一概要基于STM32的ONENET物联网远程智能家居控制系统是一个结合了STM32微控制器和中国移动OneNET物联网平台的智能家居解决方案。以下是该系统的概要：系统核心：该系统以STM32系列微控制器（如STM32F103C8T6）作为核心控制单元
【Redis 系列】redis 学习九，Redis 的发布和订阅是咋玩的阿兵云原生
Redis发布订阅Redis发布订阅（pub/sub）是一种消息通信模式发送者发送消息pub接受者订阅消息sub例如微信，微博这样的关注系统Redis的客户端可以订阅任意数量的频道，不受限制来看看图示消息发布者消息订阅者频道image这里的消息发布者，和消息订阅者都是redis客户端，订阅者订阅某个频道，发布者在该频道中发布相关信息，例如文章，例如沸点，等等，消息订阅者就能实时收到刚才发布者发送的
Python练习（6）Python面向对象编程三大特性：封装、继承与多态的15道实战练习题（含答案与深度解析）一个天蝎座白勺程序猿 python 开发语言
目录引言封装篇（5题）练习1：银行账户安全封装练习2：属性装饰器控制练习3：私有方法调用练习4：受保护属性继承练习5：类属性封装继承篇（5题）练习6：单继承与方法重写练习7：多继承与MRO练习8：抽象基类实现练习9：Mixin模式练习10：super()函数应用多态篇（5题）练习11：接口多态练习12：鸭子类型练习13：多态与异常处理练习14：多态与类型检查练习15：多态与装饰器总结Python爬
观唐习律107｜暮雨千家薜荔村，谭用之是宋人还是唐人老街味道
前言谭用之，字藏用，生卒年里贯均未详，游踪遍关中、河洛、潇湘等地。。他生活的时代大约在五代及北宋初期。明朝胡震亨说谭用之是宋人，清代黄生说他是晚唐人。胡元瑞谓谭为宋人，《鼓吹》误收。予谓此君果系宋人，宋朝诸公诗话曾未及之，且声调自属晚唐，与宋诗气味有别，其为唐人无疑也。《唐诗摘钞》一、赠索处士不将桂子种诸天，长得寻君水石边。玄豹夜寒和雾隐，骊龙春暖抱珠眠。山中宰相陶弘景，洞里真人葛稚川。一度相思一
基于STM32无线WIFI智能家居实时控制系统设计
**单片机设计介绍，基于STM32无线WIFI智能家居实时控制系统设计文章目录一概要二、功能设计设计思路三、软件设计原理图五、程序六、文章目录一概要基于STM32无线WiFi智能家居实时控制系统设计概要如下：一、项目概述本项目旨在设计一个基于STM32微控制器和无线WiFi技术的智能家居实时控制系统。该系统能够连接并控制各种智能家居设备，如灯光、窗帘、安防监控设备等，同时支持远程控制、环境监测
《[系统底层攻坚] 张冬〈大话存储终极版〉精读计划启动——存储架构原理深度拆解之旅》-系统性学习笔记（适合小白与IT工作人员）谢郎Kobe 大活存储学习架构云计算硬件架构大数据
致所有存储技术探索者笔者近期将系统攻克存储领域经典巨作——张冬老师编著的《大话存储终极版》。这部近千页的存储系统圣经，以庖丁解牛的方式剖析了：存储硬件底层架构、分布式存储核心算法、超融合系统设计哲学等等。喜欢研究数据存储或者工作应用到存储的小伙伴，可以学习这本书。如果想利用碎片时间学习，也可以持续关注一下笔者不定期的章节解析。现在本人将此书的目录结构整理如下，未来笔者将按照顺序不定期更新【学习笔记
ICT模拟零件测试方法--测量参数详解可可南木 ICT（In Circuit Tester）在线测试测试工具开发语言 pcb工艺
ICT模拟零件测试方法–测量参数详解文章目录ICT模拟零件测试方法--测量参数详解测量参数调整幅值ASRU范围ASRU加速电压合规电容补偿检测器等待额外数字增强频率电流变化电流合规直流电流直流偏移反向并联电容合格/不合格并联模型SenseASenseBSenseL串联模型等待宽带测量参数在调试的时候，选择不同的参数可以达到我们对稳定性的要求，选择不同的参数是好是坏，我们可以通过CPK的高低进行验证
爬楼梯——动态规划不吃鱼的猫算法动态规划算法 leetcode
文章目录题目一解法一：动态规划题目二解法：题目一假设你正在爬楼梯。需要n阶你才能到达楼顶。每次你可以爬1或2个台阶。你有多少种不同的方法可以爬到楼顶呢？解法一：动态规划将dp[i]数组定义为到达第i阶楼梯有多少种方法，由每次可以爬1或2阶可以得到递推公式：dp[i]=dp[i−1]+dp[i−2]dp[i]=dp[i-1]+dp[i-2]dp[i]=dp[i−1]+dp[i−2]其中，dp[i-1
Python100个库分享第36个—python-pptx(办公篇) 小庄-Python办公 Python100个库分享 python 开发语言 python办公 python-pptx python读取ppt python操作ppt
目录专栏导读库简介主要特点️安装方法基础使用1.导入库和创建演示文稿2.基本幻灯片操作3.常用布局类型文本和格式设置1.文本框和段落2.文本对齐和样式表格操作1.创建基本表格2.高级表格格式️图片和形状1.插入图片2.添加形状图表功能1.创建柱状图2.创建饼图办公实用功能1.创建项目汇报PPT2.创建培训课件3.创建产品介绍PPT高级功能1.母版和主题2.动画和过渡效果3.批量生成幻灯片性能优化和
【Python办公】Python如何批量提取word文档中的表格小庄-Python办公 Python笔记 python word 提取word表格 python读取word文档 word文档 python办公
目录专栏导读环境准备核心库介绍单个Word文档表格提取基础提取方法转换为DataFrame批量处理多个Word文档批量提取并保存到Excel高级功能表格数据清洗按条件筛选表格表格格式检测完整示例：智能批量提取注意事项总结专栏导读欢迎来到Python办公自动化专栏—Python处理办公问题，解放您的双手️‍博客主页：请点击——>一晌小贪欢的博客主页求关注该系列文章专栏：请点击——>Python办公自
Java数据结构与算法(爬楼梯动态规划) 盘门 java数据结构与算法实战 java 动态规划开发语言
前言爬楼梯就是一个斐波那契数列问题，采用动态规划是最合适不过的。实现原理初始化:dp[0]=1;dp[1]=2;转移方程：dp[i]=dp[i-1]+d[i-2];边界条件:无具体代码实现classSolution{publicintclimbStairs(intn){if(n==1){return1;}int[]dp=newint[n];dp[0]=1;dp[1]=2;for(inti=2;i<
生成式人工智能实战 | 像素卷积神经网络（PixelCNN）盼小辉丶生成式人工智能实战150讲深度学习生成模型 aigc
生成式人工智能实战|像素卷积神经网络0.前言1.PixelCNN工作原理1.1掩码卷积层1.2残差块2.PixelCNN分析3.使用混合分布改进PixelCNN3.1模型构建3.2模型训练0.前言像素卷积神经网络(PixelConvolutionalNeuralNetwork,PixelCNN)是于2016年提出的一种图像生成模型，其根据前面的像素预测下一个像素的概率来逐像素地生成图像，模型可以通
TensorFlow深度学习实战——DCGAN详解与实现盼小辉丶深度学习 tensorflow 生成对抗网络
TensorFlow深度学习实战——DCGAN详解与实现0.前言1.DCGAN架构2.构建DCGAN生成手写数字图像2.1生成器与判别器架构2.2构建DCGAN相关链接0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetwork,DCGAN)是一种基于生成对抗网络(GenerativeAdversarialNetwork,GAN)的深度学
Python爬虫【二十四章】分布式爬虫架构实战：Scrapy-Redis亿级数据抓取方案设计程序员_CLUB Python入门到进阶 python 爬虫分布式
目录一、背景：单机爬虫的五大瓶颈二、Scrapy-Redis架构深度解析1.架构拓扑图2.核心组件对比三、环境搭建与核心配置1.基础环境部署2.Scrapy项目配置四、分布式爬虫核心实现1.改造原生Spider2.布隆过滤器集成五、五大性能优化策略1.动态优先级调整2.智能限速策略3.连接池优化4.数据分片存储5.心跳监控系统六、实战：新闻聚合平台数据抓取1.集群架构2.性能指标七、总结1.核心收
3C++类 LicHermione c++c++开发语言
目录1.空类2.构造函数3析构函数4.拷贝构造5.赋值构造6.取地址函数重载7.初始化列表8.隐含的this指针第一空类空类是没有任何成员属性的类空类对象在内存中仍然占据至少1字节空间，以确保不同对象地址不同（否则两个对象地址可能一样，无法区分）。C++类的计算大小和C语言的结构体是一样的，不需要计算C++类的成员方法。下面两种叫法是一样的C++类的变量和函数C++类的成员属性和成员方法C++类只
Python SSTI漏洞原理与基础利用以及Fenjing的使用教程 cba尼里托圣 python 网络 web安全
文章目录一、Python类与对象模型基础二、魔术方法的作用与利用价值1.__class__魔术方法2.__bases__与__mro__魔术方法3.__subclasses__()魔术方法4.__init__魔术方法5.__globals__魔术方法三、魔术方法链的构建与利用1.漏洞验证2.获取类对象3.定位到object基类4.遍历object的子类5.定位危险类6.获取全局变量空间7.执行命令
分布式爬虫架构：Scrapy-Redis+Redis集群实现百万级数据采集傻啦嘿哟分布式爬虫架构
目录当单机爬虫遇到百万数据量架构设计核心原理分布式任务调度弹性去重机制Redis集群部署实践集群规模计算高可用配置Scrapy项目改造分布式爬虫编写百万级数据优化策略流量控制机制动态IP代理数据存储优化实战案例分析监控与维护集群健康检查日志分析架构演进方向当单机爬虫遇到百万数据量想象你正在搭建一个电商价格监控系统，需要每天抓取十万条商品数据。使用传统Scrapy框架时，单台服务器每天最多只能处理3
《绝代风华》张阳宋倩（都市小说）&完整目录-全文免费阅读小说推书
《绝代风华》张阳宋倩（都市小说）&完整目录-全文免费阅读主角：张阳宋倩简介：我叫张阳，这段时间跟着女朋友到她家小住，顺便见见叔叔阿姨。关注微信公众号【叶子书楼】去回个书號【25】，即可阅读【绝代风华】小说全文！我叫张阳，这段时间跟着女朋友到她家小住，顺便见见叔叔阿姨。第一次见到阿姨宋倩，她那狐媚的眼神，风情万种的飘了我一眼，我的魂儿就被她勾走了。我知道我跟宋倩是不可能的，但越是得不到，我的心就像是
JS补充18-dom中的查常婧帅
查查看元素节点document代表整个文档document.getElementById()元素id在ie8以下的浏览器，不区分id大小写，而且也返回匹配name属性的元素。document.getElementsByTagName()标签名。document.getElementsByName()需要注意只有部分标签name可生效(表单，表单元素，img，iframe)document.getE
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要

Handbook of Document Image Processing and Recognition文档图像处理与识别手册 前言&目录

你可能感兴趣的:(Handbook of Document Image Processing and Recognition文档图像处理与识别手册 前言&目录)

Handbook of Document Image Processing and Recognition文档图像处理与识别手册前言&目录

你可能感兴趣的:(Handbook of Document Image Processing and Recognition文档图像处理与识别手册前言&目录)