少林达摩祖师

天然场景文本检测识别技术综述

这篇文章主要向大家介绍天然场景文本检测识别技术综述,主要内容包括基础应用、实用技巧、原理机制等方面，希望对大家有所帮助。

标签：html前端gitgithub算法网络框架机器学习ide函数

本文及其它机器学习、深度学习算法的全面系统讲解能够阅读《机器学习与应用》，清华大学出版社，雷明著，由SIGAI公众号做者倾力打造，自2019年1月出版以来已重印3次。html

书的购买连接
书的勘误，优化，源代码资源

番外青蛇: 姐, 图像文本检测和识别领域如今的研究热点是什么？前端

白蛇: 白纸黑字的扫描文档识别技术已经很成熟，而天然场景图像文本识别的效果还不理想。倾斜字、艺术字、变形字、模糊字、形似字、残缺字、光影遮蔽、多语言混合文本等应用落地面临的技术难题还没被完全解决。git

青蛇: 文本检测模型CTPN中为何选用VGG16做基础网络?github

白蛇: CTPN是2016年被推出的, 而VGG16是那年很流行的特征提取基础网络。若是今年实施文本检测, 能够试试Resnet、FCN、Densenet等后起之秀做基础网络，或许有惊喜。算法

摘要本文介绍图像文本识别（OCR）领域的最新技术进展。首先介绍应用背景，包括面临的技术挑战、典型应用场景、系统实施框架等。接着介绍搭建图文识别模型过程当中常常被引用到的多种特征提取基础网络、物体检测网络框架，以及它们被应用到图文识别任务中所面临的场景适配问题。而后介绍最近三年来出现的各类文本边框检测模型、文字内容识别模型、端到端图文识别模型。最后介绍图文识别领域的大型公开数据集。

应用概述

OCR（Optical Character Recognition, 光学字符识别）传统上指对输入扫描文档图像进行分析处理，识别出图像中文字信息。场景文字识别（Scene Text Recognition，STR）指识别天然场景图片中的文字信息。天然场景图像中的文字识别，其难度远大于扫描文档图像中的文字识别，由于它的文字展示形式极其丰富：网络

·容许多种语言文本混合，字符能够有不一样的大小、字体、颜色、亮度、对比度等。
·文本行可能有横向、竖向、弯曲、旋转、扭曲等式样。
·图像中的文字区域还可能会产生变形(透视、仿射变换)、残缺、模糊等现象。
·天然场景图像的背景极其多样。如文字能够出如今平面、曲面或折皱面上；文字区域附近有复杂的干扰纹理、或者非文字区域有近似文字的纹理，好比沙地、草丛、栅栏、砖墙等。

也有人用OCR技术泛指全部图像文字检测和识别技术，包括传统OCR技术与场景文字识别技术。这是由于，场景文字识别技术能够被当作是传统OCR技术的天然演进与升级换代。框架

图像文字检测和识别技术有着普遍的应用场景。已经被互联网公司落地的相关应用涉及了识别名片、识别菜单、识别快递单、识别身份证、识别营业证、识别银行卡、识别车牌、识别路牌、识别商品包装袋、识别会议白板、识别广告主干词、识别试卷、识别单据等等。机器学习

已经有很多服务商在提供图像文字检测和识别服务，这些服务商既包括了腾讯、百度、阿里、微软、亚马逊、谷歌等大型云服务企业，也包括了一些活跃在物流、教育、安防、视频直播、电子政务、电子商务、旅游导航等垂直细分行业的服务企业。这些企业既可使用提早训练好的模型直接提供场景图文识别、卡证识别、扫描文档识别等云服务，也可使用客户提供的数据集训练定制化模型（如票据识别模型），以及提供定制化AI服务系统集成等。ide

以下图所示，传统技术解决方案中，是先分别训练文字检测和文本识别两个模型，而后在服务实施阶段将这两个模型串联到数据流水线中组成图文识别系统。函数

以下图所示，最近流行的技术解决方案中，是用一个多目标网络直接训练出一个端到端的模型。在训练阶段，该模型的输入是训练图像及图中文本坐标、文本内容，模型优化目标是输出端边框坐标预测偏差与文本内容预测偏差的加权和。在服务实施阶段，原始图片流过该模型直接输出预测文本信息。相比于传统方案，该方案中模型训练效率更高、服务运营阶段资源开销更少。

文本检测和识别技术处于一个学科交叉点，其技术演进不断受益于计算机视觉处理和天然语言处理两个领域的技术进步。它既须要使用视觉处理技术来提取图像中文字区域的图像特征向量，又须要借助天然语言处理技术来解码图像特征向量为文字结果。

模型基础

从公开论文中能够看到，起源于图像分类、检测、语义分割等视觉处理任务的各个基础网络（backbone network），纷纷被征用来提取图像中文字区域的特征向量。同时，起源于物体检测、语义分割任务的多个网络框架，也被改造后用于提高图文识别任务中的准确率和执行速度。本章将简单温习一下这些基础网络、网络框架的实现原理，并介绍图文识别任务中应用它们时所面临的各类场景适配问题。

基础网络

图文识别任务中充当特征提取模块的基础网络，能够来源于通用场景的图像分类模型。例如，VGGNet，ResNet、InceptionNet、DenseNet、Inside-Outside Net、Se-Net等。

图文识别任务中的基础网络，也能够来源于特定场景的专用网络模型。例如，擅长提取图像细节特征的FCN网络，擅长作图形矫正的STN网络。

因为你们对通用网络模型已经很熟悉，因此本节只简单介绍上述专用网络模型。

FCN网络

全卷积网络（FCN,fully convolutional network），是去除了全链接(fc)层的基础网络，最初是用于实现语义分割任务。FC的优点在于利用反卷积（deconvolution）、上池化（unpooling）等上采样（upsampling）操做，将特征矩阵恢复到接近原图尺寸，而后对每个位置上的像素作类别预测，从而能识别出更清晰的物体边界。基于FCN的检测网络，再也不通过候选区域回归出物体边框, 而是根据高分辨率的特征图直接预测物体边框。由于不须要像Faster-RCNN那样在训练前定义好候选框长宽比例，FCN在预测不规则物体边界时更加鲁棒。因为FCN网络最后一层特征图的像素分辨率较高，而图文识别任务中须要依赖清晰的文字笔画来区分不一样字符（特别是汉字），因此FCN网络很适合用来提取文本特征。当FCN被用于图文识别任务时，最后一层特征图中每一个像素将被分红文字行（前景）和非文字行（背景）两个类别。

STN网络

空间变换网络（STN，Spatial Transformer Networks）的做用是对输入特征图进行空间位置矫正获得输出特征图，这个矫正过程是能够进行梯度传导的，从而可以支持端到端的模型训练。

以下图所示，STN网络由定位网络（Localization Network），网格生成器（Grid generator），采样器（Sampler）共3个部分组成。定位网络根据原始特征图U计算出一套控制参数，网格生成器这套控制参数产生采样网格（sampling grid），采样器根据采样网格核函数将原始图U中像素对应采样到目标图V中。

空间变换的控制参数是根据原始特征图U动态生成的，生成空间变换控制参数的元参数则是在模型训练阶段学习到的、而且存放于定位网络的权重（weights）矩阵中。

选自arXiv: 1506.02025，’Spatial Transformer Networks

检测网络框架

Faster RCNN做为一个检测网络框架，其目标是寻找紧凑包围被检测对象的边框（BBOX，Bounding Box）。以下图所示，它在Fast RCNN检测框架基础上引入区域建议网络（RPN，Region Proposal Network），来快速产生与目标物体长宽比例接近的多个候选区域参考框（anchor）；它经过ROI（Region of Interest） Pooling层为多种尺寸参考框产生出归一化固定尺寸的区域特征；它利用共享的CNN卷积网络同时向上述RPN网络和ROI Pooling层输入特征映射（Feature Maps），从而减小卷积层参数量和计算量。训练过程当中使用到了多目标损失函数，包括RPN网络、ROI Pooling层的边框分类loss和坐标回归loss。经过这些loss的梯度反向传播，可以调节候选框的坐标、并增大它与标注对象边框的重叠度/交并比(IOU，Intersection over Union）。RPN网格生成的候选框初始值有固定位置以及长宽比例。若是候选框初始长宽比例设置得与图像中物体形状差异很大，就很难经过回归找到一个紧凑包围它的边框。

摘自arXiv:1506.01497，’Faster R-CNN: Towards Real-Ti

SSD（Single Shot MultiBox Detector），是2016年提出的一种全卷积目标检测算法，截止到目前还是主要的目标检测框架之一，相比Faster RCNN有着明显的速度优点。以下图所示，SSD是一种one stage算法，直接预测被检测对象的边框和得分。检测过程当中，SSD算法利用多尺度思想进行检测，在不一样尺度的特征图(feature maps)上产生与目标物体长宽比例接近的多个默认框(Default boxes)，进行回归与分类。最后利用非极大值抑制(Non-maximum suppression)获得最终的检测结果。训练过程当中，SSD采用Hard negative mining策略进行训练，使正负样本比例保持为1：3，同时使用多种数据增广(Data augmentation)方式进行训练，提升模型性能。

摘自arxiv: 1512.02325， “SSD: Single Shot MultiBox

文本检测模型

文本检测模型的目标是从图片中尽量准确地找出文字所在区域。

可是，视觉领域常规物体检测方法(SSD, YOLO, Faster-RCNN等)直接套用于文字检测任务效果并不理想，主要缘由以下：

·相比于常规物体，文字行长度、长宽比例变化范围很大。
·文本行是有方向性的。常规物体边框BBox的四元组描述方式信息量不充足。
·天然场景中某些物体局部图像与字母形状类似，若是不参考图像全局信息将有误报。
·有些艺术字体使用了弯曲的文本行，而手写字体变化模式也不少。
·因为丰富的背景图像干扰，手工设计特征在天然场景文本识别任务中不够鲁棒。

针对上述问题根因，近年来出现了各类基于深度学习的技术解决方案。它们从特征提取、区域建议网络(RPN)、多目标协同训练、Loss改进、非极大值抑制（NMS）、半监督学习等角度对常规物体检测方法进行改造，极大提高了天然场景图像中文本检测的准确率。例如：

·CTPN方案中，用BLSTM模块提取字符所在图像上下文特征，以提升文本块识别精度。
·RRPN等方案中，文本框标注采用BBOX +方向角度值的形式，模型中产生出可旋转的文字区域候选框，并在边框回归计算过程当中找到待测文本行的倾斜角度。
·DMPNet等方案中，使用四边形（非矩形）标注文本框，来更紧凑的包围文本区域。
·SegLink 将单词切割为更易检测的小文字块，再预测邻近链接将小文字块连成词。
·TextBoxes等方案中，调整了文字区域参考框的长宽比例，并将特征层卷积核调整为长方形，从而更适合检测出细长型的文本行。
·FTSN方案中，做者使用Mask-NMS代替传统BBOX的NMS算法来过滤候选框。
·WordSup方案中，采用半监督学习策略，用单词级标注数据来训练字符级文本检测模型。

下面用近年来出现的多个模型案例，介绍如何应用上述各方法提高图像文本检测的效果。

CTPN模型

CTPN是目前流传最广、影响最大的开源文本检测模型，能够检测水平或微斜的文本行。文本行能够被当作一个字符sequence，而不是通常物体检测中单个独立的目标。同一文本行上各个字符图像间能够互为上下文，在训练阶段让检测模型学习图像中蕴含的这种上下文统计规律，可使得预测阶段有效提高文本块预测准确率。CTPN模型的图像预测流程中，前端使用当时流行的VGG16作基础网络来提取各字符的局部图像特征，中间使用BLSTM层提取字符序列上下文特征，而后经过FC全链接层，末端通过预测分支输出各个文字块的坐标值和分类结果几率值。在数据后处理阶段，将合并相邻的小文字块为文本行。

选自arXiv: 1609.03605，’Detecting Text in Natural Im

RRPN模型

基于旋转区域候选网络（RRPN, Rotation Region Proposal Networks）的方案，将旋转因素并入经典区域候选网络（如Faster RCNN）。这种方案中，一个文本区域的ground truth被表示为具备5元组(x,y,h,w,θ)的旋转边框, 坐标(x,y)表示边框的几何中心, 高度h设定为边框的短边，宽度w为长边，方向是长边的方向。训练时，首先生成含有文本方向角的倾斜候选框，而后在边框回归过程当中学习文本方向角。

选自arXiv: 1703.01086，’Arbitrary-Oriented Scene Tex

RRPN中方案中提出了旋转感兴趣区域（RRoI，Rotation Region-of-Interest）池化层，将任意方向的区域建议先划分红子区域，而后对这些子区域分别作max pooling、并将结果投影到具备固定空间尺寸小特征图上。

选自arXiv: 1703.01086，’Arbitrary-Oriented Scene Tex

FTSN模型

FTSN（Fused Text Segmentation Networks）模型使用分割网络支持倾斜文本检测。它使用Resnet-101作基础网络，使用了多尺度融合的特征图。标注数据包括文本实例的像素掩码和边框，使用像素预测与边框检测多目标联合训练。

选自arXiv: 1709.03272，’Fused Text Segmentation Netw

基于文本实例间像素级重合度的Mask-NMS，替代了传统基于水平边框间重合度的NMS算法。下图左边子图是传统NMS算法执行结果，中间白色边框被错误地抑制掉了。下图右边子图是Mask-NMS算法执行结果，三个边框都被成功保留下来。

DMPNet模型

DMPNet（Deep Matching Prior Network）中，使用四边形（非矩形）来更紧凑地标注文本区域边界，其训练出的模型对倾斜文本块检测效果更好。

以下图所示，它使用滑动窗口在特征图上获取文本区域候选框，候选框既有正方形的、也有倾斜四边形的。接着，使用基于像素点采样的Monte-Carlo方法，来快速计算四边形候选框与标注框间的面积重合度。而后，计算四个顶点坐标到四边形中心点的距离，将它们与标注值相比计算出目标loss。文章中推荐用Ln loss来取代L一、L2 loss，从而对大小文本框都有较快的训练回归（regress）速度。

选自arXiv:1703.01425，’Deep Matching Prior Network:

EAST模型

EAST（Efficient and Accuracy Scene Text detection pipeline）模型中，首先使用全卷积网络（FCN）生成多尺度融合的特征图，而后在此基础上直接进行像素级的文本块预测。该模型中，支持旋转矩形框、任意四边形两种文本区域标注形式。对应于四边形标注，模型执行时会对特征图中每一个像素预测其到四个顶点的坐标差值。对应于旋转矩形框标注，模型执行时会对特征图中每一个像素预测其到矩形框四边的距离、以及矩形框的方向角。

根据开源工程中预训练模型的测试，该模型检测英文单词效果较好、检测中文长文本行效果欠佳。或许，根据中文数据特色进行针对性训练后，检测效果还有提高空间。

上述过程当中，省略了其余模型中常见的区域建议、单词分割、子块合并等步骤，所以该模型的执行速度很快。

选自arXiv: 1704.03155，’EAST: An Efficient and Accur

SegLink模型

SegLink模型的标注数据中，先将每一个单词切割为更易检测的有方向的小文字块（segment），而后用邻近链接（link ）将各个小文字块链接成单词。这种方案方便于识别长度变化范围很大的、带方向的单词和文本行，它不会象Faster-RCNN等方案由于候选框长宽比例缘由检测不出长文本行。相比于CTPN等文本检测模型，SegLink的图片处理速度快不少。

选自arXiv: 1703.06520，’Detecting Oriented Text in Na

以下图所示，该模型可以同时从6种尺度的特征图中检测小文字块。同一层特征图、或者相邻层特征图上的小文字块都有可能被链接入同一个单词中。换句话说，位置邻近、而且尺寸接近的文字块都有可能被预测到同一单词中。

选自arXiv: 1703.06520，’Detecting Oriented Text in Na

PixelLink模型

天然场景图像中一组文字块常常紧挨在一块儿，经过语义分割方法很难将它们识别开来，因此PixelLink模型尝试用实例分割方法解决这个问题。

该模型的特征提取部分，为VGG16基础上构建的FCN网络。模型执行流程以下图所示。首先，借助于CNN 模块执行两个像素级预测：一个文本二分类预测，一个连接二分类预测。接着，用正连接去链接邻居正文本像素，获得文字块实例分割结果。而后，由分割结果直接就得到文字块边框，并且容许生成倾斜边框。

上述过程当中，省掉了其余模型中常见的边框回归步骤，所以训练收敛速度更快些。训练阶段，使用了平衡策略，使得每一个文字块在总LOSS中的权值相同。训练过程当中，经过预处理增长了各类方向角度的文字块实例。

选自arXiv: 1801.01315，’Detecting Scene Text via Inst

Textboxes/Textboxes++模型

Textboxes是基于SSD框架的图文检测模型，训练方式是端到端的，运行速度也较快。以下图所示，为了适应文字行细长型的特色，候选框的长宽比增长了1,2,3,5,7,10这样初始值。为了适应文本行细长型特色，特征层也用长条形卷积核代替了其余模型中常见的正方形卷积核。为了防止漏检文本行，还在垂直方向增长了候选框数量。为了检测大小不一样的字符块，在多个尺度的特征图上并行预测文本框，而后对预测结果作NMS过滤。

选自arXiv: 1611.06779，’TextBoxes: A Fast Text Detect

（Textboxes++是Textboxes的升级版本，目的是增长对倾斜文本的支持。为此，将标注数据改成了旋转矩形框和不规则四边形的格式；对候选框的长宽比例、特征图层卷积核的形状都做了相应调整。

选自arXiv: 1801.02765，’TextBoxes++: A Single-Shot O

WordSup模型

以下图所示，在数学公式图文识别、不规则形变文本行识别等应用中，字符级检测模型是一个关键基础模块。因为字符级天然场景图文标注成本很高、相关公开数据集稀少，致使如今多数图文检测模型只能在文本行、单词级标注数据上作训练。WordSup提出了一种弱监督的训练框架，能够文本行、单词级标注数据集上训练出字符级检测模型。

以下图所示，WordSup弱监督训练框架中，两个训练步骤被交替执行：给定当前字符检测模型，并结合单词级标注数据，计算出字符中心点掩码图；给定字符中心点掩码图，有监督地训练字符级检测模型.

选自arXiv: 1708.06720，’WordSup： Exploiting Word Anno

以下图，训练好字符检测器后，能够在数据流水线中加入合适的文本结构分析模块，以输出符合应用场景格式要求的文本内容。该文做者例举了多种文本结构分析模块的实现方式。

文本识别模型的目标是从已分割出的文字区域中识别出文本内容。

CRNN模型

CRNN(Convolutional Recurrent Neural Network）是目前较为流行的图文识别模型，可识别较长的文本序列。它包含CNN特征提取层和BLSTM序列特征提取层，可以进行端到端的联合训练。它利用BLSTM和CTC部件学习字符图像中的上下文关系，从而有效提高文本识别准确率，使得模型更加鲁棒。预测过程当中，前端使用标准的CNN网络提取文本图像的特征，利用BLSTM将特征向量进行融合以提取字符序列的上下文特征，而后获得每列特征的几率分布，最后经过转录层(CTC rule)进行预测获得文本序列。

选自arXiv: 1507.05717，’An End-to-End Trainable Neura

RARE模型

RARE（Robust text recognizer with Automatic Rectification）模型在识别变形的图像文本时效果很好。以下图所示，模型预测过程当中，输入图像首先要被送到一个空间变换网络中作处理，矫正过的图像而后被送入序列识别网络中获得文本预测结果。

以下图所示，空间变换网络内部包含定位网络、网格生成器、采样器三个部件。通过训练后，它能够根据输入图像的特征图动态地产生空间变换网格，而后采样器根据变换网格核函数从原始图像中采样得到一个矩形的文本图像。RARE中支持一种称为TPS（thin-plate splines）的空间变换，从而可以比较准确地识别透视变换过的文本、以及弯曲的文本.

选自arXiv: 1603.03915，’Robust Scene Text Recognition

端到端模型

端到端模型的目标是一站式直接从图片中定位和识别出全部文本内容来。

FOTS Rotation-Sensitive Regression

FOTS（Fast Oriented Text Spotting）是图像文本检测与识别同步训练、端到端可学习的网络模型。检测和识别任务共享卷积特征层，既节省了计算时间，也比两阶段训练方式学习到更多图像特征。引入了旋转感兴趣区域（RoIRotate）, 能够从卷积特征图中产生出定向的文本区域，从而支持倾斜文本的识别.

选自arXiv: 1801.01671，’FOTS: Fast Oriented Text Spot

STN-OCR模型

STN-OCR是集成了了图文检测和识别功能的端到端可学习模型。在它的检测部分嵌入了一个空间变换网络（STN）来对原始输入图像进行仿射（affine）变换。利用这个空间变换网络，能够对检测到的多个文本块分别执行旋转、缩放和倾斜等图形矫正动做，从而在后续文本识别阶段获得更好的识别精度。在训练上STN-OCR属于半监督学习方法，只须要提供文本内容标注，而不要求文本定位信息。做者也提到，若是从头开始训练则网络收敛速度较慢，所以建议渐进地增长训练难度。STN-OCR已经开放了工程源代码和预训练模型。

选自arXiv: 1707.08831，’STN-OCR: A single Neural Netw

训练数据集

本章将列举可用于文本检测和识别领域模型训练的一些大型公开数据集，不涉及仅用于模型fine-tune任务的小型数据集。

Chinese Text in the Wild(CTW)

该数据集包含32285张图像，1018402个中文字符(来自于腾讯街景), 包含平面文本，凸起文本，城市文本，农村文本，低亮度文本，远处文本，部分遮挡文本。图像大小2048*2048，数据集大小为31GB。以(8:1:1)的比例将数据集分为训练集(25887张图像，812872个汉字)，测试集(3269张图像，103519个汉字)，验证集(3129张图像，103519个汉字)。

文献连接：https://arxiv.org/pdf/1803.00085.pdf 
数据集下载地址：https://ctwdataset.github.io/

Reading Chinese Text in the Wild(RCTW-17)

该数据集包含12263张图像，训练集8034张，测试集4229张，共11.4GB。大部分图像由手机相机拍摄，含有少许的屏幕截图，图像中包含中文文本与少许英文文本。图像分辨率大小不等。

下载地址http://mclab.eic.hust.edu.cn/icdar2017chinese/dataset.html
文献：http://arxiv.org/pdf/1708.09585v2

ICPR MWI 2018 挑战赛

大赛提供20000张图像做为数据集，其中50%做为训练集，50%做为测试集。主要由合成图像，产品描述，网络广告构成。该数据集数据量充分，中英文混合，涵盖数十种字体，字体大小不一，多种版式，背景复杂。文件大小为2GB。

下载地址：
https://tianchi.aliyun.com/competition/information.htm?raceId=231651&_is_login_redirect=true&accounttraceid=595a06c3-7530-4b8a-ad3d-40165e22dbfe

Total-Text

该数据集共1555张图像，11459文本行，包含水平文本，倾斜文本，弯曲文本。文件大小441MB。大部分为英文文本，少许中文文本。训练集：1255张测试集：300

下载地址：http://www.cs-chan.com/source/ICDAR2017/totaltext.zip
文献：http:// arxiv.org/pdf/1710.10400v

Google FSNS(谷歌街景文本数据集)

该数据集是从谷歌法国街景图片上得到的一百多万张街道名字标志，每一张包含同一街道标志牌的不一样视角，图像大小为600*150，训练集1044868张，验证集16150张，测试集20404张。

下载地址：http://rrc.cvc.uab.es/?ch=6&com=downloads
文献：http:// arxiv.org/pdf/1702.03970v1

替换高清大图

COCO-TEXT

该数据集，包括63686幅图像，173589个文本实例，包括手写版和打印版，清晰版和非清晰版。文件大小12.58GB，训练集：43686张，测试集：10000张，验证集：10000张

文献: http://arxiv.org/pdf/1601.07140v2
下载地址：https://vision.cornell.edu/se3/coco-text-2/

Synthetic Data for Text Localisation

在复杂背景下人工合成的天然场景文本数据。包含858750张图像，共7266866个单词实例，28971487个字符，文件大小为41GB。该合成算法，不须要人工标注就可知道文字的label信息和位置信息，可获得大量天然场景文本标注数据。

下载地址：http://www.robots.ox.ac.uk/~vgg/data/scenetext/
文献：http://www.robots.ox.ac.uk/~ankush/textloc.pdf
Code: https://github.com/ankush-me/SynthText (英文版)
Code https://github.com/wang-tf/Chinese_OCR_synthetic_data(中文版)

Synthetic Word Dataset

合成文本识别数据集，包含9百万张图像，涵盖了9万个英语单词。文件大小为10GB

下载地址：http://www.robots.ox.ac.uk/~vgg/data/text/

Caffe-ocr中文合成数据

数据利用中文语料库，经过字体、大小、灰度、模糊、透视、拉伸等变化随机生成，共360万张图片，图像分辨率为280x32，涵盖了汉字、标点、英文、数字共5990个字符。文件大小约为8.6GB

下载地址：https://pan.baidu.com/s/1dFda6R3

参考文献

1. “光学字符识别技术：让电脑像人同样阅读”, 新浪微博, 霍强

http://tech.sina.com.cn/d/i/2015-04-03/doc-icczmvun8339303.shtml

2. “Fully Convolutional Networks for Semantic Segmentation”, arXiv:1411.4038，Jonathan Long, Evan Shelhamer, Trevor Darrell

https://arxiv.org/pdf/1411.4038

3. “Spatial Transformer Networks”，arXiv:1506.02025，Max Jaderberg, Karen Simonyan, Andrew Zisserman, Koray Kavukcuoglu

https://arxiv.org/pdf/1506.02025

4.“Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks”，arXiv:1506.01497，Shaoqing Ren, Kaiming He, Ross Girshick, Jian Sun

https://arxiv.org/pdf/1506.01497

5.“SSD: Single Shot MultiBox Detector”，arxiv:1512.02325，Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg

https://arxiv.org/pdf/1512.02325

6.“Detecting Text in Natural Image with Connectionist Text Proposal Network”，arXiv:1609.03605，Zhi Tian, Weilin Huang, Tong He, Pan He, Yu Qiao

https://arxiv.org/pdf/1609.03605

7.“Arbitrary-Oriented Scene Text Detection via Rotation Proposals”，arXiv:1703.01086，Jianqi Ma, Weiyuan Shao, Hao Ye, Li Wang, Hong Wang, Yingbin Zheng, Xiangyang Xue

https://arxiv.org/pdf/1703.01086

8.“Fused Text Segmentation Networks for Multi-oriented Scene Text Detection”，arXiv:1709.03272，Yuchen Dai, Zheng Huang, Yuting Gao, Youxuan Xu, Kai Chen, Jie Guo, Weidong Qiu

https://arxiv.org/pdf/1709.03272

9.“Deep Matching Prior Network: Toward Tighter Multi-oriented Text Detection”，arXiv:1703.01425，Yuliang Liu, Lianwen Jin

https://arxiv.org/pdf/1703.01425

10.“EAST: An Efficient and Accurate Scene Text Detector”，arXiv:1704.03155，Xinyu Zhou, Cong Yao, He Wen, Yuzhi Wang, Shuchang Zhou, Weiran He, Jiajun Liang

https://arxiv.org/pdf/1704.03155

11.“Detecting Oriented Text in Natural Images by Linking Segments”，arXiv:1703.06520，Baoguang Shi, Xiang Bai, Serge Belongie

https://arxiv.org/pdf/1703.06520

12. “Detecting Scene Text via Instance Segmentation”，arXiv:1801.01315，Dan Deng, Haifeng Liu, Xuelong Li, Deng Cai

https://arxiv.org/pdf/1801.01315

13.“TextBoxes: A Fast Text Detector with a Single Deep Neural Network”，arXiv:1611.06779，Minghui Liao, Baoguang Shi, Xiang Bai, Xinggang Wang, Wenyu Liu

https://arxiv.org/pdf/1611.06779

14.“TextBoxes++: A Single-Shot Oriented Scene Text Detector”，arXiv:1801.02765，Minghui Liao, Baoguang Shi, Xiang Bai

https://arxiv.org/pdf/1801.02765

15.“WordSup： Exploiting Word Annotations for Character based Text Detection”，arXiv:1708.06720，Han Hu, Chengquan Zhang, Yuxuan Luo, Yuzhuo Wang, Junyu Han, Errui Ding

https://arxiv.org/pdf/1708.06720

16.“An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition”，arXiv:1507.05717，Baoguang Shi, Xiang Bai, Cong Yao

https://arxiv.org/pdf/1507.05717

17. “Robust Scene Text Recognition with Automatic Rectification”，arXiv:1603.03915，Baoguang Shi, Xinggang Wang, Pengyuan Lyu, Cong Yao, Xiang Bai

https://arxiv.org/pdf/1603.03915

18.“FOTS: Fast Oriented Text Spotting with a Unified Network”，arXiv:1801.01671，Xuebo Liu, Ding Liang, Shi Yan, Dagui Chen, Yu Qiao, Junjie Yan

https://arxiv.org/pdf/1801.01671

19.“STN-OCR: A single Neural Network for Text Detection and Text Recognition”，arXiv:1707.08831，Christian Bartz, Haojin Yang, Christoph Meinel

https://arxiv.org/pdf/1707.08831

20.“Chinese Text in the Wild”，arXiv:1803.00085，Tai-Ling Yuan, Zhe Zhu, Kun Xu, Cheng-Jun Li, Shi-Min Hu

https://arxiv.org/pdf/1803.00085.pdf

21.“ICDAR2017 Competition on Reading Chinese Text in the Wild (RCTW-17)”，arXiv:1708.09585，Baoguang Shi, Cong Yao, Minghui Liao, Mingkun Yang, Pei Xu, Linyan Cui, Serge Belongie, Shijian Lu, Xiang Bai

http://arxiv.org/pdf/1708.09585

22.“Total-Text: A Comprehensive Dataset for Scene Text Detection and Recognition”，arXiv:1710.10400，Chee Kheng Chng, Chee Seng Chan

https://arxiv.org/pdf/1710.10400

23.“End-to-End Interpretation of the French Street Name Signs Dataset”，arXiv:1702.03970，Raymond Smith, Chunhui Gu, Dar-Shyang Lee, Huiyi Hu, Ranjith Unnikrishnan, Julian Ibarz, Sacha Arnoud, Sophia Lin

https://arxiv.org/pdf/1702.03970

24.“COCO-Text: Dataset and Benchmark for Text Detection and Recognition in Natural Images”，arXiv:1601.07140，Andreas Veit, Tomas Matera, Lukas Neumann, Jiri Matas, Serge Belongie

http://arxiv.org/pdf/1601.07140

25. “Synthetic Data for Text Localisation in Natural Images”，arXiv:1604.06646， Ankush Gupta， Andrea Vedaldi， Andrew Zisserman

https://arxiv.org/pdf/1604.06646

你可能感兴趣的:(机器视觉)

机器视觉_联合编程(二) Zhangci］ VisionPro 数码相机计算机视觉人工智能 VisionPro 机器视觉
链接相机,加载tb,检测FrameGrabber链接相机拍照usingSystem;usingSystem.Collections;usingSystem.Collections.Generic;usingSystem.ComponentModel;usingSystem.Data;usingSystem.Drawing;usingSystem.Linq;usingSystem.Text;usin
EI检索-机器视觉、图像处理与影像技术国际学术会议（MVIPIT 2023）邀您参会！诗远Yolanda 图像处理人工智能计算机视觉
机器视觉是计算机学科的一个重要分支，它综合了光学、机械、电子、计算机软硬件等方面的技术，涉及到计算机、图像处理、模式识别、人工智能、信号处理、光机电一体化等多个领域。而图像处理等技术的快速发展也推动了机器视觉的发展。机器视觉在我国具有广泛的工业应用，核心功能包括：测量，检测，识别，定位等。第一届机器视觉、图像处理与影像技术国际学术会议（MVIPIT2023）将于2023年7月26日-28日在浙江杭
学习Halcon可以从以下几个方面入手视觉人机器视觉机器视觉Halcon大总结学习人工智能深度学习图像处理计算机视觉视觉检测
‌基础理论学习‌：‌了解Halcon的基本概念、‌架构和主要技术，‌包括图像处理、‌机器视觉、‌深度学习等方面的知识。‌‌官方文档和教程‌：‌阅读Halcon的官方文档和教程，‌这是学习Halcon最直接、‌最权威的途径。‌官方文档详细介绍了Halcon的各种功能和算子，‌是学习Halcon不可或缺的资源。‌‌实践项目‌：‌通过参与实际项目来巩固所学知识，‌提升实践能力。‌可以从简单的项目开始，‌
最新2024年国际EI会议集合 AC学术中心 EI论文
最新2024年国际EI会议集合，要说哪个渠道录用最快，当属EI会议，最快1个月录用，超级快的可能仅需15天，非常适合计算机、机械、工程技术等理工科方向。除了录用周期的优势外，EI会议相较于SCI、EI源刊、国内核心等价格更便宜，几千元即可发表EI会议论文。下面AC学术中心给大家介绍一下近期要举办的EI会议。第二届机器视觉、图像处理与影像技术国际会议（MVIPIT2024）会议时间：2024年9月1
acm会议什么档次_盘点AI国际顶级会议 weixin_39531992 acm会议什么档次
人工智能(英文全称ArtificialIntelligence,缩写为AI)从其字面意思理解是由人制造出来在机器上体现出的类似于人类的智能，其技术研究包含机器视觉、机器学习、自然语言处理、机器运动和控制等众多方面。如同四大时装周是世界时尚潮流的风向标，人工智能领域的国际顶尖会议也往往汇集了人工智能各分支技术的最新发展状态和未来发展方向。今天，小编就来为大家盘点一下人工智能领域的国际顶级会议。\\\
【机器视觉--光学】工业相机成像原理 Vision Z 机器视觉镜头工业相机机器视觉
相机成像原理分为透镜成像原理和小孔成像原理，工业相机原理与透镜成像类似。透镜成像原理凸透镜的成像规律是即：物距的倒数与像距的倒数之和等于焦距的倒数对焦原理工业相机镜头分为定焦、定倍、变焦镜头，常用的是定焦和定倍，定倍镜头调整相距，达到清晰的成像，根据上面的公式，想要得到远处清晰的成像，镜片组到芯片距离需要增加，想要得到近距离的成像时，镜片组到芯片距离需要减小。定倍镜头放大倍数已知，工作距离已知，安
关于光源的明场和暗场照明 InvokeLife 机器视觉光源
明场：光源与被测物成一定角度，使得绝大部分的光反射到摄像机，我们称作明场照明[1]。暗场：光源位置使得大部分的光没有反射到摄像机，仅仅将照射到被测物的特定部分的光反射到摄像机，我们称此种照明为暗场照明[1]。如下，明场和暗场的示意图[2]。根据直射、漫射，以及正面背面还可以再分。未完待续。[1]《机器视觉算法与应用》第二版[2]《默然光源选型手册》
机器视觉-4 检测原理之OpenCV Blob特征检测 dingkm666 机器视觉计算机视觉人工智能深度学习
在OpenCV中，BLOB（BinaryLargeOBjects）检测是一种用于识别和分析二值图像中连通区域的技术。OpenCV提供了专门的工具类SimpleBlobDetector来帮助实现这一功能。以下是关于OpenCV中BLOB检测的详细说明，包括其原理、使用方法和应用场景。一.什么是BLOB？在图像处理的背景下，BLOB指的是图像中颜色一致且连接在一起的像素区域。在二值图像中，这些区域通常
机器视觉-1 常用的机器视觉开发库 dingkm666 机器视觉机器学习
机器视觉-1常用的机器视觉开发库前言：工欲善其事必先利其器，选择一个合适的视觉开发库是在机器视觉领域的发展的重要基础。1.OpenCV（OpenSourceComputerVisionLibrary）简介:OpenCV是最著名和最广泛使用的开源计算机视觉库之一。由Intel于1999年开发，目前由OpenCV.org维护，支持C++、Python、Java和MATLAB等多种编程语言。功能:图像处
工业相机参数之帧率相关知识详解小白学视觉人工智能 java python 计算机视觉编程语言
点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达工业相机是机器视觉系统的重要组成部分之一,在机器视觉系统中有着非常重要的作用。工业相机已经被广泛应用于工业生产线在线检测、智能交通,机器视觉,科研,军事科学,航天航空等众多领域。工业相机的主要参数包括:分辨率、帧率、像素、像元尺寸、光谱响应特性等。下面我们来对工业相机帧率的相关知识进行讲解:帧率(Framerate)是用于测量显
机器视觉按需求选择工业相机的方法鸦芽_hujiamei 图像处理机器视觉机器视觉相机选择
信号工业相机的信号类型有模拟信号和数字信号两种。模拟相机必须有图像采集卡，标准的模拟相机分辨率很低，采集到的是模拟信号，经数字采集卡转换为数字信号进行传输存储。工业数字相机采集到的是数字信号，数字信号不受电噪声影响，因此，数字相机的动态范围更高，能够向计算机传输更精确的信号。分辨率根据具体需求来选择相机分辨率的大小，如果一个像素对应一个缺陷的话，那么这样的系统一定会极不稳定，所以我们为了提高系统的
工业相机测长仪的组成部分蓝鹏测控自动化制造其他
关键字:工业相机测长仪,高精度测长仪,视觉测量系统,蓝鹏测控测长仪,工业测长仪,本文介绍了蓝鹏测控公司机器视觉业务测长仪的核心产品及技术特点，主要涵盖相机部分、相机防护系统、补光系统和软件部分。（一）相机部分我司的机器视觉业务聚焦工业视觉传感应用，专注光学技术、嵌入式硬件技术和底层算法软件，为客户提供领先的机器视觉硬件产品和算法平台。公司拥有成熟的研发及质量管控体系，从设计源头确保每一款产品的高品
视觉系统的革新：嵌入式AI摄像头 7aa5938c2f5f
学号：17050610006姓名：韦运泽文章链接：https://mp.weixin.qq.com/s/VzuM-ewcCu88D7nYjeE3BQ功能强大的精简型单板计算机的推出带动了一些新产品的设计，在通过小型化优化成本及效率的应用中，它的效用尤为明显。另外，视觉系统可以利用功能全面的板级机器视觉摄像头进一步缩小产品总体尺寸并实现运行灵活性，同时还支持定制或非标准光学部件。它们被用于：医疗诊断
国内十大AGV厂家排行互联网之声人工智能大数据
国内agv机器人公司排名1.海康机器人成立时间：2016年4月20日海康机器人成立于2016年。杭州的一家机器人技术公司主要从事移动机器人、机器视觉、无人机等领域的业务。到目前为止，它还拥有许多专利产品，并一直为世界提供许多相应的产品和结局计划。2.坤厚机器人成立时间：坤厚自动化科技有限公司成立于2015年，从成立至今申请了多项发明及实用新型专利，并且拥有国内领先的AGV技术，紧密结合市场应用需求
什么是计算机视觉？龙腾AI 计算机视觉人工智能自然语言处理深度学习 ai
计算机视觉概述计算机视觉（ComputerVision）又称机器视觉（MachineVision），是一门让机器学会如何去“看”的学科，是深度学习技术的一个重要应用领域，被广泛应用到安防、工业质检和自动驾驶等场景。具体的说，就是让机器去识别摄像机拍摄的图片或视频中的物体，检测出物体所在的位置，并对目标物体进行跟踪，从而理解并描述出图片或视频里的场景和故事，以此来模拟人脑视觉系统。因此，计算机视觉也
嵌入式机器视觉的流水线分拣机器人：OpenCV、 FreeRTOS、 TensorFlow（代码详解）极客小张机器人 opencv tensorflow stm32 系统架构计算机视觉物联网
一、项目概述在现代自动化生产中，分拣机器人作为提高生产效率和准确度的重要工具，正逐渐成为工业流水线的核心组成部分。本项目旨在设计一款基于嵌入式机器视觉的流水线分拣机器人，通过高效的图像处理与实时控制技术，实现对物品的快速识别与自动分拣。该项目的主要目标包括：提高分拣精度：通过高效的机器视觉算法，确保机器人能够准确识别不同类型的物品。提升作业效率：利用实时操作系统和嵌入式AI推理引擎，实现快速响应与
简述Ifocus自动对焦模块 51camera 机器视觉视觉检测视觉系统
在2024上海机器视觉展中，51camera的合作厂商iCore展出的自动对焦模块吸引不少观众驻足，那么什么是自动对焦呢？顾名思义，是指被测物的成像平面偏离了镜头的焦距范围，导致成像模糊，利用辅助装置可使成像平面重新回到镜头最佳焦距范围。自动对焦的作用？首先我们先了解一下“景深”，景深（DepthofField,DOF）是关于空间中可以清晰成像的距离范围，镜头对焦面物体拍摄时，背景虚化，对焦背景时
iLight混合点光源激光与LED技术的结合 51camera LED光源视觉系统视觉检测
51camera机器视觉产品资料查询平台的光源种类比较丰富，今天我们一起来看看其合作厂商iCore的明星产品iLight混合点光源，该产品提供了比LED更高的亮度，作为传统LED和氙气灯的替代品，它将激光和LED技术的结合，提供了长达10,000小时的寿命，没有氙气灯短寿命和亮度波动的缺点。iLight混合光系统由一个大功率光源控制器和一个专门为机器视觉应用设计的混合光组成。它具有高速控制和高效运
加速自动驾驶模型迭代，数据存算一体是关键 virtaitech OrionX 自动驾驶人工智能机器学习 AI AI算力资源池化科技 OrionX
自动驾驶的每一个业务阶段都会涉及到AI深度学习算法和算力的参与，机器视觉，深度学习，传感器技术等均在自动驾驶领域发挥着重要的作用。自动驾驶系统不断迭代的前提是算法的持续优化，目前，自动驾驶发展的瓶颈主要在于AI底层技术和AI算力发展水平上能否实现突破。近日，焱融高性能分布式文件存储系统YRCloudFile联合趋动科技OrionXAI算力资源池化软件与GeminiAI开发训练平台，共同打造自动驾驶
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
软件杯深度学习 opencv python 公式识别(图像识别机器视觉) Mr.D学长 python java
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
计算机设计大赛行人重识别(person reid) - 机器视觉深度学习 opencv python iuerfee python
文章目录0前言1技术背景2技术介绍3重识别技术实现3.1数据集3.2PersonREID3.2.1算法原理3.2.2算法流程图4实现效果5部分代码6最后0前言优质竞赛项目系列，今天要分享的是深度学习行人重识别(personreid)系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：5分更多资料,项目分享：https:
挑战杯基于设深度学习的人脸性别年龄识别系统 laafeer python
文章目录0前言1课题描述2实现效果3算法实现原理3.1数据集3.2深度学习识别算法3.3特征提取主干网络3.4总体实现流程4具体实现4.1预训练数据格式4.2部分实现代码5最后0前言优质竞赛项目系列，今天要分享的是基于深度学习机器视觉的人脸性别年龄识别系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/po
互联网加竞赛机器视觉目标检测 - opencv 深度学习 Mr.D学长 python java
文章目录0前言2目标检测概念3目标分类、定位、检测示例4传统目标检测5两类目标检测算法5.1相关研究5.1.1选择性搜索5.1.2OverFeat5.2基于区域提名的方法5.2.1R-CNN5.2.2SPP-net5.2.3FastR-CNN5.3端到端的方法YOLOSSD6人体检测结果7最后0前言优质竞赛项目系列，今天要分享的是机器视觉opencv深度学习目标检测该项目较为新颖，适合作为竞赛课题
挑战杯基于机器视觉的图像拼接算法 laafeer python
前言图像拼接在实际的应用场景很广，比如无人机航拍，遥感图像等等，图像拼接是进一步做图像理解基础步骤，拼接效果的好坏直接影响接下来的工作，所以一个好的图像拼接算法非常重要。再举一个身边的例子吧，你用你的手机对某一场景拍照，但是你没有办法一次将所有你要拍的景物全部拍下来，所以你对该场景从左往右依次拍了好几张图，来把你要拍的所有景物记录下来。那么我们能不能把这些图像拼接成一个大图呢？这是一个较为新颖的竞
挑战杯基于机器视觉的火车票识别系统 laafeer python
文章目录0前言1课题意义课题难点：2实现方法2.1图像预处理2.2字符分割2.3字符识别部分实现代码3实现效果最后0前言优质竞赛项目系列，今天要分享的是基于机器视觉的火车票识别系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题意义目前火车乘务员在卧铺旅客在上车前为其提供将火车
挑战杯基于机器视觉的二维码识别检测 - opencv 二维码识别检测机器视觉 laafeer python
文章目录0简介1二维码检测2算法实现流程3特征提取4特征分类5后处理6代码实现5最后0简介优质竞赛项目系列，今天要分享的是基于机器学习的二维码识别检测-opencv二维码识别检测机器视觉该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1二维码检测物体检测就是对数字图像中一类特定的物体
计算机设计大赛深度学习人体跌倒检测 -yolo 机器视觉 opencv python iuerfee python
0前言优质竞赛项目系列，今天要分享的是**基于深度学习的人体跌倒检测算法研究与实现**该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：5分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1.前言人体跌倒是人们日常生活中常见姿态之一，且跌倒的发生具有随机、难
计算机设计大赛深度学习人脸表情识别算法 - opencv python 机器视觉 iuerfee python
文章目录0前言1技术介绍1.1技术概括1.2目前表情识别实现技术2实现效果3深度学习表情识别实现过程3.1网络架构3.2数据3.3实现流程3.4部分实现代码4最后0前言优质竞赛项目系列，今天要分享的是深度学习人脸表情识别系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：4分更多资料,项目分享：https://gite
巡检机器人与机器视觉的融合：巡检运维的未来趋势超维机器人机器人运维人工智能大数据计算机视觉
2023世界机器人大会的数据显示，中国工业机器人装机量已经占据了全球市场的超过50%的比重，成为全球最大的工业机器人市场。巡检机器人作为一种高度复杂的自动化装置，被广泛应用于工业领域，能实现各种工业场景下智能巡检运维，推动传统产业智能化改造和数字化转型；因其在智能巡检运维领域占据重要地位，被誉为“皇冠上的明珠”。机器视觉技术使得智能巡检机器人能够自动检测目标物体、识别设备状态、发现异常情况，并采取
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓