宜信技术学院

快速入门开发实现订单类图片识别结果抽象解析

一、背景

面对订单数据纸质文件或图片，仅靠人眼识别的话效率很低，需引入机器学习来识别和解析图片以提高效率。当前市面上已有收费的图片识别服务，包括阿里、百度等，识别效果较好，但针对订单类图片，不仅要关注图片上的文字，还要关注文字所在的行列，来分出每条数据和数据详细字段。

本文主要介绍一种针对订单类图片识别结果进行行列解析的抽象流程和方案，帮助提高开发效率。

注：本文只提供思路，不提供源码。另外，本文不介绍人工智能图片识别，感兴趣的同学可以上网查询相关资料。

二、解析流程

对于图像处理，opencv算是比较优秀的工具，因此将其选做本文图像处理首选软件。

为了使图片识别率更高，需要先做图片矫正，这里采用较为简单的霍夫变换加去噪声点算法矫正图片。
图片矫正后，调用图片识别服务获取结果，一般结果格式包括响应码、错误描述、文字块列表（文字和四点坐标）等。
然后使用抽象的俄罗斯方块法根据识别结果获取行列信息。
最后根据行列信息组装每一行数据并显示。

三、细节处理

3.1 opencv安装概要

opencv安装，本文只做简单提示，不展开介绍，以后有时间单独发文。

1）windows

下载编译好的包，https://opencv.org/releases/
解压缩到自定义文件夹。

2）linux

推荐使用ubuntu，并且最好是全新的系统，因为opencv会依赖很多包，对版本要求也高，解决冲突会很麻烦。
下载源码
安装依赖包
编译安装

我们使用java调用opencv，这里需要安装获取到开发包，windows为opencv_javaxxx.dll，linux为libopencv_javaxxx.so，程序初始化时需要加载到jvm。详细代码如下：

System.load(PropertieUtil.getPropertie("这里是dll或so的完整路径");

3.2 图片矫正

3.2.1 矫正探索

图片矫正探索之路较为艰辛，起初我们想了一个比较简单的方案：

先调用图片识别服务，获取到结果。
然后根据每一个字块的四角坐标判断出每个字块的倾斜角。
再根据去燥算法算出平均的倾斜角。

理论上这个方案是可行的，但实践证明我们错了，因为图片识别服务返回的坐标图片不准确，多数图片算出的结果都是错误的。

经查发现霍夫变换有可能解决这个问题，于是开始尝试学习霍夫变换和去燥算法，最终发现可行，并抽象出公共方法，仅需简单配置一些参数就能完成矫正。

图片矫正分为两步：

第一步：正反矫正，判断图片倾斜角度是90°、180°、270°、0°，这个通过数学方法是无法判断的，需要引用机器学习。
第二步：角度微调，一般为确定图片是正的，且倾斜角度在±30°左右。

需要注意的是，上面说的办法不可能通过一套参数来对所有图片进行微调，但线上数据证明，针对一类图片，一套参数基本能让大多数图片都矫正正确。

3.2.2 霍夫变换概要

霍夫变换是数学界经典空间变换算法，用于检测直线，通过大量检测到的直线的斜率就能计算出图片倾斜角度。先进行二值化和边缘检测再进行霍夫变换效果更佳，详细算法内容请自行搜索，本文不展开。

3.2.3 去噪声点算法

基本公式：

上限=均值+n*标准差

下限=均值-n*标准差

其中n取值一般为1-4，数值越大表示筛选率越高。

最后再将符合的数据求均值。

核心代码如下:

/**
     * 利用标准差筛选
     * @param values
     * @return
     */
    private static double[] calcBestCornList(double[] values) {
        // 计算标准差
        StandardDeviation variance = new StandardDeviation();
        double evaluate = variance.evaluate(values);
        Mean mean = new Mean();
        double meanValue = mean.evaluate(values);
        double biggerValue = meanValue + CHOOSE_POWER * evaluate;
        double smallerValue = meanValue - CHOOSE_POWER * evaluate;
        List<Double> selected = Lists.newArrayList();
        for (double value : values) {
            if (value >= smallerValue && value <= biggerValue) {
                selected.add(value);
            }
        }
        double[] selectedValue = new double[selected.size()];
        for (int i = 0; i < selected.size(); i++) {
            selectedValue[i] = selected.get(i);
        }
        logger.info("占比:{}%，筛选后角度数组：{}", (selectedValue.length / (float)values.length) * 100F, selected);
        return selectedValue;
    }

3.2.4 霍夫变化抽象封装

基本流程：

定义相关参数
读取图片
灰度二值化处理
使用opencv画出轮廓
根据参数要求多次画霍夫变换线，直到线数量满足参数为止
遍历画出的线，分出横线和竖线，根据配置计算出每条线的角度
使用去噪声算法（需要根据非0数自动重复计算）算出平均倾斜角度
使用opencv旋转图片

核心代码如下：

/**
     * 矫正图片，通过霍夫变换矫正
     * @param oldImg 原始图片
     * @param rotateParam 旋转参数
     * @return
     */
    public static String rotateHoughLines(File oldFile, String oldImg, RotateParam rotateParam, String cid, String bankCode) throws Exception {

        Mat src= Imgcodecs.imread(oldFile.getAbsolutePath());
        //读取图像到矩阵中
        if(src.empty()){
            throw new Exception("no file " + oldFile.getAbsolutePath());
        }
        // 用于计算的图片矩阵
        Mat mathImg = src.clone();
        // 灰度化
        Imgproc.cvtColor(src, mathImg, Imgproc.COLOR_BGR2GRAY);
        logger.info("二值化完成");
        // 获取轮廓
        Imgproc.Canny(src, mathImg, rotateParam.getCvtThreshould1(), rotateParam.getCvtThreshould2());
        logger.info("轮廓完成");
        // 霍夫变换获取角度，详细代码略
        double corn = houghLines(mathImg, rotateParam, cid);
        logger.info("霍夫变换完成，角度：{}", corn);
        if(corn == 0) {
            return oldImg;
        }
        return rotateOpenv(oldFile, corn, cid, bankCode);
    }

3.3 常用图片识别方案

阿里、百度都有提供图片识别服务，如果有实力也可以自己实现，不过不建议自研，因为样本需求量巨大，时间成本过高。

3.4 识别结果解析

3.4.1 探索之路

本章节为本文重点内容，因为前文所提到的都是较为基础的服务和算法，大量开发内容都在本章。前期要开发的订单图片类型巨量（大于100种），每一类图片区别很大，我们有几个人分类型开发，但每个人所用的方法都不同，且张三开发出来的李四看不懂，不过毕竟面对的是图片，比较抽象，这是可以理解的。

开发一段时间后我们发现了问题：每种类型最快也要一周才能开发完成，而且解析成功率极低。开发出一套抽象的方法来把行列数据提取出来迫在眉睫。

通过调研发现，大家常用两种方法来提取行列数据，分别为坐标法和标题法，但这两种方法解析率都不高。经过几周思考，终于想出了一套较好的方法，命名为俄罗斯方块法，最终解决了问题。

3.4.2 俄罗斯方块法

思路概要：

拿到识别结果数据。
先把所有数据的y坐标进行排序。
遍历排序结果，先把第一条放入第一列结果集中。
从第二条开始和第一列结果集对比。
对比方法：如果在第一列结果集其中一条数据的右侧，则认为是新列；如果在y轴方法和第一列结果集中某些数据重叠了，则认为是新列。
如果以上两条都不是，则认为本条数据还在当前列中，放入第一列结果集。
以此类推，继续对比，直到对比到最后一列最后一条数据。
按照上述方法，反过来，以x轴为标准，能够得到行结果集。

思路图如下：

概要代码如下：

// 按照最左上角的x坐标排序
        OcrWordInfo[] sortL = NoTableParseResult.ParseUtil.bubbleSortX(ocrResponse.getPrism_wordsInfo(), false);
        NoTableParseResult ntpr = new NoTableParseResult(param);
        ntpr.setHeight(converImg.height());
        ntpr.setWight(converImg.width());
        for (int i = 0; i < sortL.length; i++) {
            // 当前要比较的数据
            OcrWordInfo ocrWordInfo = sortL[i];
            // 处理当前列数据
            ntpr.getUtil().testCurColData(ocrWordInfo);
        }
        // 处理最后一列
        ntpr.lastCol();

        /**
         * 判断是否为下一列，并处理
         * @param ocrWordInfo
         * @return
         */
        public void testCurColData(OcrWordInfo ocrWordInfo) {

            // 遍历当前列已存在的所有数据
            int size = this.test.getCol().size();
            if(size == 0) {
                this.test.addCol(ocrWordInfo);
                return;
            }
            for (int i = 0; i < size; i++) {
                OcrWordInfo temp = this.test.getCol().get(i);
                // 最右边的数据
                int x1 = temp.getPos().get(1).getX();
                int x2 = temp.getPos().get(2).getX();
                // 当前数据最左边
                int xx0 = ocrWordInfo.getPos().get(0).getX();
                int xx3 = ocrWordInfo.getPos().get(3).getX();

                int threholdx = this.test.param == null ? 0 : this.test.param.getCoverColXThrehold();
                if(xx0 >= (x1 - threholdx) && xx0 >= (x2 - threholdx) && xx3 >= (x1 - threholdx) && xx3 >= (x2 - threholdx)) {
                    // 当前数据在右边，说明换列了!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
                    this.test.colAdd();
                    this.test.addCol(ocrWordInfo);
                    return;
                } else {
                    // 判断是否覆盖坐标
                    int y0 = temp.getPos().get(0).getY();
                    int y3 = temp.getPos().get(3).getY();
                    int yy0 = ocrWordInfo.getPos().get(0).getY();
                    int yy3 = ocrWordInfo.getPos().get(3).getY();
                    int threhold = (int)Math.round((y3 - y0) * (this.test.param == null ? 0.25 : this.test.param.getCoverThrehold()));
                    if(!(yy3 <= (y0 + threhold) || yy0 >= (y3 - threhold))) {
                        // 当前列表数据重叠，说明换列了!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
                        this.test.colAdd();
                        this.test.addCol(ocrWordInfo);
                        return;
                    }
                }
            }
            // 执行到这说明没覆盖
            this.test.addCol(ocrWordInfo);
        }

3.4.3 解析行数据技巧

技巧总结：

1）俄罗斯方块法提供去除干扰项的参数，可以根据图片特点去除上下左右干扰数据来减少串行列现象。

2）解析数据大致有两种方法

根据标题列号来判断数据，这种方法不通用，简单、规范的图片识别率高，但无法适配乱的图。
把每一行数据以间隔符号分割拼到一起，使用正则表达式来‘扣’数据。因为一般同类型订单图片，关键字段的位置是有特点的，例如金额格式、借贷方向、日期等，这种方法通用，但识别率不高。

具体使用哪种方法，还需要根据图片特点进行取舍。

3）俄罗斯方块法提供一些微调参数，用于适配一些特殊场景，例如换行列阀值之类的。

4）中间需要保存一些过程图片，例如矫正过程的若干张图、俄罗斯方块法识别结果的连线图等。毕竟这种项目在查问题时靠日志是没用的，还得靠这些中间图才能更快查到问题。

四、总结

本文提到的方案不能完全解决所有订单类图片解析问题，可以做到新手快速入门快速开发，如果您有更好思路欢迎交流。

作者：刘鹏飞

来源：宜信技术学院

你可能感兴趣的:(程序员笔记,图片识别)

GPT-4-Turbo 和 Claude-3.5-Sonnet 图片识别出答题的是否正确进行比较光影3415 模型比较
1、比较的图片：====================使用GPT-4-Turbo输入的=============================提问：识别图片中的印刷字和手写字，如果写错的给一个正确答案+图片回复：在图片中，印刷字显示的是一系列的英语填空练习题，而手写字则是填入空白处的答案。以下是题目、选项、填入的答案，以及正确答案（如果填写错误）的列表：###印刷字内容与答案1.**Weput
java程序员 thinkpad_JAVA程序员笔记本电脑推荐？ stratisplatform java程序员 thinkpad
如果主要是做JAVA开发，那其实需要考虑的因素有：CPU性能必须过得去，因为java相对来说比较消耗CPU资源，当然是大型java应用，题主如果学习java的时候，倒不是特别重要，基本上2020年主流笔记本CPU都可以应对。内存，题主也说了，是因为idea特别吃内存才更换的笔记本，所以这里推荐16G内存起步，如果购买轻薄本的话，基本上内存就固定死了，不能更换；如果购买游戏本，那么可以增加到32G内
使用深度学习TensorFlow框架进行图片识别开发者社区小百科 TensorFlow 阿里云大学阿里云大学 TensorFlow
ApsaraClouder大数据专项技能认证：使用深度学习TensorFlow框架进行图片识别本认证系统的介绍了深度学习的一些基础知识，以及Tensorflow的工作原理。通过阿里云机器学习PAI基于经典的CIFAR-10数据集实现图片识别。学员可以通过本实验，对深度学习Tensorflow框架有一个简单、直观的了解。课时预览机器学习PAI介绍本节主要介绍阿里云机器学习PAI平台的功能以及常用的操
pytorch利用简单CNN实现葡萄病虫害图片识别麦麦大数据神经网络 pytorch cnn 人工智能
1前言之前我开发了一个葡萄病虫害的可视化系统，最近就想给这个系统增加2个功能，一个是对接一个AI助手，可以进行葡萄病虫害的咨询，直接对接千问大模型，这个在之前的博文里已经介绍过对接方法了，第二个是做一个根据图片识别病虫害（分类）的功能。2实现思路实现思路是想通过pytorch做一个CNN模型的训练，然后根据给出的图片进行类型的预测。3数据集我没有数据集，仅有的一些图片是之前委托我做程序的bro给的
雨课堂怎么搜答案？七个受欢迎的搜题分享了 #微信#职场发展雨课堂怎么搜答案？七个受欢迎的搜题分享了 #微信#职场发展悲伤小肥羊职场和发展面试
积极参加社团活动和实践项目，可以帮助大学生拓宽人脉圈和锻炼实际操作能力。1.福昕翻译可以一键翻译文档内容，并提供还原排版的译文，对经常看外文文献的朋友来说，绝对是福音福昕翻译是一流专业的在线翻译服务平台,支持PDF文档翻译、图片识别翻译、在线翻译、自动翻译以及人工翻译。2.灵兔搜题这是个微信公众号大学四年所需要的教材和网课答案都有，支持截图搜题、文字搜索、文档搜素等方式，基本上各种类型的题目都可以
【Vuforia+Unity】AR01实现单张多张图片识别产生对应数字内容 Unity3d青子 AR开发 unity 游戏引擎
1.官网注册Home|EngineDeveloperPortal2.下载插件SDK，导入Unity3.官网创建数据库上传图片，官网处理成数据下载好导入Unity！下载好导入Unity！下载好导入Unity！下载好导入Unity！4.在Unity设置开始创建场景选择数据库，就是前面导入的，选择对应图片，然后添加数字内容，放在ImageTarget的子物体下面！这样就完成了！需要调用电脑的摄像头，我们
opencv进行人脸识别攻城狮的梦 opencv 人工智能计算机视觉
目录一：准备工作二：人脸图片识别三：视频人脸识别一：准备工作1：github网站下载开源人脸特征数据haarcascade_frontalface_default.xml下载链接：
tensorflow利用CNN实现MNIST图片识别 Lornatang
FunctioninstructionsThedataData:Thisistheclassicmnisthandwritingrecognitionimagedata.Downloadlink:thisDirectorytree├──__init__.py├──__pycache__│└──base.cpython-37.pyc├──base.py├──base.pyc├──data│├──t1
一键升级ChatGPT Plus/升级GPT4.0/订阅GPT【升级ChatGPT Plus避坑指南】不穿靴子的猫. chatgpt gpt 人工智能
前言相比于GPT4来说，GPT3.5显得有点傻傻的，而且GPT4还支持图片识别/图片生成，GPTs等功能。为了升级GPT4踩了很多坑，记录下自己的血泪史，帮大家少走一些弯路。踩坑一：某宝因为没有国外的卡，所以没法充值，想到万能某宝，因为某些原因，他们店铺也是没法搜到的，换了很多关键词才终于找到一家可以代充的店铺，然后就被狠狠砍了一刀，20刀的订阅费收我240rmb，含泪赚我一百块，我真是人傻钱不多
MySQL表设计的思考昙花未现
多分类图片识别的项目背景，用户上传包含多个目录的压缩包形成数据集，压缩包中的子目录作为图片分类，机器学习根据用户选择的图片分类作为训练集和验证集，使用训练集进行模型训练，使用验证集进行模型验证，如果验证结果符合用户需求，用户可以发布模型，通过发布的模型来识别上传的图片。场景1：多分类图片识别的项目，图片验证集验证的结果是一个分类矩阵，矩阵中每个元素是该分类被预测成其他分类的图片数量。场景1设计：把
UI自动化之Poco常用断言方式 AI小艾 Appium移动端测试 ui 自动化前端
实际上用到的几种写断言的方式：1.验证UI界面（断言图片是否存在，UI页面不稳定情况下，图片识别效率不高）assert_existsassert_not_exists2.验证数值（断言传入的两个值(数字或者string)是否相等）assert_equal：assert_equal(poco("button").get_text(),"0","按钮的值与预期一致")assert_not_equaln
满满当当的表格页PPT，为什么美化后竟成了弃稿？自律的音律
自咱们改稿专栏开启后，还没有做过表格，所以这一周，我在知乎上选择了这样两页稿件：图源：知乎好啦，废话不多说，让我们正式进入改稿。01.提取表格首先第一步肯定是从图片中提取表格，我这里用的方法是使用天若ocr。关于从图片识别文字的相关软件，之前写过一篇文章，感兴趣的话，可以看一下，这里就不详细展开了：搞定PPT文字的神秘招式：看图识字提取出文字内容后，我们继续下一步。02.优化第一个页面A.分析文案
怎样将图片识别成文字？2招教你图片转成Word Hiten2018
大部分时候我们为了方便都会用拍照或截图的方式快速获取并保存一些资料，但这样的偷懒方法最终都要落实到文字才能便于修改整理，所以如何才能将图片识别成文字呢？教你2种快速将图片转换成Word文档的方法。一、在线识别既然我们拍图是为了方便，那转换自然也是要省事了，所以使用在线直接识别转换的方法是最简单了，而且手机也能直接使用，最适合懒人党。具体使用方法也很简单，首先搜索speedpdf即可找到这款在线转换
【OCR软件进化史】文字、表格、公式图片识别并与ChatGPT交互 civilpy 07_其他总结 ocr
第1年由于日常工作需要大量的文本处理，身为一个全栈pythoner是绝不允许手动复制粘贴。于是，在2021年，封装了第1版的文字、表格、公式图片识别工具（第1版）：第1版做的比较粗糙，就是封装了百度的OCR接口，用户需要自己申请相关的KEY。第2年2022年，后面学而思的接口更新，也就百度的还算稳定。顺便提一下，文字、表格的识别准确度，百度是远超国内其他互联网公司。这一点我在2019年经过半年的时
基于openAI 的 clip模型启动一个图片识别分类 wzerofeng golang chatgpt 人工智能
importtorchimportclipfromPILimportImage#加载预训练模型device="cuda"iftorch.cuda.is_available()else"cpu"model,preprocess=clip.load('ViT-B/32',device='cpu')#加载图像image=Image.open('日产.jpeg')#对图像进行预处理image_input=
android opencv之旅（一）导入AndroidStudio 风少侠
需求公司最近又有了一项新的需求：定位一张截图里面的棋盘区域，并识别其中的黑白子数目。类似于下面这张图：隐智围棋.jpg一说图片识别，立马想到了大名鼎鼎的opencv，正好趁此机会学习一波，前后折腾了三四天，总算初步入门，运用内置的一些基础算法实现了上述需求，在此整理记录一下。下载官网地址：https://opencv.org/releases.html，选择androidpack。下载解压后目录如
Selenium自动化测试：通过cookie绕过验证码的操作 .咖啡加剁椒. 软件测试 selenium 测试工具软件测试自动化测试功能测试程序人生职场和发展
验证码的处理对于web应用，很多地方比如登录、发帖都需要输入验证码，类型也多种多样；登录/核心操作过程中，系统会产生随机的验证码图片，进行验证才能进行后续操作解决验证码的方法如下：1、开发做个万能验证码(推荐)2、测试环境关闭验证码功能(推荐)（开发配置）3、图片识别技术（不稳定）4、调用开发生成验证码接口（和开发配合）5、第三方验证码平台（打码兔）6、cookie绕过验证码(推荐)cookie处
计算机设计大赛深度学习 YOLO 实现车牌识别算法 iuerfee python
文章目录0前言1课题介绍2算法简介2.1网络架构3数据准备4模型训练5实现效果5.1图片识别效果5.2视频识别效果6部分关键代码7最后0前言优质竞赛项目系列，今天要分享的是基于yolov5的深度学习车牌识别系统实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：4分工作量：4分创新点：3分更多资料,项目分享：https://gitee.com
java 工具类实现Base64二维码图片识别一名技术极客工具类随笔 java相关 java 开发语言
上依赖com.google.zxingjavase3.2.1com.google.zxingcore3.3.3上代码/***作用：二维码识别（图片）*类名：QRCodeTools**/publicclassQRCodeTools{/***解析二维码解析,此方法是解析Base64格式二维码图片*baseStr:base64字符串,data:image/png;base64开头的*/publicsta
C#图片识别-TesseractOCR 一刃之锋
OCR简介：光学字符识别(OCR,OpticalCharacterRecognition)是指对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。OCR技术非常专业，一般多是印刷、打印行业的从业人员使用，可以快速的将纸质资料转换为电子资料。关于中文OCR，目前国内水平较高的有清华文通、汉王、尚书，其产品各有千秋，价格不菲。国外OCR发展较早，像一些大公司，如IBM、微
阿里接口——node.js识别车牌无题syl
完成图片识别OCR上传银行卡/身份证号/车牌号等等阿里云：OCR框架手机美颜/直播啊都是调的接口上传带有车牌号的图片，自动识别出图片中的车牌号接口的获取打开阿里云/百度云/自己喜欢的云服务，本人是在阿里云购买的免费接口搜索OCR，找到可以识别的车牌号的接口，然后可以购买免费版本购买后如下图所示：image购买成功得到上述图片，其中Appkey/AppSecret是我们需要的在购买服务的下方：ima
Python实现avif图片转jpg格式并识别图片中的文字 xiejava1018 Python 机器学习 python 开发语言 windows
文章目录一、图片识别文字1、导包2、代码实现3、运行效果二、avif格式图片转jpg格式1、导包2、代码实现3、运行效果4、注意事项三、Python实现avif图片转jpg格式并识别文字全部代码在做数据分析的时候有些数据是从图片上去获取的，这就需要去识别图片上的文字。Python有很多库可以很方便的实现OCR识别图片中的文字。这里介绍用EasyOCR库进行图片文字识别。easyocr是一个比较流行
全流程机器视觉工程开发（三）任务前瞻 - 从opencv的安装编译说起，到图像增强和分割 Leventure_轩先生不涉及理论的简易机器学习笔记 opencv 人工智能计算机视觉
前言最近开始做这个裂缝识别的任务了，大大小小的问题我已经摸得差不多了，然后关于识别任务和分割任务我现在也弄的差不多了。现在开始做正式的业务，也就是我们说的裂缝识别的任务。作为前言，先来说说场景：现在相机返回过来的照片：都是jpeg格式的照片，当然也可能是别的格式，目前主流是jpeg格式大小约为11mb-14mb左右图片大小为5120x5120我们现在如果说想直接使用这个图片来进行图片识别的话，会有
Python爬虫学习之requests库蜀道之南718 python 爬虫笔记学习
目录一、requests的基本使用二、get请求三、post请求四、代理的使用五、cookie登录以及验证码图片识别一、requests的基本使用importrequestsurl='http://www.baidu.com'response=requests.get(url=url)#一个类型和六个属性#Response类型#print(type(response))#设置响应的编码格式resp
【AI】【GPT】如何用苹果Gift卡充值GPT Plug 每日出拳老爷子 ai 人工智能 gpt
【背景】由于需要GPT的图片识别和Dalle2的融合功能，决定再次充值GPT4。之前冲过一次涉及数字货币转账，信用卡等等，交易成本很高，这次决定试试更方便的苹果Gift卡充值。说方便，因为整体整备好了一次后续再冲的操作成本很低，不涉及需要向第三方私人求助。但是整备的过程网上还是有不少误导信息。我这里就记录一下自己的过程，希望大家少走弯路。注意，由于上图太麻烦，所以都用文字，尽可能详细说明。【准备工
Python爬虫学习之requests库蜀道之南718 爬虫 python 笔记学习
目录一、requests的基本使用二、get请求三、post请求四、代理的使用五、cookie登录以及验证码图片识别一、requests的基本使用importrequestsurl='http://www.baidu.com'response=requests.get(url=url)#一个类型和六个属性#Response类型#print(type(response))#设置响应的编码格式resp
Tesseract OCR图片识别训练 SparkOnly
初始安装安装tesseract-ocrhttps://digi.bib.uni-mannheim.de/tesseract/安装jTessBoxEditorFX可到https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/下载训练步骤准备样本图片合并TIFF图片将多张样本图片合并为一张tiff图片格式为：[lang].[fontna
数学公式OCR识别php 对接mathpix api 使用公式编译器闰土小蒋 ocr php 开发语言
数学公式OCR识别php对接mathpixapi一、注册账号官网网址：https://mathpix.com二、该产品支持多端使用注意说明（每月10次）三、api对接第一步创建createkeyphp对接api这里先封装两个请求函数，get和post，通过官方文档我们可以知道，有的api需要用get有的需要post.下面我们开始发送请求的封装的一些函数对接图片识别的api对接PDF识别的api第一
如何将图片识别成可修改的Word文字 Hiten2018
很多工作上的各种需求，需要对图片中的内容进行修改，一般的人只能依照着图片手打成Word后再修改，可能一两张图片的时候还可以接受，但如果一本实物书要转换成可以编辑的word，光靠手打工程量太大了。是否有把图片上的文字转成可编辑的Word文字的方法呢？目前OCR图片识别应用越来越广，很多转换工具都有了这个功能，我们可以根据日常使用习惯选择更合适的方法，一般常用的就是客户端转换器和在线网页转换，以下详细
Selenium获取动态图片验证码米洛丶
关于图片验证码的文章，我想大家都有一定的了解了。在我们做UI自动化的时候，经常会遇到图片验证码的问题。image当开发不给咱们提供万能验证码，或者测试第三方网站比如知乎的时候，我们就需要自己去识别验证码。OCROCR是一种图像文字识别的技术，例如图中的验证码，我们用肉眼识别就是c5s3，但机器可不比咱们肉眼。所以我们要利用ocr技术，让我们的Python脚本自动通过图片识别出对应的文字。常见的识别
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他