Python3爬虫中识别图形验证码的实例讲解

本节我们首先来尝试识别最简单的一种验证码，图形验证码，这种验证码出现的最早，现在也很常见，一般是四位字母或者数字组成的，例如中国知网的注册页面就有类似的验证码，链接为：http://my.cnki.net/elibregister/commonRegister.aspx，页面：

表单的最后一项就是图形验证码，我们必须完全输入正确图中的字符才可以完成注册。

1.本节目标

本节我们就以知网的验证码为例，讲解一下利用 OCR 技术识别此种图形验证码的方法。

2. 准备工作

识别图形验证码需要的库有 Tesserocr，如果没有安装可以参考第一章的安装说明。

3. 获取验证码

为了便于实验，我们先将验证码的图片保存到本地，以供测试。

打开开发者工具，找到验证码元素，可以看到这是一张图片，它的 src 属性是 CheckCode.aspx，在这里我们直接将这个链接打开：http://my.cnki.net/elibregister/CheckCode.aspx，就可以看到一个验证码，直接右键保存下来即可，将名称命名为 code.jpg，如图 8-2 所示：

这样我们就可以得到一张验证码图片供下面测试识别使用了。

4. 识别测试

接下来我们新建一个项目，将验证码图片放到项目根目录下，用 Tesserocr 库来识别一下该验证码试试，代码如下：

import tesserocr
from PIL import Image
image = Image.open('code.jpg')
result = tesserocr.image_to_text(image)
print(result)

在这里我们首先新建了一个 Image 对象，然后调用了 Tesserocr 的 image_to_text() 方法，传入该 Image 对象即可完成识别，实现过程非常简单，识别结果如下：

JR42

另外 Tesserocr 还有一个更加简单的方法直接将图片文件转为字符串可以达到同样的效果，代码如下：

import tesserocr
print(tesserocr.file_to_text('image.png'))

不过经测试此种方法的识别效果不如上一种方法好。

5. 验证码处理

如上的图片识别基本没有难度，只是新建一个 Image 对象，然后调用 image_to_text() 方法即可得出图片的识别结果。

接下来我们换一个验证码试一下，命名为 code2.jpg，如图 8-3 所示：

重新用下面的代码测试一下：

import tesserocr
from PIL import Image
image = Image.open('code2.jpg')
result = tesserocr.image_to_text(image)
print(result)

这时可以看到如下输出结果：

FFKT

发现这次识别和实际的结果有所偏差，这是因为验证码内的多余线条干扰了图片的识别。

对于这种情况，我们还需要做一下额外的处理，如转灰度、二值化等操作。

我们可以利用 Image 对象的 convert() 方法参数传入 L 即可将图片转化为灰度图像，代码如下：

image = image.convert('L')
image.show()

传入 1 即可将图片进行二值化处理：

image = image.convert('1')
image.show()

另外我们还可以指定二值化的阈值，上面的方法采用的是默认阈值127，不过我们不能用原图直接转化，可以先转为灰度图像，然后再指定二值化阈值转化，代码如下：

image = image.convert('L')
threshold = 80
table = []
for i in range(256):
    if i < threshold:
        table.append(0)
    else:
        table.append(1)
image = image.point(table, '1')
image.show()

在这里我们指定了一个变量 threshold 代表二值化阈值，阈值设置为 80，处理之后我们看一下结果，如图 8-4 所示：

经过处理之后我们发现原来的验证码中的线条已经被去除了，而且整个验证码变得黑白分明，这时重新识别验证码，代码如下：

import tesserocr
from PIL import Image
image = Image.open('code2.jpg')
image = image.convert('L')
threshold = 127
table = []
for i in range(256):
    if i < threshold:
        table.append(0)
    else:
        table.append(1)
image = image.point(table, '1')
result = tesserocr.image_to_text(image)
print(result)

即可发现运行结果变成了：

PFRT

识别正确。

可见对于一些有干扰的图片，我们做一些灰度和二值化处理，会提高其识别正确率。

6. 本节代码

本节代码地址为：https://github.com/Python3WebSpider/CrackImageCode。

7. 结语

本节我们了解了利用 Tesserocr 识别验证码的过程，对于简单的图形验证码我们可以直接用它来得到结果，如果要提高识别的准确度还可以对验证码图片做一下预处理。

以上就是Python3爬虫中识别图形验证码的实例讲解的详细内容，更多关于Python3爬虫识别图形验证码的资料请关注脚本之家其它相关文章！

你可能感兴趣的:(Python3爬虫中识别图形验证码的实例讲解)

人工智能与深度学习的应用案例：从技术原理到实践创新 accurater 人工智能深度学习科技
第一章引言人工智能（AI）作为21世纪最具变革性的技术之一，正通过深度学习（DeepLearning）等核心技术推动各行业的智能化进程。从计算机视觉到自然语言处理，从医疗诊断到工业制造，深度学习通过模拟人脑神经网络的层次化学习机制，实现了对复杂数据的高效分析与决策。本文结合前沿技术框架与行业应用案例，探讨深度学习的核心原理及其在多个领域的实践路径，并附代码实例以增强技术理解。第二章深度学习的技术基
大数据Hadoop集群运行程序赵广陆 hadoop hadoop big data mapreduce
目录1运行自带的MapReduce程序2常见错误1运行自带的MapReduce程序下面我们在Hadoop集群上运行一个MapReduce程序，以帮助读者对分布式计算有个基本印象。在安装Hadoop时，系统给用户提供了一些MapReduce示例程序，其中有一个典型的用于计算圆周率的Java程序包，现在运行该程序。该jar包文件的位置和文件名是“~/hadoop-3.1.0/share/Hadoop/
Vue打包后生成的文件及编程细节心之飞翼 vue.js 前端 javascript 编程
Vue.js是一种流行的JavaScript框架，用于构建现代化的单页应用程序。当我们开发一个Vue应用并准备将其部署到生产环境时，我们需要对应用进行打包，以便生成最终的可执行文件。在这篇文章中，我们将详细讨论Vue打包后生成的文件，以及与之相关的编程细节。1.打包工具：Webpack在Vue项目中，常用的打包工具是Webpack。Webpack提供了强大的模块打包能力，能够将Vue应用中的各种资
品致差分探头与光隔离差分探头的区别 PinTech示波器探头电流传感器电流探头高频电流探头电流钳
差分探头与光隔离差分探头在电子测量领域都是重要的工具，但它们在工作原理、应用场景以及性能特点上存在显著的差异。差分探头主要用于测量两个输入端之间的电压差。它通过内部电路将两个输入端的信号进行相减，从而得到它们的差值。差分探头能够抑制共模噪声，提高信号的信噪比；光隔离差分探头采用电-光转换技术，将电信号转换为光信号，通过光纤传输，然后在另一端将光信号转换回电信号。这种完全的电气隔离提供了极高的安全性
如何维护和应用高压隔离探头-Pintech品致 PinTech示波器探头高频电流探头差分探头示波器科技
测量时使用者可以进入测试模式并调整偏置电压，如果探头在长期使用后失去平衡，将偏差压力调整到零；电子触摸按钮使用寿命更长；声光报警功能，可手动关闭声报警功能，更人性化USB电源方便灵活的电源接口；自动保存功能，防止用户停电后重复操作。高压隔离探头是一种具有浮动测量功能的探头，具有良好的共模噪声抑制能力、高输入阻抗、低输入电容、高速准确测量差异电压信号。可广泛应用于开关电源、变频器、电子镇流器、变频家
【数据库】通俗易懂掌握MySQL存储最小单位及数据存取过程千益数据库数据库 mysql
MySQL是一种广泛使用的关系型数据库管理系统（RDBMS），它的核心功能是存储和管理数据。要深入理解MySQL的工作原理，首先需要了解它的存储最小单位以及数据存取过程。此外，MySQL支持多种存储引擎（如InnoDB、MyISAM等），不同的存储引擎在数据存取过程中会有一些区别。本文将通过丰富的案例和通俗易懂的解释，帮助你掌握这些核心概念。1.MySQL存储的最小单位：页（Page）1.1什么是
探索高性能AI识别和边缘计算 | NVIDIA Jetson Orin Nano 8GB 开发套件测评总结 Loving_enjoy 实用技巧人工智能边缘计算
#NVIDIAJetsonOrinNano8GB测评：当边缘计算遇上"性能暴徒"，树莓派看了想转行引言：比咖啡机还小的"AI超算"，却让开发者集体沸腾2025年的某个深夜，程序员老王盯着工位上巴掌大的NVIDIAJetsonOrinNano，突然热泪盈眶——这个尺寸堪比奥利奥饼干盒的设备，跑YOLOv5的速度竟比他去年买的游戏本还快3倍！隔壁桌用树莓派做毕设的大学生小张探头一看，默默把刚买的Ras
Webpack 打包后文件过大，如何优化？几何心凉前端入门之旅 webpack 前端 node.js
聚沙成塔·每天进步一点点本文回顾⭐专栏简介Webpack打包后文件过大，如何优化？1.代码分割（CodeSplitting）1.1概念1.2Webpack的`SplitChunksPlugin`示例配置：1.3按需加载（LazyLoading）示例：2.TreeShaking2.1概念2.2启用TreeShaking示例配置：2.3检查未被使用的代码安装`webpack-bundle-analyz
喜提一等奖！白鲸开源在“创业北京”创业创新大赛海淀区选拔赛决赛表现亮眼 DolphinScheduler社区大数据
6月25日，第七届“创业北京”创业创新大赛海淀区选拔赛决赛在中关村东升国际科学园成功举办。本次活动由海淀区人力资源和社会保障局、中关村科学城管委会主办，以“创响新时代共圆中国梦”为主题，活动现场主体赛先进制造赛道和主体赛现代服务赛道共20个晋级决赛的项目进行了现场路演，共同角逐各赛道一、二、三等奖及优秀奖，评审专家、创投机构及创业创新项目等80余人现场参与。本次晋级决赛的项目中有赋能能源行业发展的
SQL基础语法 F_0125 MYSQL 数据库 oracle sql
主要内容SQL（StructuredQueryLanguage）是一种用于管理关系数据库的编程语言。它允许用户在数据库中存储、修改和检索数据，并提供了一些强大的功能，如数据过滤、排序、分组和聚合。SQL是一种标准化的语言，几乎所有的关系数据库管理系统都支持它。SQL的用法包括以下几个方面：1.数据库的创建和删除使用SQL可以创建和删除数据库。创建数据库的语法如下：CREATEDATABASEdat
qgis加载天地图 AllBlue GIS qgis gis
一、点击TileServer(XYZ)，选择NewConnection二、在弹出的输入框中输入天地图的url此处以影像底图为例，url为http://t0.tianditu.gov.cn/img_w/wmts?SERVICE=WMTS&REQUEST=GetTile&VERSION=1.0.0&LAYER=img&STYLE=default&TILEMATRIXSET=w&FORMAT=tiles
vscode setting.json 全局设置工作区设置位置优先级 AllBlue vscode vscode ide 编辑器
vscode中setting.json有两种配置权限一、全局配置：setting.json文件位于C:\Users\Administrator\AppData\Roaming\Code\User\settings.json二、工作区配置：setting.json文件位于工作区的.vscode\settings.json当两种配置同时存在时，工作区配置的优先级高于全局配置。vscode如何打开set
修改虚拟机的yum配置别惊鹊 linux
1.配置源，命令是：sudocurl-o/etc/yum.repos.d/CentOS-Base.repohttps://mirrors.aliyun.com/repo/Centos-7.repo2.再清空缓存，让配置生效，命令是：sudoyumcleanallsudoyummakecache3.测试是否配置成功。下载一个常见工具试一试，如果能下载成功，就证明这个操作完成了yuminstalltr
网关边缘计算：让数据处理更贴近一线北京天拓四方边缘计算人工智能
在工业4.0与智慧城市的浪潮中，数据如同新时代的石油，驱动着各行各业的变革。然而，传统云计算模式下，数据需长途跋涉至云端处理，这不仅带来了延迟问题，更在带宽成本、隐私安全等方面遭遇瓶颈。此时，网关边缘计算作为“边缘智能”的核心技术，正悄然改变着数据处理的规则——它将计算能力下沉到网络边缘，让数据在“家门口”就能完成分析与决策。一、技术亮点：边缘智能的三大突破1.低延迟响应，实时决策无忧在智能制造车
云原生边缘计算：重塑分布式智能的时空边界桂月二二云原生边缘计算分布式
引言：算力向数据源头迁移的革命特斯拉自动驾驶系统每小时产生20TB边缘数据，时延要求低于50ms。中国移动5G边缘云实现ARPU值提升38%，华为云IEF平台将工业质检响应速度提升至15ms以内。ABIResearch预测2026年边缘AI芯片市场规模达520亿美元，KubeEdge管理边缘节点数突破千万级，单节点资源开销仅为K8s的1/8。一、边缘计算架构范式演进1.1技术架构对比矩阵特征维度中
在Blender中给SP分纹理组 CG星空 Substance Painter SP 材质
在Blender中怎么分SP的纹理组/纹理集其实纹理组就是材质把同一组的材质分给同一组的模型导入到sp里面自然就是同一个纹理组把模型导入SP之后就自动分好了
04. 滑动冲突处理花启莫你是不是傻面试 android java
文章目录00.思维树01.什么是滑动冲突1.1**什么是滑动冲突？**1.2**一个简单的例子**02.外部拦截法03.内部拦截法04.滑动冲突实例05.外部拦截法解决滑动冲突06.内部拦截法解决滑动冲突其他介绍01.关于我的博客00.思维树什么是滑动冲突处理？怎样解决？什么是外部拦截法？什么是内部拦截法？01.什么是滑动冲突1.1什么是滑动冲突？滑动冲突指的是：当父容器和子View都可以响应滑动
2025年渗透测试面试题总结-字某某动-安全研究实习生（二面）（题目+回答）独行soc 2025年渗透测试面试指南面试职场和发展安全网络安全红蓝攻防护网
网络安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录字某某动-安全研究实习生（二面）1.护网行动中的核心工作2.防护层级选择（WAF/IDS）3.误报治理方案4.内网误报分布场景5.MySQL执行PowerShell防护6.资产收集经验7.漏洞攻击案例8.SQL注入攻防详解原理防御方案OrderBy防御特殊字符处理9.
2025年二级建造师备考经验技巧分享 100分题库小栗子笔记
备考二级建造师，掌握有效的方法至关重要。下面从学习规划、科目复习要点以及练习巩固等方面分享经验。制定科学学习规划依据考试时间与自身日常安排，制定详细学习计划。例如，若距离考试还有三个月，可将第一个月用于全面学习各科基础知识点，每天保证2-3小时学习时间。第二个月进行知识点强化，梳理重点、难点，可利用周末时间进行章节总结。最后一个月集中刷题、模拟考试，熟悉考试节奏。同时，规划时要预留弹性时间，应对突
Blender常用快捷键的汇总金米kk blender
一、基础操作全选/取消全选：A（全选）、AA（连续按两次A取消全选）复制物体：Shift+D（复制后需点击确认位置）移动物体：G（按X/Y/Z可约束轴向移动）旋转物体：R（按X/Y/Z可约束轴向旋转）缩放物体：S（按X/Y/Z可约束轴向缩放）撤销：Ctrl+Z重做：Ctrl+Shift+Z二、视图与导航切换三视图：Shift+``（FPS自由视角模式）前/后视图：Ctrl+1（小键盘）/Ctrl+
blender 坐标系金属度 AI算法网奇 3d渲染数码相机
目录指向原点，并保持y轴朝上设置金属度具体操作1.绕X轴旋转90度2.绕Z轴旋转90度旋转矩阵示例坐标系讲解视频指向原点，并保持y轴朝上direction=-camera.locationrot_quat=direction.to_track_quat("-Z","Y")#[[1,0,0],[0,0,-1],[0,1,0]]camera.rotation_euler=rot_quat.to_eul
双目立体视觉（6.1）测距 2501_90596733 双目立体视觉计算机视觉人工智能 opencv
在计算机视觉领域，双目相机测距是一项关键技术，它通过模拟人类双眼的视觉机制，利用两个相机从不同角度拍摄同一场景，进而计算出物体的深度信息。一、双目测距的基本原理1.1视差图（DisparityMap）视差图是一种存储了单视图所有像素的视差值的二维图像。视差值是同一物体在左右两幅图像中的列坐标差，即通过比较左右两幅图像的对应像素差异来计算物体的深度信息。视差图是以图像对中任一幅图像为基准生成的，其大
blender看不到导入的模型 AllBlue blender blender
参考：blender快捷键常见问题_blender材质预览快捷键-CSDN博客方法一：视图-裁剪起点，设置一个很大的值方法二：选中所有对象，对齐视图-视图对齐活动项-选择一个视图
【微服务】SpringBoot 整合Redis Stack 构建本地向量数据库相似性查询小码农叔叔 AI大模型实战与应用 springboot 入门到精通向量数据库 redis stack java使用向量数据库
目录一、前言二、向量数据库介绍2.1什么是向量数据库2.2向量数据库特点2.3向量数据库使用场景三、常用的向量数据库解决方案3.1Milvus3.1.1Milvus是什么3.1.2Milvus主要特点3.2Faiss3.2.1Faiss是什么3.2.2Faiss主要特点3.3Pinecone3.3.1Pinecone是什么3.3.2Pinecone主要特点3.4Weaviate3.4.1Weavi
WPF框架---MvvmLight介绍白白白白纸呀 WPF知识总结 c#开发语言 wpf
目录1.MvvmLight框架准备2.MvvmLight中的相关基类3.MvvmLight中的数据绑定与通知a.核心功能b.关键方法与属性c.完整示例d.高级用法4.MvvmLight中的命令对象a.命令对象的作用b.核心接口：ICommandc.MvvmLight中的RelayCommandd.动态更新命令的可执行状态e.高级用法5.Messenger对象使用a.Messenger的核心作用b.
链表的插入排序 Linked List Insertion Sort 清风无情446 链表 list 数据结构
一、插入排序Insertionsort插入排序很像玩扑克牌中整理手牌的过程，从第二个数开始依次比较其与前面所用数据的大小，直到找到其需要在的位置。当从第二个数据遍历到最后一个数据之后就完成了整个数组的排序。voidInsertionSort(intarr[],intn){for(inti=0;i=0;j--){//将比temp大的数依次向后移动一位arr[j+1]=arr[j];}//将temp插
CMD命令大全非德77 windows
引言在Windows系统的广袤世界里，图形化界面（GUI）无疑是大家日常操作的得力助手，凭借直观的图标、便捷的鼠标点击，我们轻松实现各类任务。但你是否知晓，在这繁华的图形背后，还隐藏着一位强大而低调的“幕后英雄”——命令提示符（CMD）。它就像Windows系统的神秘“源代码”，虽然外表朴实无华，却蕴含着无穷的能量。CMD，作为Windows系统内置的命令行工具，为我们开启了一扇直接与系统内核对话
MVC模式全解析非德77 mvc
MVC模式：概念与架构基石在软件开发的广袤宇宙中，MVC模式宛如一颗璀璨的恒星，照亮了无数开发者前行的道路。它是一种经典的软件架构模式，全称为Model-View-Controller，即模型-视图-控制器，将应用程序清晰地划分为三个核心部分：模型（Model）、视图（View）和控制器（Controller）。这种架构方式犹如为程序搭建了一个稳固的骨架，使得代码的组织和管理更加高效，也为团队协作
C++ 重载运算符非德77 c++java 开发语言
一、运算符重载是什么在C++编程中，运算符重载是一项极为强大的特性，它允许我们为自定义的数据类型（比如类和结构体）定义运算符的具体行为。你可以把它想象成给运算符赋予了新的“超能力”，让它们能够适用于我们自己创建的数据类型，就如同它们对int、double这样的内置类型操作一样自然流畅。举个简单的例子，在数学中，我们常常进行复数的运算，复数有实部和虚部。如果我们定义了一个复数类Complex，想要实
素数筛介绍，C++实现非德77 c++算法开发语言密码学
一、素数在数学的奇妙世界里，素数是一个独特而又基础的概念。素数，也被称为质数，是指在大于1的自然数中，除了1和它自身外，不能被其他自然数整除的数。例如，2、3、5、7、11等都是素数，而4（能被2整除）、6（能被2和3整除）等则不是。素数在数学领域中具有举足轻重的地位，是数论等众多数学分支的核心研究对象。在计算机科学领域，素数也有着广泛的应用，比如在密码学中，RSA加密算法就依赖于大素数的性质来保
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他