problc

如何识别高级的验证码

http://sebug.net/paper/pst_WebZine/pst_WebZine_0x02/html/PSTZine_0x02_0x09.html

                          ==Ph4nt0m Security Team==
 
                       Issue 0x02, Phile #0x09 of 0x0A
 

|=---------------------------------------------------------------------------=|
|=-----------------------=[  如何识别高级的验证码  ]=------------------------=|
|=---------------------------------------------------------------------------=|
|=---------------------------------------------------------------------------=|
|=----------------------=[      By moonblue333     ]=------------------------=|
|=-------------------=[  <moonblue333_at_hotmail.com>  ]=--------------------=|
|=---------------------------------------------------------------------------=|


一、验证码的基本知识

    1. 验证码的主要目的是强制人机交互来抵御机器自动化攻击的。
    
    2. 大部分的验证码设计者并不得要领，不了解图像处理，机器视觉，模式识别，人工智能
的基本概念。
    
    3. 利用验证码，可以发财，当然要犯罪：比如招商银行密码只有6位，验证码形同虚设，计
算机很快就能破解一个有钱的账户，很多帐户是可以网上交易的。
    
    4. 也有设计的比较好的，比如Yahoo,Google,Microsoft等。而国内Tencent的中文验证
码虽然难，但算不上好。

二、人工智能，模式识别，机器视觉，图像处理的基本知识

    1)主要流程：
    
    比如我们要从一副图片中，识别出验证码；比如我们要从一副图片中，检测并识别出一张
人脸。 大概有哪些步骤呢？

    1.图像采集：验证码呢，就直接通过HTTP抓HTML，然后分析出图片的url，然后下载保存就
可以了。 如果是人脸检测识别，一般要通过视屏采集设备，采集回来，通过A/D转操作，存为
数字图片或者视频频。
    
    2.预处理：检测是正确的图像格式，转换到合适的格式，压缩，剪切出ROI，去除噪音，灰度
化，转换色彩空间这些。
    
    3.检测：车牌检测识别系统要先找到车牌的大概位置，人脸检测系统要找出图片中所有
的人脸（包括疑似人脸）；验证码识别呢，主要是找出文字所在的主要区域。
    
    4.前处理：人脸检测和识别，会对人脸在识别前作一些校正，比如面内面外的旋转，扭曲
等。我这里的验证码识别，“一般”要做文字的切割
    
    5.训练：通过各种模式识别，机器学习算法，来挑选和训练合适数量的训练集。不是训练
的样本越多越好。过学习，泛化能力差的问题可能在这里出现。这一步不是必须的，有些识
别算法是不需要训练的。
    
    6.识别：输入待识别的处理后的图片，转换成分类器需要的输入格式，然后通过输出的类
和置信度，来判断大概可能是哪个字母。识别本质上就是分类。

    2)关键概念：
    
    图像处理：一般指针对数字图像的某种数学处理。比如投影，钝化，锐化，细化，边缘检测，
二值化，压缩，各种数据变换等等。
    
    1.二值化：一般图片都是彩色的，按照逼真程度，可能很多级别。为了降低计算复杂度，
方便后续的处理，如果在不损失关键信息的情况下，能将图片处理成黑白两种颜色，那就最好
不过了。
    
    2.细化：找出图像的骨架，图像线条可能是很宽的，通过细化将宽度将为1，某些地方可能
大于1。不同的细化算法，可能有不同的差异，比如是否更靠近线条中间，比如是否保持联通
行等。
    
    3.边缘检测：主要是理解边缘的概念。边缘实际上是图像中图像像素属性变化剧烈的地
方。可能通过一个固定的门限值来判断，也可能是自适应的。门限可能是图像全局的，也可
能是局部的。不能说那个就一定好，不过大部分时候，自适应的局部的门限可能要好点。被
分析的，可能是颜色，也可能是灰度图像的灰度。

    机器视觉：利用计算机来模式实现人的视觉。 比如物体检测，定位，识别。按照对图像
理解的层次的差别，分高阶和低阶的理解。

    模式识别：对事物或者现象的某种表示方式（数值，文字，我们这里主要想说的是数值），
通过一些处理和分析，来描述，归类，理解，解释这些事物，现象及其某种抽象。

    人工智能：这种概念比较宽，上面这些都属于人工智能这个大的方向。简单点不要过分
学院派的理解就是，把人类的很“智能”的东西给模拟出来协助生物的人来处理问题，特别是
在计算机里面。

三、常见的验证码的破解分析
    
    以http://libcaca.zoy.org/wiki/PWNtcha这里PWNtcha项目中的资料为例分析，各种验
证码的破解。（方法很多，仅仅从我个人乍看之下觉得可行的方法来分析）
    
    1)Authimage

    使用的反破解技巧： 
    
    1.不连续的点组成字符
    2.有一定程度的倾斜

    设计不好的地方：
    
    1.通过纵横的直方图投影，可以找到字幕区域
    2.通过Hough变换，适当的参数，可以找到近似的横线，可以做倾斜矫正
    3.字符串的倾斜式面内的，没有太多的破解难度
    4.字母宽度一定，大小一定
    
    2)Clubic

    使用的反破解技巧： 
    
    1.字符是手写体

    设计不好的地方：
    
    1.检测切割阶段没有任何技术含量，属于设计的比较丑的
    2.只有数字，而且手写体变化不大
    3.表面看起来对识别阶段有难度，仔细分析，发现几乎不用任何高级的训练识别算法，就
固定的招某些像素点是否有色彩就够了

    3)linuxfr.org

    使用的反破解技巧： 

    1.背景颜色块
    2.前景的横线或矩形

    设计不好的地方：

    1.背景色是单一色块，有形状，通过Region-Growth区域增长来很容易把背景给去掉
    2.前景色是标准的线条，色彩单一
    3.字母无粘连
    4.都是印刷体

    4)Ourcolony

    使用的反破解技巧： 
    
    1.设计的太低级，不屑于去评价

    设计不好的地方：

    1.这种验证码，设计的最丑，但还是能把菜鸟搞定，毕竟学计算机的少，搞这个破解的更
少，正所谓隔行如隔山

    5)LiveJournal

    使用的反破解技巧： 

    1.这个设计略微好点，使用个随机噪音，而且作为前景
    2.字母位置粗细都有变化

    设计不好的地方：

    1.字母没有粘连
    2.噪音类型单一
    3.通过在X轴的直方图投影，能准确分割字幕
    4.然后在Y周作直方图投影,能准确定位高度
    5.识别阶段，都是印刷体，简单地很

四、网上的一些高级验证码
    
    1)ICQ

    2)IMDb

    3)MS MVPS

 
    4)MVN Forum

 
    这些类型是被很多人认为比较难得类型，分析一下可以发现，字符检测，定位和分割都不
是难。 唯一影响识别率的是IMDBb和MVPS这两类，字体变形略大。
    
    总体来说，这些类型的破解也不难，很容易做到50%以上的识别率。

五、高级验证码的破解分析
    
    时间关系，我简单介绍如何利用图像处理和模式识别技术，自动识别比较高级的验证码。
(以风头正劲的Google为例)

    1)至少从目前的AI的发展程度看，没有简单的做法能自动处理各种不同的验证码，即使
能力很强，那么系统自然也十分复杂强大。所以，要想在很简单的算法实现比较高级的验证
码破解，必须分析不同验证码算法的特点：

    作为一般的图像处理和计算机视觉，会考虑色彩，纹理，形状等直接的特征，同时也考虑
直方图，灰度等统计特征，还考虑FFT，Wavelet等各种变换后的特征。但最终目标都是
Dimension Reduction（降维）然后利于识别，不仅仅是速度的考虑。从图像的角度看，很多系
统都考虑转换为灰度级甚者黑白图片。
　
    Google的图片可以看出，颜色变化是虚晃一枪，不存在任何处理难度。难度是字体变形
和字符粘连。
　
    如果能成功的分割字符，那么后期识别无论是用SVM等分类算法，还是分析笔顺比划走向
来硬识别，都相对好做。
　
    2)图像处理和粘连分割
    
    代码中的part1目录主要完成图像预处理和粘连字符分割
    001：将图像从jpg等格式转换为位图便于处理
    002：采用Fix/Adaptive的Threshold门限算法，将图片Bin-Value二值化。
    （可用003算法）
    003：采用OSTU分水岭算法，将图片Bin-Value二值化。
    （更通用，大部分时候效果更好）
    005：获取ROI感兴趣的区域。
    006：Edge Trace边缘跟踪。
    007：Edge Detection边界检测。
    008：Thin细化去骨架。
    009：做了一些Tidy整理。
　　（这个一般要根据特定的Captcha算法调整）
    010：做切割,注意图片中红色的交叉点。
    011：将边缘检测和骨干交叉点监测的图像合并。
　　（合并过程可以做分析: 比如X坐标偏移门限分析，交叉点区域纹理分析，线条走势分析，
等等各种方法，找出更可能的切分点和分离后部件的组合管理。）

    代码：（代码质量不高，从其他项目拷贝过来，简单修改的。）

    查看代码(./pstzine_09_01.txt)

    注： 在这里，我们可以看到，基本的部件（字母是分割开了，但可以造成统一字母的被切
割成多个Component。 一种做法是：利用先验知识，做分割； 另外一种做法是，和第二部分的
识别结合起来。 比如按照从左至右，尝试增加component来识别，如果不能识别而且
component的总宽度，总面积还比较小，继续增加。 当然不排除拒识的可能性。 ）

    3)字符部件组合和识别。

    part2的代码展示了切割后的字母组合，和基于svm的字符识别的训练和识别过程。
Detection.cpp中展示了ImageSpam检测过程中的一些字符分割和组合，layout的分析和利用
的简单技术。 而Google的验证码的识别，完全可以不用到，仅做参考。

    SVM及使用：

    本质上，SVM是一个分类器，原始的SVM是一个两类分类的分类器。可以通过1:1或者1:n
的方式来组合成一个多类分类的分类器。 天生通过核函数的使用支持高维数据的分类。从
几何意义上讲，就是找到最能表示类别特征的那些向量（支持向量SV）,然后找到一条线，能最
大化分类的Margin。

    libSVM是一个不错的实现。
    
    训练间断和识别阶段的数据整理和归一化是一样的。 这里的简单做法是：
    
    首先：
    
    #define SVM_MAX  +0.999
    #define SVM_MIN  +0.001

    其次：
    
    扫描黑白待识别字幕图片的每个像素，如果为0(黑色，是字母上的像素),那么svm中该位
置就SVM_MAX,反之则反。

    最后：

    训练阶段，在svm的input的前面，为该类打上标记，即是那一个字母。
    识别阶段，当然这个类别标记是SVM分类出来。

    注意：

    如果是SVM菜鸟，最好找一个在SVM外边做了包装的工具，比如样本选择，交叉验证，核函
数选择这些，让程序自动选择和分析。

    代码：通过ReginGrowth来提取单个单个的字符，然后开始识别。

    查看代码(./pstzine_09_02.txt)

#include "SpamImage.h"
#include "svm-predict.h"
#include <algorithm>
#include <string>
#include <stdio.h>

#ifndef MAX
#define MAX(x,y) (((x) > (y)) ? (x) : (y))
#endif

#ifndef ABS
#define ABS(x) ((x<0) ? (-x) : (x))
#endif

bool x_more_than(const XBlock & m1, const XBlock & m2)
{
	return m1.x < m2.x;
};
void Layout::insert(int i,int x,int y)
{
    layout.insert(std::map<int,Point>::value_type(i,Point(x,y)));
};
void Layout::compute(Config& config,std::map<int,std::string>& lines,std::string& final)
{
	std::map<int,Point>::iterator it;
	std::vector<XBlock> xList;
	//
	int newFile = 1;
	while(layout.size() > 0)
	{
		int startY = -1;
		int startX = -1;
		int startI = -1;
		for(it=layout.begin();it!=layout.end();it++)
		{
			int i = (*it).first;
			Point xy=(*it).second;
			int x=xy.x;
			int y=xy.y;
			if(y > startY || startY == -1)
			{
				startY = y;
				startX = x;
				startI = i;
			}
		}
		//
		for(it=layout.begin();it!=layout.end();it++)
		{
			int i = (*it).first;
			Point xy=(*it).second;
			int x=xy.x;
			int y=xy.y;
		}
		//
		xList.clear();
		for(it=layout.begin();it!=layout.end();it++)
		{			
			int i = (*it).first;
			Point xy=(*it).second;
			int x=xy.x;
			int y=xy.y;
			if(y > startY - 12)
			{
				XBlock xBlock(i,x,y);
				xList.push_back(xBlock);
			}
		}
		//
		std::sort(xList.begin(), xList.end(), x_more_than);
		//
		for(int i=0;i<xList.size();i++)
		{
			XBlock xBlock=xList[i];
			layout.erase(xBlock.i);
			//
			char output='?';
			std::map<int,std::string>::iterator li = lines.find(xBlock.i);
			if(li!=lines.end())
			{
				const char* line = (*li).second.c_str();
				//printf("%s\n",line);
				output = predict_take((char*)line);
				//printf("output1=%c\n",output);
				char temp[2];
				temp[0]=output;
				temp[1]=0;
				final.append(temp);
				//printf("final=%s\n",final.c_str());
			}
			else
			{
				printf("Error case 1\n");
			}
			if(config.trainData)
			{
				char zFile[MAX_PATH];
				sprintf(zFile,"%s\\Z%08d.bmp",config.midstPath,xBlock.i);
				char aFile[MAX_PATH];
				sprintf(aFile,"%s\\A%08d(%c).bmp",config.midstPath,newFile,output);
				rename(zFile,aFile);
				//printf("%s --> %s\n\n",zFile,aFile);
			}
			//
			newFile = newFile + 1;
		}
	}
};

Project::Project(char* fileName)
{
	FILE* fp=fopen(fileName,"r");
	if(!fp)
	{
		printf("Can not load chararters project file.");
		return;
	}
	Charater* oneChar;
	while(true)
	{
		char flag;
		int result = fscanf(fp,"%c",&flag);
		if(result <=0)
		{
			break;
		}
		else
		{
			std::map<char,Charater>::iterator li = chars.find(flag);
			if(li != chars.end())
			{
				oneChar=&((*li).second);
			}
			else
			{
				oneChar=new Charater();
			}
			int size = 0;
			fscanf(fp,"(%d)",&size);
			int data;
			double diff = 0.0;
			std::string line;
			char buff[256];
			for(int i=0;i<size;i++)
			{
				fscanf(fp,"%d:",&data);
				sprintf(buff,"%d",data);
				line.append(buff);
			}			
			//printf("flag=%c  line=%s\n",flag,line.c_str());
			oneChar->lines.push_back(line);
			fscanf(fp,"\n",buff);
		}
		chars.insert(std::map<char,Charater>::value_type(flag,*oneChar));
	}
	if(fp)
	{
		fclose(fp);
		fp=NULL;
	}	
};

RegionGrow::RegionGrow(int maxWidth,int maxHeight)
{
	nMaxWidth = maxWidth;
	nMaxHeight = maxHeight;
	//
	pucRegion = new unsigned char[maxWidth * maxHeight];
	//
	pbMirror = new bool*[maxHeight];
	for(int cy=0;cy<maxHeight;cy++)
	{
		pbMirror[cy] = new bool[maxWidth];
		for(int cx=0;cx<maxWidth;cx++)
		{			
			pbMirror[cy][cx] = true;
		}
	}
	//
	pnGrowQueueX = new int[maxWidth*maxHeight];
	pnGrowQueueY = new int[maxWidth*maxHeight];
};
RegionGrow::~RegionGrow()
{
	delete []pnGrowQueueX;
	delete []pnGrowQueueY;
	pnGrowQueueX = NULL ;
	pnGrowQueueY = NULL ;
	//
	for (int dy=0;dy<nMaxHeight;dy++) 
	{
		delete[] pbMirror[dy];
	}
	delete[] pbMirror;
	//
	delete []pucRegion;
	pucRegion = NULL  ;
};

bool RegionGrow::isNeighbor(RGBQUAD sourceCS,RGBQUAD targetCS,int average)
{
	int sourceGray=(sourceCS.rgbRed+sourceCS.rgbGreen+sourceCS.rgbBlue)/3.0;
	int targetGray=(targetCS.rgbRed+targetCS.rgbGreen+targetCS.rgbBlue)/3.0;	
	if( abs(sourceGray - targetGray) < 256/4 )
	{
		return true;
	}
	else
	{
		return false;
	}
};
void RegionGrow::recognizeSave(std::map<int,std::string> &lines,unsigned char* pUnRegion,int nWidth,int nHeight,int nLeftX,int nLeftY,int nRightX,int nRightY,Config& config,int saveName,char* line)
{
	if(line != NULL)
	{
		sprintf(line,"%d ",saveName);
		int index = 1;
		for(int y=nLeftY;y<=nRightY;y++)
		{
			for(int x=nLeftX;x<=nRightX;x++)
			{
				if(pUnRegion[y*nWidth+x] == 1)
				{
					sprintf(line,"%s%d:%lf ",line,index++,SVM_MAX);
				}
				else
				{
					sprintf(line,"%s%d:%lf ",line,index++,SVM_MIN);
				}
			}
		}
		lines.insert(std::map<int,std::string>::value_type(saveName,line));
	}
    //
	if(config.trainData)
	{
		CxImage image;
		int nWidthROI = nRightX-nLeftX+1;
		int nHeightROI = nRightY-nLeftY+1;
		image.Create(nWidthROI,nHeightROI,24,CXIMAGE_SUPPORT_BMP);
		RGBQUAD rgbSet;
		for(int sy=nLeftY;sy<=nRightY;sy++)
		{
			for(int sx=nLeftX;sx<=nRightX;sx++)
			{
				if(pUnRegion[sy*nWidth+sx] == 1)
				{
					rgbSet.rgbRed=255;
					rgbSet.rgbGreen=0;
					rgbSet.rgbBlue=0;
				}
				else
				{
                    rgbSet.rgbRed=0;
					rgbSet.rgbGreen=0;
					rgbSet.rgbBlue=0;
				}
				image.SetPixelColor(sx-nLeftX,sy-nLeftY,rgbSet);
			}
		}
		char file[MAX_PATH];
		if(line == NULL)
		{
			static int notText = 1;
			sprintf(file,"%s\\N%08d.bmp",config.midstPath,notText++);
		}
		else
		{
		    sprintf(file,"%s\\Z%08d.bmp",config.midstPath,saveName);
		}
		image.Save(file,CXIMAGE_SUPPORT_BMP);
	}
}
void RegionGrow::runRegionGrow(CxImage* cxImage,int nWidth,int nHeight,Config& config,Project &project,std::string& final) 
{
#define ROI_X_LEFT  1
#define ROI_X_RIGHT  1
#define ROI_Y_LEFT  1
#define ROI_Y_RIGHT  1
	
	//static int nDn = 4;
	//static int nDx[]={-1,+0,+1,+0};
	//static int nDy[]={+0,+1,+0,-1};
	
    static int nDn = 8;
	static int nDx[]={-1,+0,+1,+0, -1,-1,+1,+1};
	static int nDy[]={+0,+1,+0,-1, +1,-1,+1,-1};
	
    //static int nDn = 20;
	//static int nDx[]={-1,+0,+1,+0, -1,-1,+1,+1, -2,+2,-2,+2,-2,+2,+0,+0,-1,-1,+1,+2};
	//static int nDy[]={+0,+1,+0,-1, +1,-1,+1,-1, +0,+0,+1,+1,-1,-1,+2,-2,+2,-2,+1,-2};
	
	if(nWidth <= ROI_X_LEFT+ROI_X_RIGHT || nHeight <= ROI_Y_LEFT+ROI_Y_RIGHT)
	{
		printf("The image must be bigger than %d x %d (width * height)!\n",(ROI_X_LEFT+ROI_X_RIGHT),(ROI_Y_LEFT+ROI_Y_RIGHT));
		exit(1);
	}

	int nLocAvg = 0;
	for(int cy=nHeight-ROI_Y_RIGHT;cy>ROI_Y_LEFT;cy--)
	{
		for(int cx=ROI_X_LEFT;cx<nWidth-ROI_X_RIGHT;cx++)
		{
            RGBQUAD rgbCS = cxImage->GetPixelColor(cx,cy);
			RGBQUAD yuvCS = CxImage::RGBtoXYZ(rgbCS); 
			int gray = (yuvCS.rgbRed + yuvCS.rgbGreen + yuvCS.rgbBlue) / 3.0;
			RGBQUAD gryCS;
			gryCS.rgbRed = gray;
			gryCS.rgbGreen = gray;
			gryCS.rgbBlue = gray;
			cxImage->SetPixelColor(cx,cy,gryCS);			
			nLocAvg = nLocAvg + gray;
		}
	}
	nLocAvg /= ( (nHeight-ROI_Y_RIGHT-ROI_Y_LEFT) * (nWidth-ROI_X_RIGHT-ROI_X_LEFT) ) ;

	int nPixel = 0;
	int nLeftX = 0;
	int nLeftY = 0;
	int nRightX = 0;
	int nRightY = 0;
    int debugFile=1;
	std::map<int,std::string> lines;
	
	for(int my=nHeight-ROI_Y_RIGHT;my>ROI_Y_LEFT;my--)
	{
		for(int mx=ROI_X_LEFT;mx<nWidth-ROI_X_RIGHT;mx++)
		{
			if(pbMirror[my][mx])
			{
				memset(pucRegion,0,sizeof(unsigned char)* nWidth * nHeight);
				nPixel = 1;
                nLeftX = mx;
				nLeftY = my;
				nRightX = mx;
				nRightY = my;
				int nStart = 0 ;
				int nEnd   = 0 ;
				pnGrowQueueX[nEnd] = mx;
				pnGrowQueueY[nEnd] = my;
				int nCurrX ;
				int nCurrY ;
				int xx;
				int yy;
				int k ;
				while (nStart<=nEnd)
				{
					nCurrX = pnGrowQueueX[nStart];
					nCurrY = pnGrowQueueY[nStart];
					for (k=0;k<nDn;k++)	
					{	
						xx = nCurrX+nDx[k];
						yy = nCurrY+nDy[k]; 
						if ((xx < nWidth) && (xx>=0) && (yy<nHeight) && (yy>=0) && (pucRegion[yy*nWidth+xx]==0) )
						{
							if(isNeighbor(cxImage->GetPixelColor(xx,yy),cxImage->GetPixelColor(nCurrX,nCurrY),nLocAvg))
							{
								nEnd++;
								pnGrowQueueX[nEnd] = xx;
								pnGrowQueueY[nEnd] = yy;
								pucRegion[yy*nWidth+xx] = 1;
								nPixel++;
								if(xx < nLeftX) 
								{
									nLeftX=xx;
								}
								else if(xx > nRightX)
								{
									nRightX=xx;
								}
								if(yy < nLeftY) 
								{
									nLeftY=yy;
								}
								else if(yy > nRightY)
								{
									nRightY=yy;
								}
                                pbMirror[yy][xx] = false;
								pbMirror[nCurrY][nCurrX] = false;   //FAST
							}
						}
					}
					nStart++;
				}		
				const static int TOO_SMALL = 11;
				const static int TOO_HIGH = 19;
				const static int TOO_SHORT = 6;				
				if(nPixel < TOO_SMALL)   //面积太小
				{
					//printf("xxx: found no-text region case: too small (pixels: %d<%d)\n",nPixel,TOO_SMALL);
					//recognizeSave(lines,pucRegion,nWidth,nHeight,nLeftX,nLeftY,nRightX,nRightY,config,debugFile,NULL);
					continue;
				}
				else if(nRightY-nLeftY > TOO_HIGH)  //太高
				{
					//printf("xxx: found no-text region case: too high (height: %d>%d)\n",nRightY-nLeftY,TOO_HIGH);
					//recognizeSave(lines,pucRegion,nWidth,nHeight,nLeftX,nLeftY,nRightX,nRightY,config,debugFile,NULL);
					continue;
				}
				else if(nRightY-nLeftY < TOO_SHORT)  //太矮
				{
					//printf("xxx: found no-text region case: too short (height: %d<%d)\n",nRightY-nLeftY,TOO_SHORT);
					//recognizeSave(lines,pucRegion,nWidth,nHeight,nLeftX,nLeftY,nRightX,nRightY,config,debugFile,NULL);
					continue;
				}
				else if( (nRightX-nLeftX) >= (nRightY-nLeftY) * 1.6 )  //宽大于高
				{
					//printf("???: found merged block: (%d,%d) --> (%d,%d)\n",nLeftX,nLeftY,nRightX,nRightY);
					//预切
					int nWidthROI = nRightX-nLeftX+1;
					int nHeightROI = nRightY-nLeftY+1;
					int aLeftY=nLeftY;
					int aRightY=nRightY;
					int aLeftX=nLeftX;
					int aRightX=nLeftX+nHeightROI-1;   // *1.1
					while(true)
					{
						int aW=aRightX-aLeftX+1;
						int aH=aRightY-aLeftY+1;
						char* line = new char[aW*aH*32];
						memset(line, 0, aW*aH*32);
						recognizeSave(lines,pucRegion,nWidth,nHeight,aLeftX,aLeftY,aRightX,aRightY,config,debugFile,line);
						layout.insert(debugFile,nLeftX,nLeftY);
						debugFile = debugFile + 1;
						//识别
						char output = predict_take(line);
						delete line;
						//X投影 (上轮廓 + 下轮廓)
						int* projectX =  new int[aW];
						int* projectXScaled =  new int[aW];
						for(int px1=aLeftX,index=0;px1<=aRightX;px1++,index++)
						{
							projectX[index] = 0;
							for(int py1=aLeftY;py1<=aRightY;py1++)
							{
								if(pucRegion[py1*nWidth+px1] == 1)
								{
									projectX[index] = projectX[index]+1;
								}
							}
							//5-scale
							projectXScaled[index] = (int)( (double)projectX[index] / (double)aH * 5.0 );
						}
						//轮廓
						Charater oneChar;
						std::map<char,Charater>::iterator li = project.chars.find(output);
						if(li != project.chars.end())
						{
							oneChar=(*li).second;			
						}
						int matchedSize = 0;
						double matchedDiff = aW * 5.0;		
						for(int c=0;c<oneChar.lines.size();c++)
						{
							const char* line=oneChar.lines[c].c_str();
							int size=strlen(line);
							double diff = 0.0;
							for(int i=0;i<size && i<aW;i++)
							{
								char temp[2];
								temp[0]=line[i];
								temp[1]=0;
								int data=atoi(temp);
								diff = diff + abs(projectXScaled[i]-data);
								//printf("project=%d  current=%d    diff=%lf\n",projectXScaled[i],data,diff);
							}
							//需要设计这里的评价函数 size/aW, size/matchedSize, diff/matchedDiff
							if(diff < matchedDiff)
							{
								matchedDiff = diff;
								matchedSize = size;
							}
						}
						delete projectXScaled;
						delete projectX;
						//printf("matchedSize=%d  matchedDiff=%lf\n",matchedSize,matchedDiff);
						//
						if(matchedSize == 0)
						{
							matchedSize = nHeightROI;
						}
						aLeftX=aLeftX+matchedSize;
						aRightX=aLeftX+nHeightROI-1;	//*1.1
						if(aLeftX >= nRightX-1)
						{
							break;
						}
						if(aRightX > nRightX)
						{
							aRightX=nRightX;
						}
					}				
				}
				else
				{
					//printf("vvv: found ok-text region case: other condition\n");
					int aW=nRightX-nLeftX+1;
					int aH=nRightY-nLeftY+1;
					char* line = new char[aW*aH*32];
					memset(line, 0, aW*aH*32);					
					RegionGrow::recognizeSave(lines,pucRegion,nWidth,nHeight,nLeftX,nLeftY,nRightX,nRightY,config,debugFile,line);
					layout.insert(debugFile,nLeftX,nLeftY);
					debugFile =  debugFile + 1;
					delete line;
				}
			}
		}
	}
    layout.compute(config,lines,final);
};

六、对验证码设计的一些建议    1.在噪音等类型的使用上，尽力让字符和用来混淆的前景和背景不容易区分。尽力让坏人（噪音）长得和好人（字母）一样。        2.特别好的验证码的设计，要尽力发挥人类擅长而AI算法不擅长的。 比如粘连字符的分割和手写体（通过印刷体做特别的变形也可以）。 而不要一味的去加一些看起来比较复杂的噪音或者其他的花哨的东西。即使你做的足够复杂，但如果人也难识别，显然别人认为你是没事找抽型的。        3. 从专业的机器视觉的角度说，验证码的设计，一定要让破解者在识别阶段，反复在低阶视觉和高阶视觉之间多反复几次才能识别出来。 这样可以大大降低破解难度和破解的准确率。七、个人郑重申明        1.这个问题，本身是人工智能，计算机视觉，模式识别领域的一个难题。我是虾米，菜得不能再菜的那种。作为破解者来说，是出于劣势地位。要做的很好，是很难得。总体来说，我走的是比较学院派的线路，能真正的破解难度比较高的验证码，不同于网上很多不太入流的破解方法。我能做的只有利用有限的知识，抛砖引玉而已。 很多OCR的技术，特别是离线手写体中文等文字识别的技术，个人了解有限的很，都不敢在这里乱写。    2.希望不要把这种技术用于非法用途。-EOF-

cv2 python_【cv2模块 python3】正定幢 cv2 python
Pythonopencv模块cv2安装和部分函数使用前几天做了一下验证码识别，在这里分享一下用到的opencv模块cv2部分函数的使用方法，也是给自己加深一下记忆。一、cv2模块安装在这里提醒一下这里有坑欧你如果直接用pipinstallcv2会报错欧往下看解决办法可以通过pipinstallopencv-python来进行安装如果pip不能安装还可以通过https://pypi.tuna.tsi
顶像滑块验证码识别平译虹
顶像滑块验证码识别筘【1119372179】暮霭，目断武陵溪，往事难追。好事近韩元吉凝碧旧池头，一听管弦凄切。多少梨园声在，总不堪华发。杏花无处避春愁，也傍野烟发。惟有御沟声断，似知人呜咽。瑞鹤仙袁去华郊原初过雨，风数叶零乱，风定犹舞。斜阳挂深树，映浓愁浅黛。遥山媚妩。来时旧路，尚岩花、娇黄半吐。到今日惟有、溪边流水，见人如故。无语，邮亭深静，下马还寻，旧曾题处。无聊倦旅，伤离恨，最愁苦。纵收香藏
2024年最全Python使用打码平台进行识别验证码_python验证码识别文字坐标 2401_84584831 程序员 python 开发语言
打码平台介绍一般使用超级鹰或打码兔的打码平台。超级鹰介绍打开http://www.chaojiying.com/contact.html注册用户，生成软件ID下载python的demo文件查看打码类型使用方法逻辑实现1.获取需要识别的图片在获取需要的识别的
python从入门到精通（十五）：python爬虫完整学习大纲 HACKNOE python 爬虫学习
一、基础知识爬虫的基本概念和工作原理。HTTP协议和网页结构。Python爬虫开发的基础库，如requests、BeautifulSoup等。常见的反爬虫机制和应对方法。二、爬虫逆向的技术代理服务器和IP封锁突破。用户代理和请求头模拟。JavaScript解析和执行。验证码识别和破解。动态网页抓取和爬虫框架。三、数据抓取和处理数据抓取的技巧和策略。数据清洗和预处理。数据存储和数据库操作。数据分析和
Python爬虫项目（附源码）70个Python爬虫练手实例！硬核Python 职业与发展 python 编程 python 爬虫开发语言
文章目录Python爬虫项目70例（一）：入门级Python爬虫项目70例（二）：pyspiderPython爬虫项目70例（三）：scrapyPython爬虫项目70例（四）：手机抓取相关Python爬虫项目70例（五）：爬虫进阶部分Python爬虫项目70例（六）：验证码识别技术Python爬虫项目70例（七）：反爬虫技术读者福利1、Python所有方向的学习路线2、Python课程视频3、精
Nodejs Playwright 2Captcha 验证码识别实现自动登陆 openHacking
原文：https://lwebapp.com/zh/post/bypass-captcha需求日常工作当中，为了提高工作效率，我们可能会写脚本来自动执行任务。有些网站因为需要用户登陆，所以脚本的自动登陆功能必不可少。不过我们在登陆网站的时候经常会出现验证码，验证码的目的就是为了防止机器登陆、自动化脚本操作，那么有没有办法让脚本能自动识别验证码实现登陆呢？接下来我以B站为例给大家讲解下，如何解决自动
百度百家号旋转验证码识别研究 Dxy1239310216 图像处理验证码识别 Python python 图像识别旋转验证码深度学习
最近研究了一下图像识别，一直找到很好的应用场景，今天我就发现可以用百度的旋转验证码来做一个实验。没想到效果还挺好，下面就是实际的识别效果。1、效果演示2、如何识别2.1准备数据集首先需要使用爬虫，对验证码图片进行采集，尽量每一种类型都要采集到。2.2图像矫正接下来对采集的数据进行人工校正2.3数据清洗（1）对数据进行进行旋转，达到增加数据量的目的。（2）对数据进行灰度化处理，将三维图片降为二维。（
Java 验证码识别（2）Java OpenCV 的使用灰度、二值化、腐蚀膨胀去干扰线小百菜 java java 去干扰线二值化灰度机器学习
上一篇使用Tess4J进行OCR识别，虽然能识别一些简单的验证码，但是验证码有干扰线就识别不了。这一篇讲下如何使用OpenCV去除干扰线。1、maven依赖org.bytedecojavacv-platform1.5.5OpenCV用C++语言编写，提供了接口，我这里使用javacv它里面就有opencv，不过这样依赖会将所有平台的jar包都拉取下来，项目接近1G大小，可以看下我的另外一篇博文精简
【旧文更新】【优秀毕设】人脸识别打卡/签到/考勤管理系统（OpenCV+最简基本库开发、可移植树莓派扩展网络图像推流控制验证码及Excel邮件发送等功能）网易独家音乐人Mike Zhou opencv 嵌入式 iot 物联网人工智能计算机视觉树莓派
【旧文更新】【优秀毕设】人脸识别打卡/签到/考勤管理系统（OpenCV+最简基本库开发、可移植树莓派扩展网络图像推流控制验证码及Excel邮件发送等功能）文章目录关于旧文新发毕设结构主页面验证码识别效果管理页面人脸信息采集管理实时数据更新签到结果邮件发送网络前端效果实时图像推流附录：列表的赋值类型和py打包列表赋值BUG复现代码改进优化总结py打包附录：关于旧文新发关于旧文新发为何要进行旧文新发？
基于Python实现神经网络验证码识别系统依然风yrlf python 神经网络深度学习 opencv 人工智能计算机视觉
首先需要准备训练数据集、设计神经网络模型、训练模型以及最后的验证码识别。代码很简单，但需要慢慢研读，这个是卷积神经网络，运行时间比较长，可以自己调节参数。importosos.environ["PATH"]+=os.pathsep+'C:/ProgramFiles(x86)/Graphviz2.38/bin/'importstring,randomfromcaptcha.imageimportIm
使用深度学习进行验证码识别系统搭建（附项目资源）粥粥坠腻害人工智能 python 深度学习深度学习人工智能 tensorflow keras 图像处理 cnn 迁移学习
目录开发环境1项目介绍2导入所需库并定义超参数3验证码数据生成4构建数据管道5模型架构设计6模型训练及调参7模型评估与预测8改进策略9总结与展望项目资源开发环境作者：嘟粥yyds时间：2023年7月21日集成开发工具：PyCharmProfessional2021.1和GoogleColab集成开发环境：Python3.10.6第三方库：tensorflow-gpu2.10.0、numpy、mat
Web UI自动化-获取接口返回数据 Jalinyz
场景：在进行UI自动化测试时解决验证码进行登录的方法有很多，比如：设置万能验证码手动登录后设置cookies绕过免登录进行切图，使用pytesseract和pillow实现验证码识别（这个只能解决一些不太复杂的验证码问题，识别率很低）切图后调用第三方AI库识别验证码（识别率高但是要花钱~~）除了以上我们常用的方法之外，这里给大家介绍另外一种方法，通过获取接口返回数据拿到验证码code解决：使用Br
JAVA用tess4j识别复杂的验证码，自定义字库，计算题验证码，jTessBoxEditor，tess4j，验证码识别 june-Dai Yi java tess4j jTessBoxEditor 验证码识别计算题验证码识别
JAVA用tess4j识别复杂的验证码，自定义字库，计算题验证码场景JAVA用tess4j识别文本MAVEN依赖traineddata文件下载识别英文识别中文JAVA用tess4j识别验证码常见验证码的类型识别自定义字库，提高识别率下载jTessBoxEditor解压添加环境变量运行准备素材合并PNG为tif文件生成box文件使用jTessBoxEditor工具对tif文件进行校准校正生成tr文件
验证码识别工具一键快速识别 2301_78146980 python opencv 开发语言
---------------------------------------------------------------------------百度搜索：套套图像识别---------------------------------------------------------------------------随着互联网的不断发展和应用程序的普及，许多网站和应用程序采用图像验证码技术来保
使用Python PIL库实现简单验证码的去噪处理梦想编程家小枫
想要识别验证码，收集足够多的样本后，首先要做的就是对验证码原始图片进行处理，对验证码识别分类之前，一般包括：将彩色图片转换成灰度图、将灰度图二值化和去除噪点三个基本过程。这里仅以比较简单的验证码为例，介绍一下如何通过Python的PIL库对图片去噪处理。首先看一下未经处理的验证码图片：对图片处理主要使用了PIL库的Image类。1、彩色图片转换成灰度图首先使用Image的open方法打开上面的图片
Python 3.6 版本 Pytesseract 图像验证码识别 MR_LiY
本文首先先说下问题，在代码中引入Pytesseract块时，总是出现错误程序代码很简单如下：fromPILimportImageimportpytesseracttext=pytesseract.image_to_string(Image.open("pic.gif"))print(text)结果呢，肯定是报错，而且这个错误死活过不去File"D:\ProgramFiles\Python36\li
[转]用python爬虫抓站的一些技巧总结 juunnry python web crawler
来源网站：http://www.pythonclub.org/python-network-application/observer-spider学用python也有3个多月了，用得最多的还是各类爬虫脚本：写过抓代理本机验证的脚本，写过在discuz论坛中自动登录自动发贴的脚本，写过自动收邮件的脚本，写过简单的验证码识别的脚本，本来想写googlemusic的抓取脚本的，结果有了强大的gmbox，
百度贴吧推广大师九千营销
网页搜索贴吧推广大神是一款全自动的百度搜索贴吧推广方法，贴吧业务的可以加Q99382744，Q28110454，微信yisi221官网：www.xtyinliu.cn、包含注册帐号、账户激活、发帖子回贴文章采集、文章原创文章内容、关注钟爱百度贴吧、提升等级、全网推广、回贴推广营销这种不一样功效。自动式换IP，可以运用ADSL方法，分销策略，有线路由器换IP方法，方便使用。此外适用验证码识别，模拟仿
滑块验证码识别代码分享 Dxy1239310216 验证码识别 python 深度学习机器学习
平时我们开发爬虫会遇到各种各样的滑动验证码，如下图所示：为了解决这个问题，我写了一个通用的滑块验证码识别代码，主要是分析图片，然后计算出滑块滑动的像素距离。但是像素距离大多数情况下都不会等于滑动距离，所以需要进行转换。滑动距离的计算我之前写了一个博客，可以点击查看《抖音滑块验证码滑动距离计算_滑动验证码验证判断距离还是对齐-CSDN博客》最后送上缺口的识别代码：importbase64import
滑块验证码识别代码分享 Dxy1239310216 验证码识别 Python python 神经网络深度学习人工智能
平时我们开发爬虫会遇到各种各样的滑动验证码，如下图所示：为了解决这个问题，我写了一个通用的滑块验证码识别代码，主要是分析图片，然后计算出滑块滑动的像素距离。但是像素距离大多数情况下都不会等于滑动距离，所以需要进行转换。滑动距离的计算我之前写了一个博客，可以点击查看《抖音滑块验证码滑动距离计算_滑动验证码验证判断距离还是对齐-CSDN博客》最后送上缺口的识别代码：importbase64import
ddddocr验证码识别模块林小果1 python爬虫爬虫 python
ddddocr验证码识别模块简介ddddocr是一个基于深度学习的OCR（OpticalCharacterRecognition，光学字符识别）工具，主要用于中文场景文字识别。能够对图片中的文字进行识别并提取出来。ddddocr模块主要特点包括：适用于中文场景：ddddocr主要针对中文进行优化，对于中文的识别准确率较高。基于深度学习：ddddocr使用深度学习模型进行文字识别，能够有效处理复杂的
Python验证码识别 Python玩编程 Python python list django virtualenv pycharm
大致介绍在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题，现在的验证码大多分为四类：1、计算验证码2、滑块验证码3、识图验证码4、语音验证码这篇博客主要写的就是识图验证码，识别的是简单的验证码，要想让识别率更高，识别的更加准确就需要花很多的精力去训练自己的字体库。识别验证码通常是这几个步骤：1、灰度处理2、二值化3、去除边框（如果有的话）4、降噪5、切割字符或者倾斜度矫正6、
验证码识别工具——Pkav HTTP Fuzzer 乌鸦安全工具乌鸦安全验证码自动化网络安全
微信公众号：乌鸦安全扫取二维码获取更多信息！01背景知识在很多时候，当对搜集的Web后台地址等进行用户名和密码的暴力破解时，大部分后台都有验证码进行防护，对于一般的Burpsuite工具是无法直接识别验证码的，除非安装了识别验证码的插件，这次来介绍一款经典验证码暴力破解工具：PkavHTTPFuzzerPkavHTTPFuzzer是一款非常优秀的验证码识别工具。注：PkavHTTPFuzzer针对
基于yolov5模型的200种鸟类检测识别分析系统 Together_CZ 完整源码项目实战 YOLO
该专栏仅支持购买本专栏的同学学习使用，不支持以超级会员、VIP等形式使用，请谅解！【购买专栏后可选择其中一个完整源码项目】本文是我新开设的专栏《完整源码项目实战》的第十三篇全源码文章，包含数据集在内的所有资源，可以实现零基础上手入门学习。前面系列文章链接如下，感兴趣可以移步自行阅读即可：基于CNN的动物识别系统[完整实战源码]基于CNN的字符型验证码识别系统设计开发[完整源码实战]CNN基于肺部C
渗透测试-SQL注入-登录漏洞-Burp爆破 chengstery 渗透测试 SQL注入安全 web安全网络学习
渗透测试-SQL注入-登录漏洞-Burp爆破爆破基于Baidu-OCR的验证码识别Attacktype的四种爆破类型ResourcePool资源池（并发线程设置）爆破在我们之前的登录页面中，因为没有设置登录失败的次数限制，所以可以通过Burp爆破的方式进行登录，从而获取到登录的用户名和密码，进而登录到系统中。基于Baidu-OCR的验证码识别使用插件captcha-killerAttacktype
2021年11月最新搜狗验证码识别，6位全对正确率高达96% Dxy1239310216 验证码识别机器学习 python keras cnn 图像识别
训练数据准备标记数据是最花费时间的事情。最开始手工标记验证码1万条，训练后正确率在50%左右。然后写写代码使用这种低正确率的去自动标记。使用搜狗自动验证，来实现自动标记。逐渐积累数据量，后期只需要人工标记错误验证码就行。这样可以大大减少人工标记量。验证码资源下载地址（100%正确，全部通过搜狗验证）：2021年11月最新搜狗验证码7.3万，6位全对正确率高大96%-机器学习文档类资源-CSDN下载
百度百家号旋转验证码识别代码分享 Dxy1239310216 图像处理 Python 验证码识别计算机视觉 python opencv 人工智能爬虫网络爬虫
最近研究了一下图像识别，一直找到很好的应用场景，今天我就发现可以用百度的旋转验证码来做一个实验。没想到效果还挺好，下面就是实际的识别效果。1、效果演示2、如何识别2.1准备数据集首先需要使用爬虫，对验证码图片进行采集，尽量每一种类型都要采集到。2.2图像矫正接下来对采集的数据进行人工校正2.3数据清洗（1）对数据进行进行旋转，达到增加数据量的目的。（2）对数据进行灰度化处理，将三维图片降为二维。（
大创项目推荐题目：基于python的验证码识别 - 机器视觉验证码识别 laafeer python
文章目录0前言1项目简介2验证码识别步骤2.1灰度处理&二值化2.2去除边框2.3图像降噪2.4字符切割2.5识别3基于tensorflow的验证码识别3.1数据集3.2基于tf的神经网络训练代码4最后0前言优质竞赛项目系列，今天要分享的是基于python的验证码识别该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-sen
7.图像验证码与cookie操作 Suyuoa 爬虫笔记 python
有很多第三方的公司可以解决图像验证码问题，但是人家都需要费用，比如云码验证码识别价格_验证码识别费用多少钱-云码超级鹰超级鹰验证码识别-专业的验证码云端识别服务,让验证码识别更快速、更准确、更强大如果不需要搞定太专业的验证码，我们可以自己搞定一下比如paddleocr的基本使用-CSDN博客我们后面都是通过这个服务来识别验证码验证码可能与很多的因素相关，比如请求验证码的时候发送查询字符串或是与co
让测试人头疼的web自动化之验证码识别彻底解决方案测试小贝自动化安全性测试测试用例测试工具 postman 单元测试 jmeter
验证码识别解决方案对于web应用程序来讲，处于安全性考虑，在登录的时候，都会设置验证码，验证码的类型种类繁多，有图片中辨别数字字母的，有点击图片中指定的文字的，也有算术计算结果的，再复杂一点就是滑动验证的。诸如此类的验证码，对我们的系统增加了安全性的保障，但是对于我们测试人员来讲，在自动化测试的过程中，无疑是一个棘手的问题。1、web自动化验证码解决方案一般在我们测试过程中，登录遇到上述的验证码的
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

如何识别高级的验证码

你可能感兴趣的:(验证码识别)