nodejs识别验证码,图片验证码

最近做自动化遇到验证码的问题,之前识别字母和数字验证码都是使用tesseract.js,识别率都不错,中文也可以识别不过识别率不高。
我自己平常使用识别验证码的方式主要有三种,
  • 一种是上面说的tesseract.js,
  • 另一种骚操作就是使用通用文字识别工具,即OCR,很多云计算公司都提供了OCR识别。如果遇到中文验证码,使用OCR还是比较方便的。
  • 还有一种就是用node去调用Python的验证码识别程序
不过这次遇到的验证码字母都进行了扭曲,且字母之间有重叠,使用tesseract.js识别率比较低,自己又不想进行识别训练。。。

在这里插入图片描述

上网找了一下验证码识别平台,试了斐斐打码和超级鹰,识别率都很高。超级鹰提供了nodejs的demo,不过不能正常运行,只能自食其力了。
//recongizeCode.js 
var request = require('request'),
	fs   	 = require('fs');

function recongizeCode(pathName){//pathName = './1.jpg'
	var file_base64 = fs.readFileSync(pathName,'base64');

	const formData = {
		'user': 'usercount',
		'pass': 'password',
		'softid':'id',  //软件ID 可在用户中心生成
		'codetype': '3004',  //验证码类型 http://www.chaojiying.com/price.html 选择
		'file_base64': file_base64
	};
	return new Promise(function(resolve,reject){
		request({
		    url: 'http://upload.chaojiying.net/Upload/Processing.php',
		    method: "POST",
		    headers: {
		        "content-type": "application/x-www-form-urlencoded",
		    },
		    body: JSON.stringify(formData)
		}, function(error, response, body) {
		    if (!error && response.statusCode == 200) {
		    	resolve(JSON.parse(body)['pic_str'])
		        console.log(body) // 请求成功的处理逻辑
		    }
		});
	})
}
module.exports = recongizeCode
//调用方式
recongizeCode('./1.jpg')

你可能感兴趣的:(前端开发)