node.js 爬虫 登录验证码_nodeJS实现识别验证码(tesseract-ocr+GraphicsMagick)
背景最近在写一个爬虫的小工具,卡在登录这里。想爬的网站需要登录才能获取数据,登录又需要输入验证码。好在验证码是简单的验证码,还可以自己识别试试。需求分析1、保存验证码图片2、识别验证码3、对识别的验证码进行人工校准功能实现1、保存验证码图片虽然每个网站不一定一样,但是大体的思路是差不多的,我要爬取的网站是后台返回了一个验证码图片和cookie,所以我们需要把这两个东西都存下来。这里用到了node中