2021-01-23

爬虫之验证码识别–快识别使用教程

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

    • 爬虫之验证码识别--快识别使用教程
  • 简介
  • 一、快识别注册及简单介绍
  • 二、使用说明
    • 1.python使用
  • 总结


简介

在一些爬虫模拟登陆请求的时候,除了一些基本的信息参数外,验证码也是必不可少的。
关于验证码的处理方式通常有以下几种方式:
1.人工识别 ## 效率低、识别难道大(譬如12306)
2.打码平台 ## 省心高效,缺点是花钱
3.机器学习 ## 门槛高,当然也可以找开源项目用

一、快识别注册及简单介绍

作为众多打码平台之中的一个,我觉得它好处就是简单、低价
注册链接快识别
2021-01-23_第1张图片
其中带’*‘号的是必填参数,当然我的推荐码是(8e0c305854654d60a8bda36f7d5007cc)
项目价格
2021-01-23_第2张图片
充值
2021-01-23_第3张图片
价格十分的低普通的图片字符验证1块钱500次,可以充值1元测试(只支持支付宝充值)

二、使用说明

这里是官方发开文档的接口说明
http://www.kuaishibie.cn/docs/index.html?spm=null
还有一个是最新的接口文档
https://shimo.im/docs/yXJvpVQDRTpDxp8c
接口里包括常用的爬虫编程语言python,Java,易语言等等
可能接口会更新 建议使用最近的接口文档提供的识别接口

1.python使用

2021-01-23_第4张图片
改进之后的接口及说明`

import base64
import json
import requests


def base64_api(uname, pwd, img):
    with open(img, 'rb') as f:
        base64_data = base64.b64encode(f.read())
        b64 = base64_data.decode()
    data = {
     "username": uname, "password": pwd, "image": b64}
    result = requests.post("http://api.ttshitu.com/base64", json=data).json()
    if result['success']:
        return result["data"]["result"]
    else:
        return result["message"]


if __name__ == "__main__":
    img_path = 'yam.jpg'
    result = base64_api(uname='用户名', pwd='密码', img=img_path)
    print(result)

实际的过程就是将本地的验证码图片以post请求发送给网站接口,其中postdata需要为base64 格式的以json 传入接收也是json格式的最后取取出

总结

简简单单的使用,还需要根据具体的需要改下。
学习验证码的视频bilibili

你可能感兴趣的:(python,爬虫)