Python爬虫学习(十一)下载验证码图片

本文是继前面爬取登录教务系统时,遇到验证码登录的遗留问题探讨!

思路: 下载登录教务系统时的图片,打开读取,人工识别,手动写入再结合账户登录。

目录

  • 一、获取验证码图片
  • 二、带验证码图片的request模拟登录
    • 1、分析
    • 2、模拟登陆
    • 3、验证结果

一、获取验证码图片

  • 进入 教务系统
    Python爬虫学习(十一)下载验证码图片_第1张图片
  • 找到验证码位置:http://jwgl.cqjtu.edu.cn/jsxsd/verifycode.servlet?t=0.33489178693749055
    (每次点击都会自动更新)
    Python爬虫学习(十一)下载验证码图片_第2张图片
  • 我们目标是下载图片,如图:
    Python爬虫学习(十一)下载验证码图片_第3张图片
    源码:
#!/usr/bin/env python3
# -*- coding:utf-8 -*-

import requests  # http客户端
import os  # 创建文件夹
from PIL import Image

os.makedirs('./image/', exist_ok=True)
IMAGE_URL = "http://jwgl.cqjtu.edu.cn/jsxsd/verifycode.servlet?t=0.33489178693749055"


def request_download():
    r = requests.get(IMAGE_URL)
    with open('./image/img.png', 'wb') as f:
        f.write(r.content)


try:
    request_download()
    print('download img')
    im = Image.open('./image/img.png')
    im.show()
except:
    print('download img error!')

二、带验证码图片的request模拟登录

1、分析

我们可以发现登录系统需要:
[a:insert(写入)
+encode:(base4加密的账户和密码)~ 附:base4解密教程讲解
+RANDOMCODE:(验证码)]
Python爬虫学习(十一)下载验证码图片_第4张图片

2、模拟登陆

大概思路如图
输入账号、密码、读图识别二维码–》加解密–》request模拟登录

Python爬虫学习(十一)下载验证码图片_第5张图片

3、验证结果

登录效果达到,但验证码还是有问题,现在效果如图:
Python爬虫学习(十一)下载验证码图片_第6张图片
就是我们常遇到的界面:
在这里插入图片描述
解决方法探索中~

你可能感兴趣的:(Python,Python学习)