登陆自动化：

自动输入验证码：

学校的选课系统登陆是需要验证码的，经过长达3天，对学校js代码的全部阅读下（真的及其痛苦，期间遇到了无数的问题，看的差点吐出来），我找到了学校验证码的构造方法，和登陆的传输方法。
下面是我的验证码请求方法，返回的值为该次申请用的session以及一个可能的验证码队列

def get_vercode(url):
    if len(os.listdir('static/vercode')) > 50:  # 隔一段时间清理多余的验证码图片
        for x in os.listdir('static/vercode'):
            os.remove('static/vercode/'+x)
    s = requests.session()  # 确保申请验证码的session和登陆时为一致的，所以写在了这里
    # 构建验证码路径
    now_time = str(int(time.time()))
    pic_url = url + 'servlet/ImageServlet?d=' + now_time  # 学校的验证码就是这样，js获取时间后先服务器索要一个验证码图片
    # 取得验证码图片
    pic = s.get(pic_url).content
    filename = 'static/vercode/' + now_time + '.jpg'  # 以后可能还是要用到手动输入验证码，所以先保存图片吧
    with open(filename, 'wb') as f:
        f.write(pic)
    img = Image.open(filename)
    vcode = pytesseract.image_to_string(img)  # 使用ocr技术将图片中的验证码读取出来
    time.sleep(0.3)  # 休息一会，等待验证码完全读取完成（我在电脑上有时候读取不完。。
    vcode_list = confirm_vcode(vcode)  # 检验验证码有效性，并输出更好的验证码队列
    return s, vcode_list

验证码自动识别正确性检验：

使用pytesseract生成的验证码往往有着这样那样的错误，所以我要对返回的验证码进行一些小小的调教，以提高效率以及降低资源的占用

def confirm_vcode(vcode):
    # 这个函数用来验证自动生成的验证码的有效性，并试图优化它
    # 学校的验证码会忽略零和o的区别，都当做同一个字符，但是这个ocr总是会把5和S搞混
    if len(vcode) != 4:  # 不是4位肯定错了，直接跳过吧
        return False
    vcode_list = []
    vcode_list.append(vcode)
    vcode_list.append(vcode.replace('S', '5'))  # 置换S和5，然后存入数列中
    vcode_list.append(vcode.replace('5', 'S'))
    return vcode_list

登陆主体部分：

这里因为前台没搭建好，一时不知道该返回什么，目前只是做了一个登陆而已

def login(url, data):  # 未来可能要支持不同的学校，url先给出来
    i = 0
        while i == 0:
        info = get_vercode(url)
        s = info[0]  # 将前面获取验证码用的session赋予s
        if info[1] is False:  # 如果这次验证码有问题就重新取一次验证码
            continue
        for x in info[1]:  # 遍历验证码列表
            data['verifyCode'] = x
            r = s.post(url+'loadData.xk?method=checkLogin', data)   # 传输登陆数据，data是外部给的，这里写出来也没啥意义了 
            print(r.text)
            if r.text == '{"success":true,"message":""}':  # 成功登陆了就准备跳出登陆循环吧
                print('成功了')
                i += 1
                break

选课：

就很简单了,略过吧

遇到的问题：

无法获取到教学计划和本学期待选课表。看了三天代码都没有找到这些数据是在哪里传输的。真的很崩溃。但是如果用模拟浏览器的方法会占用大量的资源，为了能够很好的在廉价的服务器上发布，这种方法还是先不考虑了。先做前台页面，然后再进行这方面的研究吧

抢课系统的核心：登陆与传输

登陆自动化：

自动输入验证码：

验证码自动识别正确性检验：

登陆主体部分：

选课：

遇到的问题：

你可能感兴趣的:(抢课系统的核心：登陆与传输)