作为抢课系统,你必须要做到无论何时何地都在线,并且持续不断的进行抢课。只有这样才能够战胜别的同学。
首先,这个抢课系统要做到自动化,能够断线重连,其次是高速的选课。
这里写出的代码是在没有前端页面的前提下临时试用用的。所以很多方法的返回以及调用上不是很规范。代码中都有很详细的注释,如果有不懂或者不住请务必告诉我。
登陆自动化:
-
自动输入验证码:
学校的选课系统登陆是需要验证码的,经过长达3天,对学校js代码的全部阅读下(真的及其痛苦,期间遇到了无数的问题,看的差点吐出来),我找到了学校验证码的构造方法,和登陆的传输方法。
下面是我的验证码请求方法,返回的值为该次申请用的session以及一个可能的验证码队列
def get_vercode(url):
if len(os.listdir('static/vercode')) > 50: # 隔一段时间清理多余的验证码图片
for x in os.listdir('static/vercode'):
os.remove('static/vercode/'+x)
s = requests.session() # 确保申请验证码的session和登陆时为一致的,所以写在了这里
# 构建验证码路径
now_time = str(int(time.time()))
pic_url = url + 'servlet/ImageServlet?d=' + now_time # 学校的验证码就是这样,js获取时间后先服务器索要一个验证码图片
# 取得验证码图片
pic = s.get(pic_url).content
filename = 'static/vercode/' + now_time + '.jpg' # 以后可能还是要用到手动输入验证码,所以先保存图片吧
with open(filename, 'wb') as f:
f.write(pic)
img = Image.open(filename)
vcode = pytesseract.image_to_string(img) # 使用ocr技术将图片中的验证码读取出来
time.sleep(0.3) # 休息一会,等待验证码完全读取完成(我在电脑上有时候读取不完。。
vcode_list = confirm_vcode(vcode) # 检验验证码有效性,并输出更好的验证码队列
return s, vcode_list
-
验证码自动识别正确性检验:
使用pytesseract生成的验证码往往有着这样那样的错误,所以我要对返回的验证码进行一些小小的调教,以提高效率以及降低资源的占用
def confirm_vcode(vcode):
# 这个函数用来验证自动生成的验证码的有效性,并试图优化它
# 学校的验证码会忽略零和o的区别,都当做同一个字符,但是这个ocr总是会把5和S搞混
if len(vcode) != 4: # 不是4位肯定错了,直接跳过吧
return False
vcode_list = []
vcode_list.append(vcode)
vcode_list.append(vcode.replace('S', '5')) # 置换S和5,然后存入数列中
vcode_list.append(vcode.replace('5', 'S'))
return vcode_list
-
登陆主体部分:
这里因为前台没搭建好,一时不知道该返回什么,目前只是做了一个登陆而已
def login(url, data): # 未来可能要支持不同的学校,url先给出来
i = 0
while i == 0:
info = get_vercode(url)
s = info[0] # 将前面获取验证码用的session赋予s
if info[1] is False: # 如果这次验证码有问题就重新取一次验证码
continue
for x in info[1]: # 遍历验证码列表
data['verifyCode'] = x
r = s.post(url+'loadData.xk?method=checkLogin', data) # 传输登陆数据,data是外部给的,这里写出来也没啥意义了
print(r.text)
if r.text == '{"success":true,"message":""}': # 成功登陆了就准备跳出登陆循环吧
print('成功了')
i += 1
break
选课:
就很简单了,略过吧
遇到的问题:
无法获取到教学计划和本学期待选课表。看了三天代码都没有找到这些数据是在哪里传输的。真的很崩溃。但是如果用模拟浏览器的方法会占用大量的资源,为了能够很好的在廉价的服务器上发布,这种方法还是先不考虑了。先做前台页面,然后再进行这方面的研究吧