记一次简单的教务处网站分析

用火狐进开发者模式看看
记一次简单的教务处网站分析_第1张图片
图片1.png
选择网络选项卡,输入账户密码,登陆
记一次简单的教务处网站分析_第2张图片
图片2.png

可以看到第一个loginAction.do,就是这个要登录的URL,是一个post方法,再来看看表单数据有哪些
记一次简单的教务处网站分析_第3张图片
图片3.png

mm?yzm?zjh?居然全是明文,一点加密措施都没有,不过这样后续的爬虫登陆就会简单许多了。再来找找成绩信息隐藏在哪。

点击“成绩查询”看看URL响应有什么变化

记一次简单的教务处网站分析_第4张图片
图片4.png
这里发现一个html,点进去看看,果不其然,成绩信息全部包含在这个url里,看看网页源码
记一次简单的教务处网站分析_第5张图片
图片5.png
嗯,都是我需要的信息,结合之前写的验证码识别就可以写个爬虫完成自动登录,以此来达到一些选课或是自动信息查询的目的。
.
这里有几个值得注意的地方:

  • 要先获取cookie,然后用此cookie去爬验证码,不然两次验证码图片不一。
  • 网站对校内网访问貌似没有次数限制,我尝试登陆了N多次,都没有被ban,或许就没有限制访问的机制......(如果有别人的学号岂不是可以做弱密码爆破了?)
  • 在做自动查询任务时,时间间隔不要设的太短,不然直接变成dos攻击了,教务处这个烂网可受不了。

你可能感兴趣的:(记一次简单的教务处网站分析)