python requests 自动管理cookie, session保持连接,抓取数据后结束

写的一个模拟登陆自己学校aao.neu.edu.cn里面进行成绩查询python代码。


import requests

Target='http://202.118.31.197/ACTIONLOGON.APPPROCESS'
Data={"WebUserNO":"#####","######":"86458043",
      "Agnomen":" ","submit.x":"-664","submit.y":"-166",
      "applicant":"ACTIONQUERYSTUDENTSCHEDULEBYSELF"}
r = requests.post(Target,Data)
print r.text

这一段是最简单的requests模块登陆。 之后获得html页面就可以用  


BeautifulSoup模块进行处理了。

from bs4 import BeautifulSoup

html = r.text 

soup = BeautifulSoup(html)

soup.find("div")

之后调用soup模块就可以定点查询。定点查所要的数据了。


提供两个链接  http://www.crummy.com/software/BeautifulSoup/bs4/doc/ 这是BeautifulSoup的用法。


跟 http://docs.python-requests.org/en/latest/  requests的用法。。  


两个都很详细。。


然后查成绩就麻烦一点了。要开session。查询两次。。

import requests

Target='http://202.118.31.197/ACTIONLOGON.APPPROCESS'
Data={"WebUserNO":"######","Password":"#####",
      "Agnomen":" ","submit.x":"-664","submit.y":"-166",
      "applicant":"ACTIONQUERYSTUDENTSCHEDULEBYSELF"}
s = requests.session()
r1 = s.post(Target,Data)

print r1.text
T2 = 'http://202.118.31.197/ACTIONQUERYSTUDENTSCORE.APPPROCESS'
D2 = {"YearTermNO":"18"}
r2 = s.post(T2,D2)
print r2.text

之后同样用  BeautifulSoup处理

你可能感兴趣的:(python,抓取数据)