ython模拟登陆的几种方法
客户端向服务器发送请求,cookie则是表明我们身份的标志。而“访问登录后才能看到的页面”这一行为,恰恰需要客户端向服务器证明:“我是刚才登录过的那个客户端”。于是就需要cookie来标识客户端的身份,以存储它的信息(如登录状态)
import requests requests.get('http://httpbin.org/cookies/set/number/123456789')r=requests.get('http://httpbin.org/cookies')print(r.text) s=requests.session()s.get('http://httpbin.org/cookies/set/number/123456789')r=s.get('http://httpbin.org/cookies')print(r.text){ "cookies": {}} { "cookies": { "number": "123456789" }}
Python资源共享群:626017123
1,先在浏览器中登录,然后打开开发者选项,找到一个请求方法为POST的请求,复制Requests Headers中的cookie在爬取需要登录的页面时加上此cookies即可
import requestsurl = '......'headers = {'cookies':'......'}response = requests.get(url=url, headers=headers)1234
2,模拟登录,并用session维持会话,用requests的session模拟登录后session会记录cookies,接下来的请求会被放在同一个会话中。举个简单例子,在 requests 中,如果直接利用 get()或 post()等方法的确可以做到模拟网页的请求,但是这实际 上是相当于不同的会话,也就是说相当于你用了两个浏览器打开了不同的页面。设想这样一个场景,第一个请求利用 post()方法登录了某个网站,第二次想获取成功登录后的自 己的个人信息,你又用了一次 get()方法去请求个人信息页面。实际上,这相当于打开了两个浏览器, 这是两个完全不相关的会话,能成功获取个人信息吗?那当然不能
import requests
'''
下面的data是先在浏览器中登录,然后打开开发者选项,找到一个请求方法为POST的请求,复制里面的Form Data
'''url = '......'data = { username:'......', password:flz_sanqianchi, rememberMe:true, lt:LT-82465-9HtQnC7ZASZHohtnQlrqMvXo7cI2B7, execution:e1s1, }headers = {'user-agent':'Mozolla/5.0'}'''
这里用requests的session来请求网页,做到维持同一会话的目的
'''session = requests.Session()reqsonse = session.post(url=url, headers=headers, data=data)'''接下来就可以请求别的登陆后的页面,而不需要处理cookies'''url2 = '这里是已经登录后的某一页面'response = session.get(url=url2, headers=headers)