Python爬虫:Cookie和session模拟登陆

Cookie和session模拟登陆:

1.适用网站类型:爬取网站页面需要登陆才能访问,否则获取不到页面的实际响应数据
方法一:(利用cookie)
  • 1.先登陆成功一次,获取到携带登陆信息的Cookie
  • 2.利用处理的headers向url地址发请求
方法二:(利用session会话保持)(先post,再get)
  • 1.F12或者查看源代码,找post地址:form表单->action对应地址的登陆地址,以字典方式发送用户名和密码信息到post地址
  • 2.定义字典(用户名和密码),创建session实例发送请求
data_dict ={'用户名参数':'yonghuming','密码的参数':'mima'}
session = requests.session()
session.post(url=action登陆地址,date=用户名密码字典,headers= headers)
  • 3.get页面信息
res = session.get(url=请求页面信息地址,headers=headers).text

你可能感兴趣的:(笔记)