爬虫【10】 模拟登陆的三种方法

爬虫【10】 cookie模拟登陆


爬虫回顾:

  • 爬虫【1】打开网站,获取信息
  • 爬虫【2】重构UserAgent
  • 爬虫【3】URL地址编码
  • 爬虫【4】爬取百度贴吧并生成静态页面
  • 爬虫【5】爬虫猫眼电影100榜单并保存到csv
  • 爬虫【6】链家二手房信息和图片并保存到本地
  • 爬虫【7】链家二手房信息和图片并保存到本地
  • 爬虫【8】request.get()参数详解
  • 爬虫【9】 小米应用商店爬虫(多线程)
  • 爬虫【10】 cookie模拟登陆

方法1 利用cookie

1、先登录成功1次,获取到携带登陆信息的Cookie(处理headers) 
2、利用处理的headers向URL地址发请求

方法2 利用requests.get()中cookies参数

1、先登录成功1次,获取到cookie,处理为字典
2、res=requests.get(xxx,cookies=cookies)

方法3 利用session会话保持

1、实例化session对象
      session = requests.session()
2、先post : session.post(post_url,data=post_data,headers=headers)
      1、登陆,找到POST地址: form -> action对应地址
      2、定义字典,创建session实例发送请求
         # 字典key :标签中name的值(email,password)
         # post_data = {'email':'','password':''}
3、再get : session.get(url,headers=headers)

你可能感兴趣的:(爬虫)