[ python] 爬虫笔记(七) 模拟cookies登陆

http/https协议特性:无状态

出现在:模拟登陆后,服务器端没有记录当前登录状态,导致下一次发起请求 时又回到登陆界面。

cookies:用来让服务器端记录客户端的相关状态
[ python] 爬虫笔记(七) 模拟cookies登陆_第1张图片
解决方法:
1、手动cookie获取,通过抓包后封装(不建议)
在这里插入图片描述
2、自动处理

  • cookie值的来源是:模拟登陆post请求后,由服务器创建
  • session会话对象:
    • 作用:
      • 1、可以进行请求发送
      • 2、如果请求过程中产生了cookie,则cookies会自动存储在该session对象中
    • 创建session对象。session = requests.Session()
    • 使用session对象进行模拟登陆post请求的发送
    • 使用session对对应的get请求进行发送(携带了cookie)
    • 与requests格式一样,只是携带了cookies

你可能感兴趣的:(爬虫学习笔记,python,爬虫)