Python爬虫 - 登录csdn

使用urllib2BeautifulSoupCookieJar实现登录.

使用charles抓包找到post的login网址: https://passport.csdn.net/account/login

再来看看post的参数:

哎呀这里的密码竟然是明文..

username、password和_eventId好说,只是lt和execution在哪里获得呢?

我们来看一下紧挨着的GET请求返回的html代码,这里竟然还有注释哇哇:

好,那么现在总结一下 步骤:

  1. https://passport.csdn.net/account/login进行get请求,在html代码中获得lt和execution;
  2. 表单创建
  3. 带上POST表单,进行POST请求

代码如下:

获取 lt

你可能感兴趣的:(Python爬虫 - 登录csdn)