简介
有些登录的接口会有验证码:短信验证码,图形验证码等,这种登录的话验证码参数可以从后台获取的(或者查数据库最直接)。获取不到也没关系,可以通过添加cookie的方式绕过验证码。(注意:并不是所有的登录都是用cookie来保
持登录的,有些是用token登录)
抓登录cookie
1、如博客园登录后会生成一个已登录状态的cookie,那么只需要直接把这个值添加到cookies里面就可以了。
2、可以先手动登录一次,然后抓取这个cookie,这里就需要用抓包工具fiddler了
3、先打开博客园登录界面,手动输入账号和密码(勾选下次自动登录)
4、打开fiddler抓包工具,刷新下登录首页,就是登录前的cookie了
5、登录成功后,再查看cookie变化,发现多了两组参数,多的这两组参数就是我们想要的,copy出来,一会有用
cookie组成结构
1、用抓包工具fidller只能看到cookie的name和value两个参数,实际上cookie还有其它参数
2、以下是一个完整的cookie组成结构
cookie ={u'domain': u'.cnblogs.com',
u'name': u'.CNBlogsCookie',
u'value': u'xxxx',
u'expiry': 1491887887,
u'path': u'/',
u'httpOnly': True,
u'secure': False}
name:cookie的名称
value:cookie对应的值,动态生成的
domain:服务器域名
expiry:Cookie有效终止日期
path:Path属性定义了Web服务器上哪些路径下的页面可获取服务器设置的Cookie
httpOnly:防脚本攻击
secure:在Cookie中标记该变量,表明只有当浏览器和Web Server之间的通信协议为加密认证协议时,
浏览器才向服务器提交相应的Cookie。当前这种协议只有一种,即为HTTPS。
添加cookie
1、往session里面添加cookie可以用以下方式
2、set里面参数按括号里面的参数格式
coo = requests.cookies.RequestsCookieJar()
coo.set('cookie-name', 'cookie-value', path='/', domain='.xxx.com')
s.cookies.update(c)
3、于是添加登录的cookie,把第一步fiddler抓到的内容填进去就可以了
c = requests.cookies.RequestsCookieJar()
c.set('.CNBlogsCookie', 'xxx')
c.set('.Cnblogs.AspNetCore.Cookies','xxx')
s.cookies.update(c)
print(s.cookies)
代码运行,刷新随笔
1、看到刚刚添加的随笔
参考代码
1、由于登录时候是多加2个cookie,我们可以先用get方法打开登录首页,获取部分cookie
2、再把登录需要的cookie添加到session里
3、添加成功后,随便编辑正文和标题保存到草稿箱
1 # coding:utf-8 2 import requests 3 # 先打开登录首页,获取部分cookie 4 url = "https://passport.cnblogs.com/user/signin" 5 headers = { 6 "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:44.0) Gecko/20100101 Firefox/44.0" 7 } # get方法其它加个ser-Agent就可以了 8 s = requests.session() 9 r = s.get(url, headers=headers,verify=False) 10 print s.cookies 11 # 添加登录需要的两个cookie 12 c = requests.cookies.RequestsCookieJar() 13 c.set('.CNBlogsCookie', 'xxx') # 填上面抓包内容 14 c.set('.Cnblogs.AspNetCore.Cookies','xxx') # 填上面抓包内容 15 s.cookies.update(c) 16 print s.cookies 17 # 登录成功后保存编辑内容 18 url2= "https://i.cnblogs.com/EditPosts.aspx?opt=1" 19 body = {"__VIEWSTATE": "", 20 "__VIEWSTATEGENERATOR":"FE27D343", 21 "Editor$Edit$txbTitle":"这是绕过登录的标题:北京-宏哥", 22 "Editor$Edit$EditorBody":"这里是中文内容:http://www.cnblogs.com/duhong/
", 23 "Editor$Edit$Advanced$ckbPublished":"on", 24 "Editor$Edit$Advanced$chkDisplayHomePage":"on", 25 "Editor$Edit$Advanced$chkComments":"on", 26 "Editor$Edit$Advanced$chkMainSyndication":"on", 27 "Editor$Edit$lkbDraft":"存为草稿", 28 } 29 r2 = s.post(url2, data=body, verify=False) 30 print r.content