关于知乎登录(分析)

分析知乎网站登录过程
如图1:
关于知乎登录(分析)_第1张图片
图2:
关于知乎登录(分析)_第2张图片
发现下边还有一个验证码的请求
关于知乎登录(分析)_第3张图片
关于知乎登录(分析)_第4张图片
关于知乎登录(分析)_第5张图片
分析了这么多但是没有弄明白网站发送的数据是什么,因此必须转换思路。
利用以前的方式携带 _xsrf这种凡是完全不能登录了,但是这这之前还有一种方式,当时研究过,因此对此有较深的印象,然后再从寻找signature这个参数开始进行寻找
关于知乎登录(分析)_第6张图片

关于知乎登录(分析)_第7张图片
加密方式为sha1
关于知乎登录(分析)_第8张图片
这里的加密方式为md5,而知乎用的是sha1加密因此需要用此代码即可

a=hmac.new('d1b964811afb40118a12068ff74a12f4'.encode('utf-8'),digestmod=sha1)
a.update(b'password')
a.update(b'c3cef7c66a1843f8b3a9e6a1e3160e20')
a.update(b'com.zhihu.web')
a.update(str(round(time.time()*1000)).encode())
signature = a.hexdigest()#这段代码显示的就是知乎代码的加密的signature数据

开始构建自己的代码

import requests
import time
from hashlib import sha1
from time import sleep
import hmac
import base64
from PIL import Image
#定义类
class Zhihu(object):
    #构造器
    def __init__(self):
        self.session=requests.session()
        self.headers={
            'Host':'www.zhihu.com',
            'Referer':'https://www.zhihu.com/question/29925879',
            'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',
        }
        self.session.headers.update(self.headers)
        self.picture=None
        self.signature=None
        self.picture_url=None
        pass
    #获取验证码方法,有时候不用获取验证码就可以直接登录
    def getcapture(self):
        message=self.session.get(url='https://www.zhihu.com/api/v3/oauth/captcha?lang=en').json()
        print(message)
        self.picture_url = self.session.put(url='https://www.zhihu.com/api/v3/oauth/captcha?lang=en').json()
        if message['show_captcha'] == False:
            self.picture=''
        else:
            #采用base64格式将验证码通过图片格式显示出来
            with open('验证码.jpg','wb') as f:
                f.write(base64.b64decode(self.picture_url['img_base64']))
            image=Image.open('验证码.jpg')
            image.show()
            self.picture=input('请输入验证码')
        sleep(2)
        message1=self.session.post(url='https://www.zhihu.com/api/v3/oauth/captcha?lang=en',data={'input_text':self.picture}).json()
        print(message1)

    def get_signature(self):
        #知乎登陆的主要问题在于找到signature了这是重点。
        a=hmac.new('d1b964811afb40118a12068ff74a12f4'.encode('utf-8'),digestmod=sha1)
        a.update(b'password')
        a.update(b'c3cef7c66a1843f8b3a9e6a1e3160e20')
        a.update(b'com.zhihu.web')
        a.update(str(round(time.time()*1000)).encode())
        self.signature=a.hexdigest()
    def Login_phone(self):
        data={
            'client_id':'c3cef7c66a1843f8b3a9e6a1e3160e20',#'',
            'grant_type':'password',
            'timestamp':str(int(time.time()*1000)),
            'source':'com.zhihu.web',
            'signature':self.signature,
            'username':'账号',
            'password':'密码',
            'captcha':self.picture,
            #'lang':'en',
            #'ref_source':'other_',
            #'utm_source':''
        }
        message=self.session.post(url='https://www.zhihu.com/api/v3/oauth/sign_in',headers=self.headers,data=data)
        message.encoding='utf-8'
        print(message.text)
    def target_url(self,url):
        text=self.session.get(url)
        return text.text

if __name__ == "__main__":
    zhihu=Zhihu()
    zhihu.getcapture()
    zhihu.get_signature()
    zhihu.Login_phone()
    print(zhihu.target_url('https://www.zhihu.com/'))

当运行完就可以搜索到你的账号。so good !!!!!!!!!!!!!!!!!!!!!! 希望采纳。
听过验证码可以使用TensorFlow来进行识别哦,有机会的可以写一篇文章,可惜我还不懂,嘿嘿嘿嘿嘿嘿嘿

你可能感兴趣的:(关于知乎登录(分析))