Ajax动态刷新-有道翻译案例(python经典编程案例)

1. 网站分析

爬取网站:http://fanyi.youdao.com/

1.1 在输入框中输入需要翻译的字段,翻译动态刷新.可知此链接为Ajax.
Ajax动态刷新-有道翻译案例(python经典编程案例)_第1张图片

1.2 经过一系列测试发现,其实际需操作的URL为 http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule 。

上述篮框中的意思为:

e 为输入所翻译的内容
ts 为七位整数的时间戳
salt 为时间戳后加上一位,大于0小于9的数字
bv 为User-Agent的值经过md5加密的 密文
sign 为(“fanyideskweb” + e + salt + “Nw(nmmbP%A-r6U3EUn]Aj”)经过md5加密的 密文

2. 代码如下

# -*- coding: utf-8 -*-
import time
import random
import hashlib
import requests


# 定义MD5方法
def hex5(value):
    manipulator = hashlib.md5()
    manipulator.update(value.encode('utf-8'))
    return manipulator.hexdigest()


# 获取表单数据
def Mach(data_str):
    ts = round(time.time())
    salt = str(ts) + str(random.randint(0, 9))
    sign = hex5("fanyideskweb" + data_str + salt + "Nw(nmmbP%A-r6U3EUn]Aj")
    bv = hex5("5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36")

    data = {
        'i': data_str,
        'from': 'AUTO',
        'to': 'AUTO',
        'smartresult': 'dict',
        'client': 'fanyideskweb',
        'salt': salt,  # salt = ts + 一个随机数
        'sign': sign,
        'ts': ts,  # ts 时间戳
        'bv': bv,
        'doctype': 'json',
        'version': '2.1',
        'keyfrom': 'fanyi.web',
        'action': 'FY_BY_REALTlME',
    }
    return data


# 构造请求方法
def Translation(url, data):
    header = {
        'Accept': 'application/json, text/javascript, */*; q=0.01',
        'Accept-Encoding': 'gzip, deflate, br',
        'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8',
        'Connection': 'keep-alive',
        'Content-Length': '237',
        'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8',
        'Cookie': '[email protected]; OUTFOX_SEARCH_USER_ID_NCOO=1054516127.1065001; JSESSIONID=aaaFtapMs3Ow4bIaK06-w; ___rl__test__cookies=1580462241081',
        'DNT': '1',
        'Host': 'fanyi.youdao.com',
        'Origin': 'https://fanyi.youdao.com',
        'Referer': 'https://fanyi.youdao.com/',
        'Sec-Fetch-Mode': 'cors',
        'Sec-Fetch-Site': 'same-origin',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36',
        'X-Requested-With': 'XMLHttpRequest',
    }
    response = requests.post(url, headers=header, data=data)
    return response


def main():
    url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'
    input_str = input('请输需翻译的内容(不得大于5000字!):')
    data = Mach(input_str)
    translate = Translation(url, data=data)
    # 提取json数据
    print(translate.json()['translateResult'][0][0]['tgt'])


if __name__ == '__main__':
    main()

执行结果如下:
Ajax动态刷新-有道翻译案例(python经典编程案例)_第2张图片

你可能感兴趣的:(python经典编程案例,爬虫总结和详解)