我用Python爬虫原理 做的一个翻译器

Python制作翻译器

设计理念和思路:

有人用Python爬图片,有人爬文档,有人爬文字,我突发奇想,既然都是网络请求,那我是不是也能把功能爬下来[doge]…

我的思路跟爬图片文字一样,也是先发送请求,获得响应,然后读取文档,不过这里读取输出的内容要换成翻译后的内容。

大部分解释程序的注释里都有,这里详细说一下data字典,data作为响应的参数之一,按F12测试网站,找到下图network所示的
我用Python爬虫原理 做的一个翻译器_第1张图片
然后将各个键值对分别赋值给data的原本的空字典即可,同时要注意url的引入也是要用有道这里的源网址(去掉_o,新的好像有保护机制),这时得到的字典data还是未编码的,我们对其进行编码,使用encode模块。随后发送请求,解码,装载,输出即可。

代码:

import urllib.request
import urllib.parse
import json
import os  #避免结果一闪而过


content = input("请输入要翻译的内容:")


#赋值URL

url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'

#创建data

data = {
     }
data['i'] = content
data['from'] = 'AUTO'
data['to'] = 'AUTO'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '15976478948697'
data['sign'] = '141de79685d17d12d73a3179afee6053'
data['lts'] = '1597647894869'
data['bv'] = '97ba7c7fb78632ae9b11dcf6be726aee'
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom'] = 'fanyi.web'
data['action'] = 'FY_BY_CLICKBUTTION'

#编码data

data = urllib.parse.urlencode(data).encode('utf-8')

#发出请求,得到响应
response = urllib.request.urlopen(url,data)

#解码read()读开的文档
html = response.read().decode('utf-8')

#装载json
target = json.loads(html)


#输出的内容是载入后的字典的三重内容的用户所需选项,第一个0是第一层,一直到‘tgt’的翻译结果
print("翻译结果:%s" % (target['translateResult'][0][0]['tgt']))

os.system("pause")

运行结果:

我用Python爬虫原理 做的一个翻译器_第2张图片

我的爬虫段位不高,欢迎各位大神指点

这里爬虫借用的是有道翻译,其他翻译应该也可

你可能感兴趣的:(Python,python,网络,http)