替身大法

口号是对上来了,人家要看信物怎么办。

我的身份证掏出来我今后进别想混了。


怎么办!怎么办?挨打呗,为了还有以后。

直奔主题吧,没力气说话了。

from urllib import request

# 找到代理ip
proxy_ip = '124.167.221.14:80'
# 生成代理对象
proxy = request.ProxyHandler({'http': proxy_ip})
# 连接开启opener
opener = request.build_opener(proxy, request.HTTPSHandler)
# 给request安装opener,安装完成默认用此opener打开连接
request.install_opener(opener)
# 准备链接
url = 'https://www.baidu.com'
# 构造请求
req = request.Request(url)
# 丝袜头套
req.add_header("User-Agent","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36")
# 直接访问,默认用安装的opener打开
response = request.urlopen(req)
# 资源获取成功
page = response.read().decode("utf-8")
print(page)

怎么办?找替身呗。

先找好替身(ip),然后给他打扮好(proxy),伪造好书信(request),戴好头套(header),去吧,皮卡丘。

不成功怎么办?不管了,被打的也不是我,打死就算了。

一定要问出个所以然?找一堆替身呗,弄个替身池(ip代理池),防得住一个,你防得住一群?


不行,得总结一下,要不白挨打了:

1. 找代理(百度去)

2. 打扮替身(生成代理对象)

3. 教他开口(生成opener对象)

4. 封闭训练(装进request练习去)

5. 访问请求(线索啦,关键啦,头套啦,以前全部的准备好成request)

6. 皮卡丘(去吧,活着回来最好)


是这样吧,就这样了,找替身又是花销啊,还没地报销。

买个锅当头盔吧,丝袜好用不经打啊。

好,买锅盔去,的确饿的不行了。

你可能感兴趣的:(爬虫)