本文知识点
- 开放代理的使用流程
- 代码样例
- 进阶学习
前提条件: 开放代理的订单,可以免费试用。联系他们的客服开通试用
使用流程
- 生成API链接,提取IP
- 开始爬取
这里需要注意:开放代理的IP是从公网采集的,不能保证每个IP都可用。所以我这里用的是vip订单,可以筛选稳定的IP。这样提出来的IP可用质量要高些
代码样例
先把代码贴出来,再一步一步按要求来。大家先copy过去,代码里需要注意以下三项皆为实际在快代理官网获得的参数。
- api_url api链接
- page_url 默认是快代理验证IP的测试网址,自己也可以改成其他的网址
以下代码为python3所写
"""快代理代理IP使用教程"""
import requests
import random
# 要访问的目标网页
page_url = "http://dev.kdlapi.com/testproxy"
# 添加header,模拟用户请求
headers = {
"Accept-Encoding": "Gzip", # 使用gzip压缩传输数据让访问更快
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.117 Safari/537.36"
}
# API接口,建议返回格式用json
api_url = ""
try:
api_res = requests.get(api_url).json()['data']['proxy_list']
except Exception:
api_res = requests.get(api_url).text.split("\r\n")
proxy = random.choice(api_res)
# 代理IP的格式
proxies = {
"http": "http://%(proxy)s/" % {'proxy': proxy},
"https": "https://%(proxy)s/" % {'proxy': proxy}}
# 添加header,模拟用户请求
headers = {
"Accept-Encoding": "Gzip", # 使用gzip压缩传输数据让访问更快
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.117 Safari/537.36"
}
# 发送request请求,打印响应code与body内容
r = requests.get(url=page_url, proxies=proxies, headers=headers)
print("response code",r.status_code)
print("response body",r.text)
生成API链接,获取代理IP
打开后台,找到订单,点击生成API链接
打开后,默认http协议,返回格式选json,我的订单是VIP订单,所以稳定性选稳定,返回格式选json,然后点击生成链接,下面的API链接直接复制上。
开始爬取
需要的都找到了,那现在运行下。看看结果,结果如下response code 200。
实际测试的时候,很有可能会遇到用不了的IP,这样的话就换个IP在运行下。
进阶学习
- 快代理IP教程大全