一 购买云立方动态拨号服务器
1 进入云立方官网后,需要先注册会员再进行购买,因为做爬虫试用,所以我选的是单地区动态拨号服务器。
2 接下来需要自己手动安装操作系统(安装之前需要支付宝实名认证,跟着具体操作步骤走就好了)
3 安装好了以后便可以测试拨号了
1 adsl-start 启动拨号服务
2 adsl-stop 关闭拨号服务
二 安装配置tinyproxy代理(centos7.1为例)
(一) 安装tinyproxy
yum install -y epel-release
yum update -y
yum install -y tinyproxy
(二) 配置tinyproxy
安装完成之后还需要配置一下TinyProxy才可以用作代理服务器,需要编辑配置文件,它一般的路径是/etc/tinyproxy/tinyproxy.conf。
1 Port 8888
在这里可以设置代理的端口,默认是8888。
2 #Allow 127.0.0.1
这是被允许连接的主机的IP,如果想任何主机都可以连接,那就直接将它注释即可,所以在这里我们选择直接注释,也就是任何主机都可以使用这台主机作为代理服务器了。
3 systemctl start tinyproxy.service 启动服务
4 systemctl stop tinyproxy.service 关闭服务
5 curl -x 112.84.118.216:8888 httpbin.org/get
用curl命令设置代理请求一下httpbin,检测下代理是否生效。
(三)安装python3
我们安装得centos7默认是安装了python2的,而且这个Python2不能被删除,因为有很多系统命令,比如yum都要用到。因此我们需要自己手动安装python3,步骤如下:
1 首先安装依赖包
yum -y groupinstall "Development tools"
yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel libpcap-devel xz-devel
2 然后根据自己需求下载不同版本的Python3,我下载的是Python3.6.2
wget https://www.python.org/ftp/python/3.6.2/Python-3.6.2.tar.xz
3 建立一个空文件夹,将下载压缩包Python-3.6.2.tar.xz移至python3文件夹下
mkdir /usr/local/python3
4 然后解压压缩包,进入该目录,安装Python3
tar -xvJf Python-3.6.2.tar.xz
cd Python-3.6.2
./configure --prefix=/usr/local/python3
make && make install
5 最后创建软链接
ln -s /usr/local/python3/bin/python3 /usr/bin/python3
ln -s /usr/local/python3/bin/pip3 /usr/bin/pip3
三 拨号VPS实现
拨号主机主要完成一下三件事:
1 定时执行拨号脚本换IP
2 换IP后立即请求远程主机
3 拨号后检测是否拨号成功,如果失败立即重新拨号
定时拨号
拨号VPS需要每隔一段时间就拨号一次,我们可以直接执行命令行来拨号,那在Python里我们只需要调用一下这个拨号命令就好了。利用subprocess模块调用脚本即可,在这里定义一个变量ADSL_BASH为adsl-stop;adsl-start,这就是拨号的脚本。
import subprocess
(status, output) = subprocess.getstatusoutput(ADSL_BASH)
通过getstatusoutput方法可以获取脚本的执行状态和输出结果,如果status为0,则证明拨号成功,然后检测一下拨号接口是否获取了IP地址。
执行ifconfig命令可以获取当前的IP,我这台主机接口名称叫做ppp0,当然网卡名称可以自己指定,所以将ppp0接口的IP提取出来即可。
def get_ip(self, ifname=ADSL_IFNAME):
(status, output) = subprocess.getstatusoutput('ifconfig')
if status == 0:
pattern = re.compile(ifname + '.*?inet.*?(\d+\.\d+\.\d+\.\d+).*?netmask', re.S)
result = re.search(pattern, output)
if result:
ip = result.group(1)
return ip
如果方法正常返回IP,则证明IP存在,拨号成功,接下来向远程主机发送请求即可,然后sleep一段时间重新再次拨号。
如果方法返回的值为空,那证明IP不存在,我们需要重新拨号。
请求远程主机
发送的时候需要携带这么几个信息,一个是通信秘钥,一个是代理端口,另一个是主机的标识符,用requests发送即可。
requests.post(SERVER_URL, data={'token': TOKEN, 'port': PROXY_PORT, 'name': CLIENT_NAME})
所以整体的思路实现可以写成这样子:
def adsl(self):
while True:
print('ADSL Start, Please wait')
(status, output) = subprocess.getstatusoutput(ADSL_BASH)
if status == 0:
print('ADSL Successfully')
ip = self.get_ip()
if ip:
print('New IP', ip)
try:
requests.post(SERVER_URL, data={'token': TOKEN, 'port': PROXY_PORT, 'name': CLIENT_NAME})
print('Successfully Sent to Server', SERVER_URL)
except ConnectionError:
print('Failed to Connect Server', SERVER_URL)
time.sleep(ADSL_CYCLE)
else:
print('Get IP Failed')
else:
print('ADSL Failed, Please Check')
time.sleep(1)
哈哈,本项目参考我们的大帅哥崔庆才的博客:静觅 » 使用Tornado+Redis维护ADSL拨号服务器代理池
他的github项目地址:ADSLProxyPool
记得顺便给我一个小爱心哦O(∩_∩)O