python爬虫抓手机号+java客户端小程序

介绍

前几天做了个抓手机号的爬虫,这两天没啥事就学了学java swing,然后想着给蛇画俩腿,额 是给那个小程序做个界面。

大概组件怎么用,布局怎么用,照着书上学了个大概,就迫不急待的动手了,今天终于做成了。记录一下过程,以后要是忘记,可以回来看看。

成品图:

python爬虫抓手机号+java客户端小程序_第1张图片

从python开始

那么就从python爬虫开始吧。毕竟python一共也没学多长时间,记录一下,以后忘了还能来看看。

我安的2.7版本python,安装很简单一路下一步就安好了,环境变量配置留个备份。

然后下了个社区版的PyCharm,就可以正式开始了。

这就写好了,pages决定抓这个网站几页的手机号。

# coding: UTF-8
import re
import requests

def write(page):
    r = requests.get("http://www.0597zp.com/more.php?page="+str(page))
    result = re.findall('target=_blank>(.*?)',r.content)
    if(len(result)>0):
        tempfile = open("mobile.txt",'a')
        for i in result:
            print (i + ";")
            tempfile.write(i + ";")
        tempfile.write("\n")
        tempfile.close()
pages=10
for i in range(0,pages+1):
    write(i)

requests是需要安装的,打开cmd,命令:pip install requests,就ok了,要是pip用不了那就是python环境变量没搭好。

这几行代码没啥好说的,requests用法网上就有,正则挺麻烦的,好在原来看过个视频讲过这个贪心算法(.*?)挺好使的。暂且先用着把,等我以后成长到适当水平在来研究它,现在需要学的东西多着呢,就不跟它耗着了。

这个网站每页100条,抓了10页的数据:

python爬虫抓手机号+java客户端小程序_第2张图片

嗯 这个小程序就写好了,下篇写java界面吧。我总怕看太长的文章,所以就这样结束把。




你可能感兴趣的:(java小程序)