python selenium 滚动条_实战篇 | 用Python来找合适的妹子

用Python做有趣的事情

最近整理一个爬虫系列方面的文章,不管大家的基础如何,我从头开始整一个爬虫系列方面的文章,让大家循序渐进的学习爬虫,小白也没有学习障碍. 爬虫篇:使用Python动态爬取某大V微博,再用词云分析 爬虫篇 | 动态爬取QQ说说并生成词云,分析朋友状况 爬虫篇 | 200 行代码实现一个滑动验证码 爬虫篇 | 学习Selenium并使用Selenium模拟登录知乎 爬虫篇 | Python使用正则来爬取豆瓣图书数据 爬虫篇 | 不会这几个库,都不敢说我会Python爬虫 爬虫篇 | Python现学现用xpath爬取豆瓣音乐 爬虫篇 | Python最重要与重用的库Request 爬虫篇 | Python爬虫学前普及 基础篇 | Python基础部分

python selenium 滚动条_实战篇 | 用Python来找合适的妹子_第1张图片

时间真的有点仓促,匆匆忙忙撸完这篇文章.

虽然今天是情人节,但还是要关心一下单身狗们,帮助他们俩脱单。

古人云:知己知彼,百战不殆.  好好去了解一下妹子们的内心想法,早日脱单!

这次我在一个某知名婚恋网站,抓取了一些数据,对她们的内心读白进行分析.

我这次筛选条件:女性,年龄20-30,学历本科,就这些条件.

python selenium 滚动条_实战篇 | 用Python来找合适的妹子_第2张图片

3000条妹子内心读白词云如下:

python selenium 滚动条_实战篇 | 用Python来找合适的妹子_第3张图片

放心好了,她们都是追求精神满足而非物质,大部分都是要找生命中的另一半,那她们的另一半会是你吗?

完整代码

# coding=utf-8


from selenium import webdriver
import time
from lxml import etree
import sys

reload(sys)
sys.setdefaultencoding('utf-8')

"""
PEP8 Python编程规范
https://www.douban.com/note/134971609/
"""
# 获取浏览器驱动
driver = webdriver.Firefox()
driver.maximize_window()
webUrl = 'http://www.lovewzly.com/jiaoyou.html'
driver.get(webUrl)

# 等15秒,我来手动做一下筛选条件。,女性,21-30左右,学历本科,\
# 本来想通过js代码,来自动执行,但无奈对js真的不熟,也没有太多时间去整了,凑合看看.
time.sleep(15)

"""
下拉滚动条,从1开始到3结束 分2次加载完每页数据
"""
while True:

   for i in range(1, 20):
       height = 1000 * i  # 每次滑动20000像素
       strword = "window.scrollBy(0," + str(height) + ")"
       driver.execute_script(strword)
       time.sleep(3)

       s = etree.HTML(driver.page_source)
       selectors = s.xpath('//*[@id="hibox"]/table/tbody/tr/td/div')

       with open('内心读白.txt', 'a') as f:
           for selector in selectors:
               img = selector.xpath('./div[1]/img/@src')
               nick = selector.xpath('./div[2]/p[1]/span/text()')
               age = selector.xpath('./div[2]/p[2]/span[1]/text()')
               height = selector.xpath('./div[2]/p[2]/span[2]/text()')
               address = selector.xpath('./div[2]/p[2]/span[3]/text()')
               heart = selector.xpath('./div[2]/p[3]/text()')

               img = img[0] if len(img) > 0 else ''
               nick = nick[0] if len(nick) > 0 else ''
               age = age[0] if len(age) > 0 else ''
               height = height[0] if len(height) > 0 else ''
               address = address[0] if len(address) > 0 else ''
               heart = heart[0] if len(heart) > 0 else ''
               print nick, age, height, address, heart, img
               f.write(heart)

生成词云的代码之前的文章里面有,这里就不展示了,自行前往查阅!

下一步准备:

  • 我们可以输入自己的需求,然后进行筛选.

  • 把妹子照片,身高,籍贯,收入,学历,摘偶要求,都一起配上,并配上她们的链接,让单身狗们有目标的找妹子!哈哈

如果你觉得文章还不错,请大家点赞分享下。你的肯定是我最大的鼓励和支持。 【完】 如果觉得有料,来个在看,让朋友知道你越来越优秀了 说句题外话,有不少人想加我微信,看我朋友圈的每日分享,我姑且放出来,但名额有限,先来先得。 我的朋友圈不止有技术分享,更有我的日常感悟,还有我个人商业思维观点 速速扫码添加! python selenium 滚动条_实战篇 | 用Python来找合适的妹子_第4张图片 扫码添加,备注:公号铁粉 推荐阅读

爬虫篇:使用Python动态爬取某大V微博,再用词云分析

爬虫篇 | 动态爬取QQ说说并生成词云,分析朋友状况 爬虫篇 | 200 行代码实现一个滑动验证码 爬虫篇 | 学习Selenium并使用Selenium模拟登录知乎 爬虫篇 | Python使用正则来爬取豆瓣图书数据 爬虫篇 | 不会这几个库,都不敢说我会Python爬虫 爬虫篇 | Python现学现用xpath爬取豆瓣音乐 爬虫篇 | Python最重要与重用的库Request 爬虫篇 | Python爬虫学前普及 基础篇 | Python基础部分 讲真,做Python一定不要只会一个方向! python selenium 滚动条_实战篇 | 用Python来找合适的妹子_第5张图片 b21cd7bb9c9cc5d80d3b3ad538c3320c.png 喜欢就在看吧

你可能感兴趣的:(python,selenium,滚动条)