[原创]03-百合的小姐姐都在找什么样的男生?

前言

前几天看到了有人分析百合网搜索页面的异步请求(CSDN推送的文章《单身税的时代要来临,你还没有用Python帮你找一个女朋友吗?》作者:柯西),但没有做进一步的抓取和分析工作,而我刚好前几天学习了pyecharts库,拿这个信息来练练手(文中观点仅为个人学习分析观点,不代表任何实际情况)。

获取数据

根据原作者的思路,打开百合网页面,看了返回的信息如下图右侧所示:

[原创]03-百合的小姐姐都在找什么样的男生?_第1张图片
Lily net.jpg

点开来看:
[原创]03-百合的小姐姐都在找什么样的男生?_第2张图片
info.jpg

发现信息格式很统一,赶紧写了一个爬虫,对感兴趣的学历、爱情宣言、收入、地区等信息进行了爬取。
爬了一晚上的信息,去除重复信息,还剩余4w多条(当数据大于10w条的时候,我写的代码,报错了,4w行数据运行时仍然坚挺,还未发现问题出在哪里,后续再优化下)

数据处理

地图密度分布

按照地区对人数进行分布,有大约50%的百合小姐姐集中分布在朝阳、海淀区,此外东城、西城、丰台人数超过2300人,通州、昌平人数也在2000人左右。“和我在朝阳、海淀的街头走一走,哦~哦”,说不定就邂逅了浪漫。
[原创]03-百合的小姐姐都在找什么样的男生?_第3张图片
map-dist.png

[原创]03-百合的小姐姐都在找什么样的男生?_第4张图片
loc-distribution.png

年龄分布

27-30岁的百合小姐姐均超过平均人数4615人,其中28岁达到了8513人,是整个队伍中最庞大的群体。俗话说“女大三,抱金砖;女小三,男当官”,24岁-33岁的男同胞们,是时候抱金砖、去当官了。


[原创]03-百合的小姐姐都在找什么样的男生?_第5张图片
age-distribution.png

收入与城区分布

整体薪资分布为5个档次,朝阳区的妹子们薪酬多为5k-1w, 1w-2w档次,密云区集中扎堆2w-5w的高收入妹子,崇文区的妹子们显示多为<2k, 物质的、柏拉图式的爱,哪个更适合呢?


[原创]03-百合的小姐姐都在找什么样的男生?_第6张图片
income&loc-distribution.png

爱情宣言

将百合小姐姐的爱情宣言制作成词云,可见小姐姐们还是较为喜欢积极、阳光、有责任心、善良、热爱生活的男人。她们努力寻找自己的Mr.right,希望可以和对的人相互扶持,希望可以相互珍惜,携手到老。


[原创]03-百合的小姐姐都在找什么样的男生?_第7张图片
wc.jpg

最后

爱情当然还需两情相悦,看对了眼,一切好说。要是单方面喜欢,还真是得花心思,得之则幸,不得则命。无论如何,都希望小哥哥、小姐姐早日找到属于自己的Ta。祝愿大家:一世情,一生爱,一段挚爱伴终身;
两个人,两颗心,两心相偎到永久。
参考代码

你可能感兴趣的:([原创]03-百合的小姐姐都在找什么样的男生?)