悄悄告诉你七夕礼物清单,最适合你女/男神的礼物!!赶紧收藏!

前言

中国情人节——七夕节(别称:乞巧节、七巧节、七姐诞、道德腊,英文名:Double Seventh Festival)被赋予了“牛郎织女”的美丽爱情传说,使其成为了象征爱情的节日,从而被认为是中国最具浪漫色彩的传统节日,日期是每年农历七月初七,有拜月祈福、拜织女、吃巧果、乞求姻缘等习俗。

随着七夕的临近,很多小伙伴都开始筹备送女朋友/男朋友的礼物了,礼物作为一种传达情感的媒介,表达了对于女朋友/男朋友的祝福和心意,但同时对于要送什么礼物,对于很多小伙伴来讲倒是选择困难,本文利用 Python 爬取某宝商品页面,为小伙伴们分析销量较高的礼物清单,以供大家参考。

程序说明

根据不同关键字,爬取“某宝”获取商品信息(以“七夕礼物”“七夕礼物送男友”“七夕礼物送女友”等为例),根据所获取数据分析得到七夕礼物清单,并通过词云可视化的方式展示不同礼物的频率比重对比。

数据爬取

️ 网址构成分析

爬虫少不了网址,因此首先观察网址的构成,在输入关键字“七夕礼物”进行搜索时,发现网址中 q 的参数值即为所键入的关键字“七夕礼物”,如下图所示:

悄悄告诉你七夕礼物清单,最适合你女/男神的礼物!!赶紧收藏!_第1张图片悄悄告诉你七夕礼物清单,最适合你女/男神的礼物!!赶紧收藏!_第2张图片​​因此可以使用以下方式构造网址:

q_value = "七夕礼物"
url = "https://s.taobao.com/search?q={}imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20210802&ie=utf8&bcoffset=5&p4ppushleft=2%2C48&ntoffset=5&s=44".format(q_value) 

虽然也可以直接复制网址,但是这种方法的弊端在于,每次想要爬取其他类别的商品时,都需要重新打开网页复制网址;而利用 q_value 变量构造网址,当需要获取其他品类商品时仅需要修改 q_value 变量,例如要爬取关键字“七夕礼物送男友”,只需要做如下修改:

q_value = "七夕礼物送男友" 

️ 网页结构分析

使用浏览器“开发者工具”,观察网页结构,可以看出商品的信息都是在 

你可能感兴趣的:(表白合集,爬虫+数据合集,python,爬虫,数据分析)