共享单车数据爬取_共享单车数据探索性分析

共享单车数据爬取_共享单车数据探索性分析_第1张图片

一、提出问题

要分析的问题:基于共享单车的用户数据,使用K-Means聚类分析,对共享单车的用户进行分群,对共享单车的骑行情况进行探索,提供给业务运营的建议。

二、数据预处理

共享单车数据爬取_共享单车数据探索性分析_第2张图片
查看数据集基本信息

共享单车数据爬取_共享单车数据探索性分析_第3张图片

共享单车数据爬取_共享单车数据探索性分析_第4张图片

共享单车数据爬取_共享单车数据探索性分析_第5张图片
处理数据异常值

共享单车数据爬取_共享单车数据探索性分析_第6张图片

共享单车数据爬取_共享单车数据探索性分析_第7张图片
将骑行起始时间分为5歌区间去统计各时间段内的骑行情况

共享单车数据爬取_共享单车数据探索性分析_第8张图片

三、数据标准化处理

共享单车数据爬取_共享单车数据探索性分析_第9张图片

共享单车数据爬取_共享单车数据探索性分析_第10张图片
选取特征,并分析各自之间的相关性

共享单车数据爬取_共享单车数据探索性分析_第11张图片
对tripduration和age做min-max归一化,使其落在[0,1]区间上

四、模型建立

运用K-Means算法对相关特征进行训练

共享单车数据爬取_共享单车数据探索性分析_第12张图片
用肘方法评估合适的K值(K个类别)

共享单车数据爬取_共享单车数据探索性分析_第13张图片
K=8是的平均轮廓系数较大,选取K=8进行聚类,并为用户数据打上类别标签

共享单车数据爬取_共享单车数据探索性分析_第14张图片
统计8个类别的占比

共享单车数据爬取_共享单车数据探索性分析_第15张图片
统计8个类别各特征的均值并展示

共享单车数据爬取_共享单车数据探索性分析_第16张图片
观察各类别中的特征情况,作为分析依据

五、数据解读

#类别0: 该群体为男性群体,占比达27%,年龄偏大,骑行时间段主要集中在9点至16点的时间段;
#类别1: 该群体为男性群体,占比达20%,骑行时间集中在晚高峰16点至19点;
#类别2: 该群体为男性群体,占比达16%,骑行时间集中在早高峰6点至9点;
#类别3: 该群体主要为男性,占比达12%,年龄偏年轻,骑行时间集中在自由时间19点至24点;
#类别4: 该群体为女性群体,占比达9%,骑行时间集中在9点至16点;
#类别5: 该群体主要为男性,占比达5%,骑行时间集中在0点至6点,骑行时间与距离较短;
#类别6: 该群体为女性群体,占比达6%,骑行时间集中在晚高峰16点至19点,且骑行时间与距离较长;
#类别7: 该群体为女性群体,占比达5%,骑行时间集中在早高峰6点至9点;

结论:

1.上下班的早高峰时间段,用车需求量较大,可能为上班族或学生,比起女性用户,男性用户使用共享单车的比例更大;
2.年轻用户偏向于在晚上的自由时间段骑行,年龄偏大的用户偏向于在白天的自由时间段骑行;
3.女性群体的骑行时间与距离相对较长;
4.早上凌晨(0-6点)的骑行人数较少,用车需求量少,且骑行距离较短

六、其他指标

6.1 平均骑行时长,超过30分钟的比例

共享单车数据爬取_共享单车数据探索性分析_第17张图片

6.2 会员与非会员的平均骑行时长

共享单车数据爬取_共享单车数据探索性分析_第18张图片

6.3 周末、工作日骑行时间对比

共享单车数据爬取_共享单车数据探索性分析_第19张图片

6.4 一天哪个时间段使用最频繁

共享单车数据爬取_共享单车数据探索性分析_第20张图片
总体与会员的骑行热度基本上一致

共享单车数据爬取_共享单车数据探索性分析_第21张图片
可以看出总体与会员在上下班高峰的8点、17点、18点达到高峰;而非会员在14点达到高峰

6.5 最受欢迎的站点

共享单车数据爬取_共享单车数据探索性分析_第22张图片

为了避免很多人一下子到这些站点取车,结果用户到了之后会发现:车不够取得尴尬场面。从而给竞争对手有机可乘,应该在进一步调研之后加大在这些站点的单车投放量。

七、业务建议

1.上下班用户群体,该群体对单车需求刚性较大,使用时间也较固定,可结合地理数据维度找到该客户群使用频率最集中的地理位置及时间段,适当增加共享单车的供应及路标,以避免出现供不应求的情况导致用户流失;
2.针对临时性需求但骑行距离较长的散客用户,可增加拉新活动,如骑行累积时长或距离助力环保换取合作线下店铺消费券,通过内容吸引消费者以培养环保意识,普及骑行文化,最终提升用户粘性并完成订阅转化;
3.节假日周末时,骑行需求会相应上升,可以搞一些促销活动,提高转化率与订阅;建立完备的会员积分系统,优化用户体验,提升用户粘性与病毒性;
4.制定关于骑行时长的定价策略,提高用户变现收益;建立奖励机制或成就系统,鼓励用户多骑行,形成使用习惯或消费习惯,保持长期活跃

你可能感兴趣的:(共享单车数据爬取)