对共享单车租用的数据分析及可视化Python

背景描述

自行车共享系统是一种租赁自行车的方式,其中通过整个城市的售货亭位置网络自动获得会员资格、租赁和自行车归还的过程。
使用这些系统,人们可以从一个地方租一辆自行车,并根据需要将其归还到另一个地方。目前,全球有500多个自行车共享项目。

这些系统生成的数据使它们对研究人员具有吸引力,因为旅行的持续时间、出发地点、到达地点和经过的时间都被明确记录下来。
因此,自行车共享系统充当传感器网络,可用于研究城市的流动性。
在本次比赛中,参赛者被要求将历史使用模式与天气数据相结合,以预测华盛顿特区首都自行车共享计划的自行车租赁需求。

数据来源:Bike Sharing Demand | Kaggle


import pandas as pd  # 读取csv文件
import matplotlib.pyplot as plt  # 画图

# 解决中文显示问题
plt.rcParams['font.sans-serif'] = ['SimHei']  # 显示中文标签  # 指定默认字体
plt.rcParams['axes.unicode_minus'] = False  # 解决保存图像是负号'-'显示为方块的问题
# 读取csv数据
df = pd.read_csv('train.csv')
List=df['season'].tolist()
Count=[0,0,0,0]
for i in List:
    Count[i-1]= Count[i-1]+1
Season={'春季','夏季','秋季','冬季'}
explode=[0.01,0.01,0.01,0.01]
plt.figure(figsize=(6,6))
plt.pie(Count,explode=explode,labels=Season,autopct='%1.2f%%')
plt.title('单车租用季节占比')
plt.show()



List1=df['casual'].tolist()
List2=df['registered'].tolist()
casual=0
registered=0
for i in List1:
    casual+=i
for j in List2:
    registered+=j
userValue=[casual,registered]
user=['未注册用户','已注册用户']
explode=[0.01,0.01]
plt.figure(figsize=(6,6))
plt.pie(userValue,explode=explode,labels=user,autopct='%1.2f%%')
plt.title('注册和未注册用户使用单车情况比较')
plt.show()

List1=df['weather'].tolist()
weather=['晴朗','多云','雨雪(小)','雨雪(大)']
Count.clear()
Count=[0,0,0,0]
for i in List1:
    Count[i-1]=Count[i-1]+1
for x,y in zip(weather,Count):
    plt.text(x, y+0.3, '%d' % y, ha='center', va='bottom', fontsize=7.5)
plt.plot(weather, Count,alpha=0.5, linewidth=1)
# plot中参数的含义分别是横轴值,纵轴值,线的形状('s'方块,'o'实心圆点,'*'五角星   ...,颜色,透明度,线的宽度和标签 ,

plt.legend()  # 显示上面的label
plt.xlabel('天气')  # x
plt.ylabel('数量')  # y
plt.title('天气对单车使用的影响')
plt.show()

你可能感兴趣的:(数据分析,python,数据分析,开发语言)