python平台 租用_python数据分析实例:共享单车租用影响因素和预测

目录

一. 提出问题(Business Understanding )

近年来,共享经济热潮遍及全球,其中最成功的项目就是共享单车。‘共享’为我们的生活提供了极大的便利,同时也不可避免的出现资源不足或过剩的情况,如共享单车的企业采取合适的单车投放量成为重中之重。今天,我们就探讨一下影响共享单车租用量的各种因素。

2. 理解数据(Data Understanding)

2.1采集数据

2.2导入数据

2.3查看数据集信息

数据说明

datetime时间 - 年月日小时season季节 - 1 = spring春天, 2 = summer夏天, 3 = fall秋天, 4 = winter冬天

holiday节假日 - 0:否,1:是

workingday工作日 - 该天既不是周末也不是假日(0:否,1:是)

weather天气 - 1:晴天,2:阴天 ,3:小雨或小雪 ,4:恶劣天气(大雨、冰雹、暴风雨或者大雪)

temp实际温度 - 摄氏度

atemp体感温度 - 摄氏度

humidity湿度 - 相对湿度

windspeed风速 - 风速

casual - 未注册用户租借数量

registered - 注册用户租借数量

count - 总租借数量

3. 数据清洗(Data Preparation )

3.1 数据预处理

可以看到, datetime字段是日期格式,可以进一步处理得到年月日时间周几等信息;气温、体表温度、湿度、风速字段是连续变量,需要离散化处理后分析。

刚才提到,datetime字段可以进一步处理,得到年、月、日、时、周几等信息,从而进一步结合时间信息来分析A市共享单车需求。

#备份测试数据集

bikeDf=train

from datetime import datetime

#月份

def get_month(x):

dateStr=x.split()[0]

dateDT=datetime.strptime(dateStr,'%Y-%m-%d')

month=dateDT.month

return month

bikeDf['month']=bikeDf.datetime.apply(get_month)

#星期

def get_weekday(x):

dateStr=x.split()[0]

dateDT=datetime.strptime(dateStr,'%Y-%m-%d')

week=dateDT.we

你可能感兴趣的:(python平台,租用)