Kaggle上8个非常适合新人的项目

从3W+项目中,为大家挑选了这8个: 零项目经验的同学建议从Compete-Get Started级别开始。 网上也有很多优秀的Kaggle数据集的分析项目,如果不知道如何入手,可以查看Kernel部分别人共享的Tutorials,或者自行Google,从借鉴别人的优秀经 验开始。 适合新人的Kaggle项目

1、Hotel booking demand酒店预订需求 www.kaggle.com/jessemostipak/hotel-booking-demand

该数据集包含城市酒店和度假酒店的预订信息,包括预订时间、停留时间,成人/儿童/婴儿人数以及可用停车位数量等信息。 适用场景:社会科学、旅行、酒店、用户行为,不具有明显的行业标识,可进行常规用户行为分析

数据量:32列共12W数据量。

可以定义的问题: 1)基本情况:城市酒店和假日酒店预订需求和入住率比较; 2)用户行为:提前预订时长、入住时长、预订间隔、餐食预订情况; 3)一年中最佳预订酒店时间; 4)利用Logistic预测酒店预订。

2、Video Game Sales电子游戏销售分析

www.kaggle.com/gregorut/videogamesales

包含游戏名称、类型、发行时间、发布者以及在全球各地的销售额数据。 适用场景:电商、游戏销售,常规销售数据。 数据量:11列共1.66W数据量。 可以定义的问题: 1)电子游戏市场分析:受欢迎的游戏、类型、发布平台、发行人等; 2)预测每年电子游戏销售额。 3)可视化应用:如何完整清晰地展示这个销售故事。

3、US Accidents 美国交通事故分析(2016-2019)

/www.kaggle.com/sobhanmoosavi/us-accidents

覆盖全美49州的全国性交通事故数据集,时间跨度:2016.02-2019.12,包括事故严重程度、事故开始和结束时间、事故地点、天气、温度、湿度等数据。 适用场景:无明显行业标识,通用。 数据量:49列共300W数据量。 可以定义的问题: 1)发生事故最多的州,什么时候容易发生事故; 2)影响事故严重程度的因素; 3)预测事故发生的地点; 4)可视化应用:讲述4年间美国发生事故的总体情况

 

你可能感兴趣的:(kaggle,游戏,java,大数据,python,人工智能)