大数据应用技术课程实践--选题与实践方案

一、选题与意义

  1.选题:Kaggle分析数据项目:泰坦尼克号:从灾难中学习

  2.理由和意义:一:因为第一题需要构建很多镜像和平台,很难预测是否会在安装中报错等等,而且hadoop太久没用过了。第二题的话,所需的软件和环境都以及布置完成了,不需要再去构建。

                          二:更喜欢Kaggle分析数据

二、实践方案

  在https://www.kaggle.com/competitions 上下载数据集,再利用python进行数据处理和分析。

三、实践任务分解

大数据应用技术课程实践--选题与实践方案_第1张图片

 

 

四、实践计划

按任务分解撰写计划表,每天按计划表开展工作。

第天根据实际情况更新计划表,有必要时调整。

 大数据应用技术课程实践--选题与实践方案_第2张图片

 

 

1.

  • 网站用户购物行为分析
  • 官网:http://dblab.xmu.edu.cn/post/7499/
  • 淘宝双11数据分析与预测
  • 官网:http://dblab.xmu.edu.cn/post/8116/
  • 电信用户行为分析
  • http://dblab.xmu.edu.cn/post/useranalysis/

 

大数据平台安装软件:

链接:https://pan.baidu.com/s/1lZM6BkZ6XoRE3uwepsQ_5A
提取码:ao1m

虚拟机镜像文件:

链接:https://pan.baidu.com/s/1e0qak_9Uymn_R1HmSu5ZLw  
提取码:q0lt

 

2.

https://www.kaggle.com/competitions

你可能感兴趣的:(大数据应用技术课程实践--选题与实践方案)