大数据应用技术课程实践--选题与实践方案

一、选题与意义

1.Hadoop平台应用

2.Kaggle分析数据项目

简要说明理由与意义。

Kaggle分析数据项目:kaggle泰坦尼克之灾

https://www.kaggle.com/c/titanic

首先是自己电脑配置的硬件问题,再之后是因为对这个比较感兴趣,而且这个项目可以参赛获奖,

我可以先从这个比较简单的项目入手。

二、实践方案

  从kaggle平台下载数据,然后用python语言对数据进行分析处理,我的电脑已经装好了python3.7,环境配置好了,

  编辑软件有pycharm、anaconda。

三、实践任务分解

根据所选的题目,明确实验步骤,分解任务到每天。

  1、获取数据

  2、清洗数据

  3、分析数据

  4、建立模型

  5、训练模型

  6、模型评测

大数据应用技术课程实践--选题与实践方案_第1张图片

 

 

四、实践计划

按任务分解撰写计划表,每天按计划表开展工作。

第天根据实际情况更新计划表,有必要时调整。

 

  1、获取数据

  2、清洗数据

  3、分析数据

  4、建立模型

  5、训练模型

  6、模型评测 

kaggle平台:

https://www.kaggle.com/competitions

 

说明:

  • 个人项目,不要求组队,确实需要组队的说明理由。
  • 边操作边记录;
  • 每天完成当天文档;
  • 最后综合成课程实践报告。

你可能感兴趣的:(大数据应用技术课程实践--选题与实践方案)