机器学习--人口普查数据分析

机器学习--人口普查数据分析

在进行人口普查分析的时候需要对数据进行清洗;通过数据清洗的方法对数据进行清洗;

下载数据   从官方网站下载原始数据:UCI Machine Learning Repository

机器学习--人口普查数据分析_第1张图片

 机器学习--人口普查数据分析_第2张图片

 机器学习--人口普查数据分析_第3张图片

将下载好的adult.data文件转化成adult.csv文件

机器学习--人口普查数据分析_第4张图片

 

清洗数据

对数据进行清洗---对照https://archive.ics.uci.edu/ml/datasets/Adult中的数据信息进行清洗。

机器学习--人口普查数据分析_第5张图片

 替换方法

机器学习--人口普查数据分析_第6张图片

 

机器学习--人口普查数据分析_第7张图片

机器学习--人口普查数据分析_第8张图片

 机器学习--人口普查数据分析_第9张图片

 机器学习--人口普查数据分析_第10张图片

 机器学习--人口普查数据分析_第11张图片

 机器学习--人口普查数据分析_第12张图片

 机器学习--人口普查数据分析_第13张图片

 机器学习--人口普查数据分析_第14张图片

 将所有字符串替换完成后,将<=50K全部替换成0,>50K全部替换成1。

机器学习--人口普查数据分析_第15张图片

 机器学习--人口普查数据分析_第16张图片

 最后将?或者NAN替换成-1。注:一定要注意是否有空格。

机器学习--人口普查数据分析_第17张图片

清洗数据完成(一定要仔细数据清洗失误会导致决策树分析失败)

机器学习--人口普查数据分析_第18张图片

 清洗完数据之后到阿里云创建工程,进行配置。

 新建工程

机器学习--人口普查数据分析_第19张图片

 机器学习--人口普查数据分析_第20张图片

编辑工作流 

第一步创建一个COS数据集  输入--数据源--COS数据集

机器学习--人口普查数据分析_第21张图片

配置COS数据集

机器学习--人口普查数据分析_第22张图片 

 第二步创建一个修改列名  算法--机器学习算法--数据预处理--修改列名

机器学习--人口普查数据分析_第23张图片

 配置修改列名

机器学习--人口普查数据分析_第24张图片

 第三步进行数据切分  算法--机器学习算法--数据预处理--数据切分

机器学习--人口普查数据分析_第25张图片

数据切分配置

 机器学习--人口普查数据分析_第26张图片

第四步进行决策树分类 算法--机器学习算法--分类--决策树分类

 机器学习--人口普查数据分析_第27张图片

再配置决策树分类前面这个

 机器学习--人口普查数据分析_第28张图片

机器学习--人口普查数据分析_第29张图片

 进行连接

机器学习--人口普查数据分析_第30张图片

最后进行二分类任务评估 输出--模型评估--二分类任务评估

机器学习--人口普查数据分析_第31张图片

进行运行

机器学习--人口普查数据分析_第32张图片

 

你可能感兴趣的:(人工智能,人工智能)