油耗预测实战

油耗预测实战

本文复现的是龙龙老师的第六章的油耗预测实战内容:
采用的数据集是Auto MPG数据集,首先输入所需要的库文件。

油耗预测实战_第1张图片然后加载数据集,并复制读取的数据对新的对象上,避免对原始数据进行修改。
油耗预测实战_第2张图片现在我们看一下程序下载下来的数据集缓存在哪里?

在这里插入图片描述油耗预测实战_第3张图片突然发现路径下没有 “.keras”文件夹。。。有点尴尬。一顿百度发现可能是隐藏了,果断Ctrl+h 尝试一下。
油耗预测实战_第4张图片
原来它在这里!!然后继续前进看下数据

油耗预测实战_第5张图片接下来我们print(dataset)调试窗口看一下加载进来的数据是什么样的:一共398条数据
油耗预测实战_第6张图片下一步:查看数据中是否有无效数据,查看结果显示应该是Horsepower 数据有6条数据为无效!
油耗预测实战_第7张图片
移除无效数据后重新查看,现已清除无效数据了
油耗预测实战_第8张图片进行 origin = dataset.pop(‘Origin’) 后,进行提取origin列
油耗预测实战_第9张图片在进行one-hot操作之前,我们对照一下执行前后的数据变化。
执行数据前:
油耗预测实战_第10张图片
下面我们执行程序:

dataset['USA'] = (origin == 1)*1.0
# one-hot转换:只有当列数据中值为1时,才设为1,否则为0,也就相当于一整列数据按 (origin == 1)条件转换为1 or 0

dataset['Europe'] = (origin == 2)*1.0
dataset['Japan'] = (origin == 3)*1.0
dataset.tail()  # 显示表格数据

执行程序后,我们可以看到列由7变成了10,原来的‘origin’没有了!!多出了‘USA’,‘Europe’,‘Japan’ 三列。
觉得这么做的原因应该是更好辨别当前的行记录是否是对应列的产地。

油耗预测实战_第11张图片#切分训练集和测试集

…***未完,待续.***…

你可能感兴趣的:(项目实战)