UCI数据集数据的分析(补充)——葡萄酒数据

1、提出问题

     在前面,我们已经学了影响红白葡萄酒质量的相关因素以及两种酒的物理化学性质的差异。那么我们该怎么运用物理化学性质来确定一种酒是红葡萄酒还是白葡萄酒呢?

2、分析问题

    根据前面的研究可知与葡萄酒的类型密切相关的因素有酒精度、硫酸盐、挥发酸、总二氧化硫、残糖,所以我们下面把这5个变量作为输入向量,把葡萄酒类型作为输出向量构建神经网络。

(注意:先把酒的类型数值化,定义0表示白葡萄酒,1表示红葡萄酒)。

3、解决问题

    原数据共有6497个样本,其中红葡萄酒样本:白葡萄酒样本=1:3,我们决定分别取红白葡萄酒数据的3/4来构建BP神经网络,剩下的作为测试集,而且训练时间取5000,训练精度取0.001,代码如下:

UCI数据集数据的分析(补充)——葡萄酒数据_第1张图片

4、测试过程    取4个测试数据如下:
 

测试代码(每一列为一个组向量):

UCI数据集数据的分析(补充)——葡萄酒数据_第2张图片

5、测试结果

UCI数据集数据的分析(补充)——葡萄酒数据_第3张图片

UCI数据集数据的分析(补充)——葡萄酒数据_第4张图片

     可见,结果完全吻合,且经过11次的学习就能达到设置的精度,结束学习。

你可能感兴趣的:(数据分析)