IBM SPSS Modeler 【4】 神经网络模型的测试验证

2、神经网络模型的测试验证

(1)          在以上步骤的基础上,导入新的样本数据作为测试数据。在同一个流中,利用“可变文件”导入 Demos”文件夹下的“GOODS2n”数据作为测试数据。

(2)          同样地,还是利用“输出”下的“表”来查看一下“GOODS2n里面存的数据,如图 30 所示,这里的数据跟“GOODS1n”几乎一样。为了对“GOODS2n”中的数据进行预测,需要将“After”字段过滤掉。

(3)          过滤“GOODS2n”的数据。在这里,利用“字段选项”下的“过滤”节点对“GOODS2n” 的数据进行过滤。选定“GOODS2n”节点,并双击“字段选项”选项卡下的“过滤”,即可以得到一个过滤器。然后,双击工作区的“过滤”节点,如图 31 所示。之后依次点击“After” 行中的过滤,点击“确定”后即可完成过滤。

 图 30 查看数据

 

 图 31 过滤“GOODS2n”的数据

(4)          接入神经网络。选定工作区的“过滤”,双击右上侧的“Increase”神经网络模型,即完成接入,如图 32

图 32 工作区中的 Increase 节点

 

(5)          查看由神经网络模型预测输出的数据。选定预测的“Increase”模型节点,利用 “输出”下的“表”来查看神经网络的预测输出,如图 33 所示。其中,“$N-Increase”字段即为神经网络模型预测输出的促销前后收入百分比。

 图 33 查看由神经网络模型预测输出的数据

 

(6)          将预测输出的数据规范到 0-1 之间。在这里,利用“字段选项”下的“导出”进行规范化。先删除由上一步骤新添的表,选定“Increase”模型,双击“导出”。然后,对“导出”进行编辑,其中,“导出字段”为“Format”,“导出为”下拉列表选择“公式”,接下来需要编写公式“1/(1+exp(-'$N-Increase')”,如图 34

 图 34 将预测输出的数据规范到 0-1 之间

 

(7)          查看规范化后的预测值。同样利用“输出”下的“表”进行查看,如图 35 所示。

表中显示预测值都已规范到 0-1 之间。

 图 35 查看规范化后的预测值

 

(8)          到目前为止,商场的管理人员已经可以根据预测数据和具体的实际情况实施促销方案。但是这样的方案选择是并不方便的,于是实验继续,目的方便促销方案的选择。

(9)          确定“Format”后预测值的范围,这是为了防止在规划化(四舍五入)后造成数据的不精确。先在“Format”节点之后添加一个“类型”节点,双击“类型”,依次点击“清除所有值”,“读取值”。接下来“Format”字段的“值”项,点击“指定”,即可以得到如图

36 的指定值。从窗口中可以观察到规范化后预测值的上下限。

 图 36  Format 值窗口

 

(10)      利用“记录选项”选项卡下的“选择”项对预测值进行选择。先将上一步中的“类型”删除,然后双击“记录选项”下的“选择”,即可在工作区得到一个“选择”节点,双击该节点进行公式的编辑。如图 37 所示。其中,表达式为“Format >= 0.9999”。

 图 37 “选择”节点编辑窗口

 

(11)      查看选择后的预测数据。同样,利用“输出”下的“表”进行查看。如图 38 所示。由表中可以看到,满足条件(Format 值都为 1.000)的共有 102 条记录。这些方案都是比较理想的促销方案样本集。

 图 38 查看选择后的预测数据

 

(12)      将选择的方案以“Excel”形式输出。首先,需要在“选择”之后,添加“类型” 节点,以读出数据类型。双击“类型节点”,点击“读取值”,将需要导出的字段设置为“目标”,单击确定。如图 39所示。

 图 39 将选择的方案以“Excel”形式输出

 

(13)      导出 Excel 文件。在“类型”之后添加“导出”下的“Excel”节点,选择路径和文件名,如图 40,单击确定。最后运行该节点,即完成了 Excel 文件的导出。

 图 40 导出 Excel 文件

 

到目前为止,已经完成该实验的全部内容。

 

你可能感兴趣的:(SPSS,数据挖掘,machine,learning,教程)