SPSS Modeler基础操作与模型求解

SPSS Modeler简介

IBM SPSS Modeler前身是英国ISL公司开发的一款数据挖掘工具产品,1998年被SPSS公司收购,并重新整合开发。
由于SPSS Modeler拥有丰富的数据挖掘算法,支持与数据库之间的数据和模型交换;同时,具有可视化操作界面,简单易用,分析结果直观易懂,图形功能强大等特点。已从诸如Statsoft Statistics、SAS Enterprise Miner、Oracle DM、MATLAB、Angoss等众多数据挖掘软件中脱颖而出。

SPSS Modeler窗口简介

SPSS Modeler基础操作与模型求解_第1张图片

数据流编辑区

数据流编辑区是建立和编辑SPSS Modeler数据流的区域,用户的大部分操作时在这个区域内完成的。

节点工具箱窗口

SPSS Modeler数据流是由多个节点组成的。节点工具箱中存放着SPSS Modeler的所有结点工具,这些节点均以图符形式显示,可实现数据采集、数据展示、数据预处理、数据建模以及模型评估等功能。

模型求解的一般过程

SPSS Modeler基础操作与模型求解_第2张图片

案例一

问题描述:
案例数据是Modeler软件自带的一份关于药物研究的数据。大批患有同种疾病的不同病人,服用五种药物中的一种(Drug,分为Drug A,Drug B,Drug C,Drug X和Drug Y)之后都取得了同样的治疗效果。现需要利用数据挖掘发现以往药物处方适用的规律,给出不同的临床特征病人更适合服用哪种药物的建议,为未来医生开具处方提供参考。
案例数据是随同挑选的部分病人服务药物前的基本临床检查数据,包括:病人的年龄(Age)、性别(Sex)、血压(BP)、胆固醇(Cholesterol)、唾液中钠元素(Na)和钾元素(K)含量。

步骤:

  1. 读取数据到SPSS Modeler中。在数据源选项卡中选择变量文件,编辑该节点,选择数据的位置。
    SPSS Modeler基础操作与模型求解_第3张图片

  2. 浏览数据内容。选择输出选项卡中的表格节点,右键运行。
    SPSS Modeler基础操作与模型求解_第4张图片

  3. 观察各个变量的数据分布特征。选择输出选项卡中的数据审核节点,将数据流连接该节点,执行该节点。
    SPSS Modeler基础操作与模型求解_第5张图片

SPSS Modeler基础操作与模型求解_第6张图片

  1. 观察服用不同药物的病人唾液中,Na和K的含量情况。选择图形选项卡中的散点图,选择Na作为X轴,K作为Y轴,交叠字段的颜色选择Drug(即按照Drug进行分类来画散点图),运行。
    SPSS Modeler基础操作与模型求解_第7张图片

SPSS Modeler基础操作与模型求解_第8张图片

  1. 根据散点图的分布情况,可以得出服用的药物可能跟Na/K的比值存在一定的关系,因此,用新变量Na/K的比值代替Na和K两个字段。操作:选择字段选项选项卡中的导出节点,设置导出的字段名为Na/K,字段类型为Na/K,公式为Na/K(即Na字段的值除以K字段的值),确定。
    SPSS Modeler基础操作与模型求解_第9张图片

  2. 观察不同血压特征的病人药物选择情况。选择图形选项卡中的网络节点,选择BP、Drug两个字段,运行。
    SPSS Modeler基础操作与模型求解_第10张图片
    SPSS Modeler基础操作与模型求解_第11张图片

  3. 全面分析决定药物的影响方式。本次采用C5.0算法(决策树模型中的一个算法,想深入了解的可以去查阅相关资料,弄懂该算法的具体步骤)。
    第一步:通过字段选项中的过滤器节点将Na和K过滤;
    SPSS Modeler基础操作与模型求解_第12张图片

第二步,选择字段选项选项卡下的类型节点,设置各个字段的类型,将Drug字段的角色设置为目标,其他设置为输入。
SPSS Modeler基础操作与模型求解_第13张图片
第三步,选择建模选项卡下的C5.0,编辑该节点,将Drug作为目标,Age、Sex、BP、Cholesterol、Na/K作为输入,点击运行。会生成一个钻石一样的图标(即模型求解的结果)。
SPSS Modeler基础操作与模型求解_第14张图片
第四步,右键编辑钻石图标,查看求解的结果。
SPSS Modeler基础操作与模型求解_第15张图片
可根据左侧的树形结构来给未来医生开处方提供参考。

数据流向

SPSS Modeler基础操作与模型求解_第16张图片

你可能感兴趣的:(SPSS,Modeler,算法)