IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用商业技术,快速建立预测性模型,并将其应用于商业活动,从而改进决策过程。
SPSS Modeler 提供了各种借助机器学习、人工智能和统计学的建模方法。通过建模选项中的方法,您可以根据生成新的信息以及开发预测模型。
强大的数据读取功能
丰富的数据处理方法
图形化数据探索方式
核心的数据挖掘算法
简洁直观的模型评估
性能卓越的三层体系结构
Modeler软件全程拖拉操作,可设置简体中文,与Python等软件相比不需要编程
学习周期短,可以连接各种数据源做分析,自动化分析
不需要精通统计学,黑箱算法,容易学会高级分析师必备数据挖掘能力
处理大数据(对于Excel、SPSS 、数据库处理不了的算法可以处理)
简单使用对于(R语言,MATLIB,SAS处理繁琐的可以处理)
IBM SPSS Modeler 与SPSS Modeler 的区别
功能:数据分析、数据挖掘、可视化
1.数据分析:描述统计、相关/因子分析、异常检测、方差分析,.....
描述数据:列连表、归纳分析
异常检测:k-sigma
方差分析:单/双因子
2.数据挖掘:属性筛选、分类预测、回归预测、聚类分析、关联分析、时间序列、......
属性筛选:重要性分析,主成分分析
分类预测:决策树、神经网络、回归树
聚类分析:k均值聚类、两阶段聚类
3.可视化:散点图、线图、箱线图、网络图、帕累托图、......
SPSS Modeler生活中的应用
CRM、Risk、欺诈识别、RFM、客户流失分析、警情概括
数据流编辑区域
数据流编辑区域位于主窗口中间部分,是建立和编辑SPSS Modeler数据流的区域
依据数据挖掘方法论建立PSS Modeler数据流
节点工具箱窗口
SPSS Modeler最基本的操作就是将 【节点区】的节点拖入到【数据流构建区】,利用数据流进行连接,实现各种功能
流管理窗口
流管理窗口位于主窗口右侧上方,可通过左右按钮是使窗口呈:“可见或”不“不可见”状态
流管理窗口由 “流” “输出” “模型” 选项卡组成
项目管理窗口
项目是多条数据流及相应运行结果(包括报表、图形和模型结果)的集合,通常包含商业了解、数据了解、数据准备、建模、评估、部署等子项目。且各子项目由相应的数据流和运行结果
操作使用Modeler的目标是建立数据流,即根据数据挖掘的实际需要,选择节点,依次连接节点建立数据流,不断修改和调整数据流中节点的参数,运行数据流,最终完成相应的数据挖掘任务
选择和管理节点 节点连接和调整 设置节点参数 运行数据流
右击数据流编辑区域中的当前节点(呈反向黄色显示),选择弹出菜单中的选项(或利用快捷键),对数据流的节点进行管理
起始节点、中间节点和终止节点的弹出菜单有些不同
右击某节点,选择弹出菜单中的“编辑”,即可实现该节点的参数设置
所有节点参数中都有“重命名并标注”,如图所示。不同节点的大部分参数内容是不同的,了解节点的功能,掌握其方法原理,是理解参数含义,正确设置参数值的前提,也是学习和使用SPSS Modeler难点
数据流运行成功,所生成的数据表或模型结果会显示在流管理器的相应选项卡中
否则,SPSS Modeler会给出数据流运行错误的提示信息,用户需对节点参数进行重新调整后在运行数据流
数据流运行过程中,若单击工具栏上的按钮,则可强行中断数据流的运行
缓存节点,顾名思义是节点具有数据缓存的作用,即可在某个节点上建立一个数据缓存区,存放数据流运行至此的中间结果,并可保存到磁盘文件中
超节点是由多个节点集成在一个节点中形成的,便于数据流的浏览和管理
SPSS Modeler中的超节点包括三种类型:左侧无连接的超节点,两侧均有连接的超节点,右侧无连接的超节点