SPSS 初步介绍

Mdeler概述

SPSS Modeler基本认识

IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用商业技术,快速建立预测性模型,并将其应用于商业活动,从而改进决策过程。

SPSS Modeler 提供了各种借助机器学习、人工智能和统计学的建模方法。通过建模选项中的方法,您可以根据生成新的信息以及开发预测模型。

SPSS Modeler特点

  1. 强大的数据读取功能

  2. 丰富的数据处理方法

  3. 图形化数据探索方式

  4. 核心的数据挖掘算法

  5. 简洁直观的模型评估

  6. 性能卓越的三层体系结构

SPSS Modeler软件优势

  • Modeler软件全程拖拉操作,可设置简体中文,与Python等软件相比不需要编程

  • 学习周期短,可以连接各种数据源做分析,自动化分析

  • 不需要精通统计学,黑箱算法,容易学会高级分析师必备数据挖掘能力

  • 处理大数据(对于Excel、SPSS 、数据库处理不了的算法可以处理)

  • 简单使用对于(R语言,MATLIB,SAS处理繁琐的可以处理)

    IBM SPSS Modeler 与SPSS Modeler 的区别

    功能:数据分析、数据挖掘、可视化

    1.数据分析:描述统计、相关/因子分析、异常检测、方差分析,.....

    • 描述数据:列连表、归纳分析

    • 异常检测:k-sigma

    • 方差分析:单/双因子

    2.数据挖掘:属性筛选、分类预测、回归预测、聚类分析、关联分析、时间序列、......

    • 属性筛选:重要性分析,主成分分析

    • 分类预测:决策树、神经网络、回归树

    • 聚类分析:k均值聚类、两阶段聚类

    3.可视化:散点图、线图、箱线图、网络图、帕累托图、......

    SPSS Modeler生活中的应用

    CRM、Risk、欺诈识别、RFM、客户流失分析、警情概括

    工具安装

    • 官网下载安装包:SPSS Modeler - 中国 | IBM
    • 解压安装包,根据电脑配置选择安装,运行setup.exe文件
    • 安装完成SPSS Modeler界面,选择创建新流

    窗口说明

    数据流编辑区域

    • 数据流编辑区域位于主窗口中间部分,是建立和编辑SPSS Modeler数据流的区域

    • 依据数据挖掘方法论建立PSS Modeler数据流

      节点工具箱窗口

      SPSS Modeler最基本的操作就是将 【节点区】的节点拖入到【数据流构建区】,利用数据流进行连接,实现各种功能

      流管理窗口

      流管理窗口位于主窗口右侧上方,可通过左右按钮是使窗口呈:“可见或”不“不可见”状态

    流管理窗口由 “流” “输出” “模型” 选项卡组成

项目管理窗口

项目是多条数据流及相应运行结果(包括报表、图形和模型结果)的集合,通常包含商业了解、数据了解、数据准备、建模、评估、部署等子项目。且各子项目由相应的数据流和运行结果

数据挖掘方法论

操作使用Modeler的目标是建立数据流,即根据数据挖掘的实际需要,选择节点,依次连接节点建立数据流,不断修改和调整数据流中节点的参数,运行数据流,最终完成相应的数据挖掘任务

数据流基本管理

选择和管理节点 节点连接和调整 设置节点参数 运行数据流

选择和管理节点

  1. 右击数据流编辑区域中的当前节点(呈反向黄色显示),选择弹出菜单中的选项(或利用快捷键),对数据流的节点进行管理

  2. 起始节点、中间节点和终止节点的弹出菜单有些不同

设置节点参数

右击某节点,选择弹出菜单中的“编辑”,即可实现该节点的参数设置

所有节点参数中都有“重命名并标注”,如图所示。不同节点的大部分参数内容是不同的,了解节点的功能,掌握其方法原理,是理解参数含义,正确设置参数值的前提,也是学习和使用SPSS Modeler难点

运行数据流

  1. 数据流运行成功,所生成的数据表或模型结果会显示在流管理器的相应选项卡中

  2. 否则,SPSS Modeler会给出数据流运行错误的提示信息,用户需对节点参数进行重新调整后在运行数据流

  3. 数据流运行过程中,若单击工具栏上的按钮,则可强行中断数据流的运行

缓存节点

缓存节点,顾名思义是节点具有数据缓存的作用,即可在某个节点上建立一个数据缓存区,存放数据流运行至此的中间结果,并可保存到磁盘文件中

超节点

超节点是由多个节点集成在一个节点中形成的,便于数据流的浏览和管理

SPSS Modeler中的超节点包括三种类型:左侧无连接的超节点,两侧均有连接的超节点,右侧无连接的超节点

你可能感兴趣的:(python,开发语言,大数据)