数据挖掘概述

常用数据挖掘工具

  • SAS,全称STATISTICAL ANALYSIS SYSTEM,统计分析系统;
  • SPSS,全称Statistical Product and Service Solutions,统计产品与服务解决方案;
  • KNIME,全称Konstanz Information Miner,数据挖掘软件平台

常用挖掘算法

  • 贝叶斯
  • 聚类
  • 神经网络
  • 决策树
  • 关联分析
  • 线性回归
  • 逻辑回归
  • 综合评价
数据挖掘概述_第1张图片
常用算法

BI进程

从初级到高级,统计 > 分析 > 挖掘,其中统计、分析这两项已基本普及。BI进程中偏重于挖掘,而挖掘很大程度属于人工智能方向。

统计、分析与挖掘的区别

  • 例如,企业的销售额下降了,那统计上要做的事,就是过去下降了多少。比如过去一周销售额有多少,对比前一周销售额下降了多少,这就是基本的统计;
  • 销售额下降了这么多,到底是哪些产品造成了下降?这是分析;
  • 造成这些产品销售额下降的因素是什么?这就是相关性的问题,然后未来可能下降,还是不可能下降呢?这就是回归,可以做线性回归,也可以做逻辑回归,即所谓的预测,在贝叶斯里面也可以做。

注意:这些过程都依赖于销售的指标体系和维度体系

你可能感兴趣的:(数据挖掘概述)