数据挖掘入门——思维导图

主要参考来源:http://www.saedsayad.com/data_mining_map.htm
原网址更像是一本书,首页是思维导图,点击图中各项可以访问更详细的内容。我这里只是列出了目录,如有时间我希望可以把内容也添加进来。

数据挖掘

  • 解释过去(数据探索)

    • 单因素分析

      • 分类变量

        • 计数、百分比计数
        • 饼图、条形图
      • 数值变量

        • 最小值、最大值、均值、中值、众数
        • 范围、分位数、方差、标准差、偏差系数
        • 偏度、峰度
        • 直方图、箱形图
    • 二元分析

      • 分类 vs 分类

        • 卡方检验
        • 条形图、组合图
      • 数值 vs 数值

        • 线性关系
        • 散点图
      • 分类 vs 数值

        • z检验、t检验
        • 方差分析
        • 线图、条形图、组合图
  • 预测未来(建模)

    • 分类

      • 频数表

        • zeroR分类器(计算其他模型准确度的基线)
        • oneR分类器(计算哪个特征与与测量更相关)
        • 朴素贝叶斯
        • 决策树
      • 协方差矩阵

        • 线性判别分析
        • logistic回归
      • 相似函数(欧氏距离、曼哈顿距离、明氏距离)(海明距离)

        • kNN(k近邻分类器)
      • 其他

        • 人工神经网络
        • 支持向量机
    • 回归

      • 频数表

        • 决策树
      • 协方差矩阵

        • 多元线性回归
      • 相似函数

        • kNN(k近邻分类器)
      • 其他

        • 人工神经网络
        • 支持向量机
    • 聚类

      • 层次方法

        • 凝聚层次聚类
        • 分裂层次聚类
      • 划分方法

        • kmeans
        • 自组织图
    • 关联性分析

你可能感兴趣的:(数据挖掘入门——思维导图)