spss基本总结——聚类分析

spss基本分析总结

聚类分析和判断分析

聚类分析
Kmeans快速聚类分析
Hierarchical Cluster层次聚类分析
Q型聚类
R型聚类

当观察值个数较多或文件非常大时,应使用快速聚类分析。层次聚类在大数据下图形过于分散,不易解释。

连续变量的样本距离测量方法
测量方法 计算公式
欧式距离 spss基本总结——聚类分析_第1张图片
Chebychev距离 在这里插入图片描述
Block距离 在这里插入图片描述
Minkowski距离 在这里插入图片描述
Customized用户自定义距离 在这里插入图片描述
连续变量的样本亲疏程度的其他测量方法
  • Pearson相关系数
  • Sosine相似度

Sosine计算公式:
spss基本总结——聚类分析_第2张图片

顺序或名义变量的样本亲疏程度测量方法
  • Chi-square measure
    spss基本总结——聚类分析_第3张图片
  • Phi-square measure
    spss基本总结——聚类分析_第4张图片
样本与小类,小类与小类亲疏关系计算方法
  • 最短距离法
  • 最长距离法
  • 类间平均链锁法
    两小类之间的距离为两个小类内所有样本间的平均距离
  • 类内平均链锁法
  • 重心法
  • 离差平方和法
    聚类过程中,让小类内各个样本的欧氏距离总平方和增加最小的小类合成一类
SPSS层次聚类分析概要结果

spss基本总结——聚类分析_第5张图片
spss基本总结——聚类分析_第6张图片
凝聚状态表:
spss基本总结——聚类分析_第7张图片

快速聚类分析计算过程
  • 指定用户聚类为几类
  • 确定K个类的初始类中心点
  • 计算样本数据点到k个类中心点的欧氏距离
  • 重新确定k个类的中心点
  • 迭代到判断要求为止

你可能感兴趣的:(数学建模)