聚类分析的原理和应用(二)

本文主要讲述聚类分析在SPSS中的实现,和对结果的解读  主要应用K均值聚类、系统聚类、两步聚类法

案例一        K均值聚类在移动用户分类中的应用

1.自变量的类别和定义如下 (客户在不同时间段的通话时长和平均时长)


聚类分析的原理和应用(二)_第1张图片

2.观察数据发现平均通话时长跟总通话时长不在一个数量级上,考虑对数据进行标准化处理


聚类分析的原理和应用(二)_第2张图片

3.单击分析→分类→K均值聚类 弹出如下对话框选入六个变量,在选项对话框中将迭代次数定位100,K均值聚类需要自定义聚类数目,这里选择为5类(4-8类是常见的聚类类别)

如下图得到分类结果,标准化可以消除数据数量级的差异,但是不便于阅读,我们需要转化成可读的方式


聚类分析的原理和应用(二)_第3张图片

3.单击分析均值→平均值 对话框,在选项中选取平均值,进行运算


聚类分析的原理和应用(二)_第4张图片



4.得到结果如下:


聚类分析的原理和应用(二)_第5张图片


聚类分析的原理和应用(二)_第6张图片

然后公司就可以针对不同的用户特点,推出不同的套餐,以增加用户的消费


案例二  对变量的聚类   系统聚类法

1.如下图:数据集是不同国家的裁判对不同运动员的打分情况


聚类分析的原理和应用(二)_第7张图片

2.下图是选项和参数的设置 ,变量的聚类距离选取(皮尔逊相关性


聚类分析的原理和应用(二)_第8张图片


3.下图是分析结果

表一  是聚类过程  首先把2和4聚为一类 ,接下来把3和7聚为一类,依次类推

图一  是冰柱图可以忽略,图二是树状图,要重点关注和解读


聚类分析的原理和应用(二)_第9张图片
图二

4.对结果的解读如下

图二的结果 按照最大的距离作为25,其他的以25做参照化简

可以看到非专业裁判8和其他专业裁判到距离为25才聚为一类(非专业与专业裁判有较大差异)

3.5.7聚为一类,罗马尼亚、中国和俄罗斯聚为一类裁判得分相近

1.2.4.6 意大利、韩国、法国、美国 聚为一类得分相近  这两个东西方阵营之间存在差异,但是他们之间的差异小于 专业裁判与非专业裁判之间的差异

你可能感兴趣的:(聚类分析的原理和应用(二))