聚类分析实验报告

聚类分析在市场细分中的目的是构建细分市场,基本思想是“物以类聚”,辨别事物在某些特征上的相似性或相异性,并按照这些特性将事物划分为几个类别,是在同一类别中的事物有较大的相似性,不同类别中的事物有较大的差异。
本文介绍的是聚类分析方法中的非层次聚类法——K-Means聚类法,也称快速聚类法。适用于大样本的聚类分析,可以节省运算时间。该实验的数据来源于上一个因子分析实验的结果(三列FAC)。

实验目的


实验内容


实验步骤

第一步,分析-分类-K-均值聚类,将因子分析得到的三类原始数据重命名为“长途及电话卡”、“设备及无线”、“收费”,并将这三类数据作为“变量”,将“聚类数”设为5。操作如下图所示:

*注意:聚类数不是随便设置的,数据设置依据个人的实验经验或对样本数据进行合理分析得到的。本次实验聚类数为5是由我们老师凭据样本数据1000个,根据经验得出,最后实验结果也合理。

聚类分析

聚类分析

第二步,依次将“迭代”、“保存”、“选项”中所需的项目选上,操作如下所示:

迭代

保存

选项

实验结果

最终聚类中心

由最终聚类中心表可知,K均值聚类把1000个样本数据分为了五类,第一类人群使用“长途电话及电话卡”、“设备及无线”和“收费”的方式差不多;第二类人群大都选择了“长途及电话卡”这种方式;第三类人群较多地使用“收费”的方式;第四类人群大部分也选择了“长途及电话卡”这种方式;第五类人群则选择了“设备及无线”这种方式。

聚类数目

由上表可知,实验通过快速聚类细分各变量的显著性确定细分市场的数目,将市场分为了五类。数据分布不是很均匀,有极端数据出现,比如第一类人群共有552个样本,第二类人群只有32个样本。这样有可能会使实验精度不够,结果分析不能全面反映实际情况。

附上一份对上表结果进行F检验的虚拟数据

注:***p<0.001

表中显示类别间距离差异的概率值均小于0.001(即P<0.001),三个因素变量均达到显著差异。表中F统计量表示每个变量方差解释能力,近似作为评判哪个变量在聚类分析中的作用更大的标准。在虚拟数据表中,三个因素对聚类结果的重要程度排序为:因素一>因素二>因素三。

你可能感兴趣的:(聚类分析实验报告)