杏花开生物医药统计
一号在手,统计无忧!
关 注在SPSS中进行医学数据的
K-means聚类分析
关键词:SPSS、聚类分析
导 读上期,我们介绍了对医学数据进行系统聚类的基本原理及其案例应用。
详见:《在SPSS中进行医学数据的系统聚类分析》
系统聚类适用于未知分类,而K-means聚类则事先知道分类数,相较于系统聚类具有更小的计算量和更快的计算速度。
本期,我们来介绍K-means聚类的基本原理、适用范围及其在SPSS中的具体操作步骤。
下方为视频版和音频版,含软件操作步骤
一、基本形式K-means聚类,也称快速聚类法或逐步聚类法。其聚类的基本思想是按照指定的分类数,按照某种原则选择某些观测作为凝聚点;按就近原则将剩余观测向凝聚点聚集,得到初始分类方案,并计算各初始分类的均值;使用计算出的均值再次就近向均值聚集,各观测的分类情况会在运算过程中不断改变,分类完毕后再次计算各类的均值;如此反复循环,直到凝聚点位置达到收敛标准为止。
二、适用范围K-means聚类适用于连续的数据资料,已知样本分类,且要求数据符合正态分布、方差齐性的条件,同时K-means聚类仅只能对记录进行分类。
三、案例解读我们收集了一份80名糖尿病患者的晨起血糖值的记录,如果需要将糖尿病患者患病情况分为正常、可控和严重三类,采用K-means聚类分析进行具体分类,具体操作如下:
(1)具体操作步骤
①依次点击“分析——分类——K-均值聚类”。
(点击图片查看大图)
②出现“K-均值聚类分析”窗口。
(点击图片查看大图)
③将晨起血糖变量放入“变量”框中,并在聚类数框中填入“3”;点击“保存”,出现“K-均值聚类分析:保存新变量”对话框,勾选“聚类成员”。
(点击图片查看大图)
④点击“选项”,出现“K-均值聚类分析:图”对话框,勾选“初始聚类中心”和“每个个案的聚类信息”。
(点击图片查看大图)
⑤点击“继续”,“确定”,得到分析结果。
(2)结果解读
①回到“数据视图”窗口,可以看到,数据列中出现了对个案记录进行分类的结果。
(点击图片查看大图)
②其次,查看“每个聚类中的个案数目”表,可以看到,有29名患者为第1类,21名患者为第2类,30名患者为第3类。
③最后,查看“最终聚类中心”表,该表反映了各分类的聚类中心即均值的情况,可以看到,第1类的晨起血糖均值为7.99,第2类晨起血糖均值为5.39,第3类血糖均值为10.55。由此我们可以大致得知,第1类患者为血糖可控,第2类患者为血糖正常,第3类患者血糖情况严重。
四、小 结本文对K-means聚类分析的基本原理、适用范围及其在SPSS的具体操作应用进行了详细介绍。临床研究中,在大样本数据的训练下,可以得到稳定的类别划分,并需结合专业知识进行合理整合。我们将持续更新更多实用的采用SPSS软件、SAS软件、R软件以及Graghpad等软件的操作应用,敬请关注!
参考文献:
1、孙振球,徐勇勇.医学统计学(第4版).人民卫生出版社.
2、张文彤.SPSS11统计分析教程 高级篇.北京希望电子出版社.
本期供稿:Dana
文本编辑:飞雪
内容审核:陈老师
语音讲解:陈老师
杏花开医学统计
精品课程推荐
《Meta分析系统教程》(已更新) 《 医 学 统 计 S C I 教 程 》 ( 已 更 新 ) 《GraphPad Prism统计绘图教程》 《SPSS重复测量教程》杏花开医学统计
统计分析服务
统计分析服务
客服微信号 3301888200
详 情【项目合作案例】美国SCI核心期刊发表《慢性硬膜下血肿(CSDH)患者钻孔手术后复发情况的诺莫图预测系统》
【项目合作案例】美国SCI核心期刊发表《红细胞分布宽度——低海拔和高海拔地区心房颤动类型的新标记》
【项目合作案例】四川省自贡市第四人民医院重症医学科副主任罗小波负责的省医学会科研课题《谵妄预测模型建立和评价的临床研究》
杏花开医学统计
统计交流群
为了方便大家更好的学习医学统计,我们建立了医学统计微信交流群,加群方式在下方哦↓↓↓↓↓↓↓↓↓↓
杏花开医学统计
长按二维码识别关注后
回复:统计群
杏花开医学统计客服
QQ(微信同号) 3301888200
版权说明:本文系杏花开医学统计原创文章
医学统计
医学统计 精彩文章,灰色区域上下滑动● 医学统计案例研究:采用Kruskal-Wallis H检验心衰病人病情的生化指标差异——【杏花开医学统计】
● 医学数据多个样本均数间的多重比较之SNK-q检验在spss中的操作及结果解读——【杏花开医学统计】
问卷调研
问卷调研 精彩文章,灰色区域上下滑动● SPSS进行问卷调研数据统计分析中名义单选题分析方法详解
● SPSS问卷调研数据统计分析卡方拟合优度检验
● SPSS问卷调研数据统计分析交叉表卡方检验
● SPSS问卷调研数据统计分析名义多选题统计分析方法——SPSS多重响应分析
● 问卷设计视频案例教程,问卷量表设计的原则及注意事项
● SPSS进行问卷数据控制变量的影响因素回归分析,排除混杂因素干扰
● SPSS进行问卷统计分析结果解析及结论撰写(问卷分析第8步)