【Matlab】基于K-means的乳腺癌转移识别

本文要研究的问题是:通过医疗大数据对乳腺癌转移与否进行甄别。在医院中,通过化验我们可以得到非常多的指标,这些指标被用来作为诊断的依据。但是有的指标是与疾病密切相关的,有的不是,而且它们的相关性也不同。这就给诊断造成了很大的困难。

本文的解决思路是:首先对已有数据进行清洗、归一化处理,然后通过Relief算法对特征信息进行筛选,再用K-means算法对数据进行聚类,最后根据聚类结果来判别乳腺癌的转移与否。

下面我们给出数据的示例(仅截取了一部分)

NO Lymph node metastasis Sequence max diameter(cm) size

你可能感兴趣的:(K-means,Relief,Matlab,0-1识别,数据挖掘)