sklearn构建K-means聚类模型以及使用FMI,轮廓系数法,Calinski-Harabasz评价模型
聚类分析是在没给定划分类别的情况下,根据数据相似度进行样本划分的一种方法,属于非监督学习。(1)使用sklearn估计器构建聚类模型聚类算法实现需要估计器,sklearn估计器有fit和predict两个方法:fit:主要用于训练算法,该方法可接收用于有监督学习的训练集及其标签两个参数,也可接收无监督学习的数据。predict:用于有监督学习的测试集标签,也可用于划分传入数据的类别。以iris数据