聚类模型评估指标

聚类模型评估指标-轮廓系数
聚类模型评估指标_第1张图片

  1. 计算样本i到同簇其它样本到平均距离ai,ai越小,说明样本i越应该被聚类到该簇(将ai称为样本i到簇内不相似度);
  2. 计算样本i到其它某簇Cj的所有样本的平均距离bij,称为样本i与簇Cj的不相似度。定义为样本i的簇间不相似度:bi=min(bi1,bi2,…,bik2);
    说明:
    • si接近1,则说明样本i聚类合理;
    • si接近-1,则说明样本i更应该分类到另外的簇;
    若si近似为0,则说明样本i在两个簇的边界上;

你可能感兴趣的:(NLP,聚类)