聚类效果评估

目录

1.轮廓系数(Silhouette Coefficient)

1.1 为什么轮廓系数可以评价聚类效果的好坏?

1.2 平均轮廓系数

2. 其他聚类质量函数

2.1方差比准则(Variance Ratio Criterion, VRC)

 2.2 戴维斯-博尔丁指数(Davies-Bouldin指数,DB指数)


 

评价聚类结果效果的指标通常有:误差平方和(Sum of the Squared Errors, SSE),轮廓系数(Silhouette Coefficient)和CH指标(Calinski-Harabaz)。

1.轮廓系数(Silhouette Coefficient)

轮廓系数,是用于评价聚类效果好坏的一种指标。可以理解为描述聚类后各个类别的轮廓清晰度的指标。其包含有两种因素——内聚度和分离度。

内聚度可以理解为反映一个样本点与类内元素的紧密程度。
分离度可以理解为反映一个样本点与类外元素的紧密程度。

1.1 为什么轮廓系数可以评价聚类效果的好坏?

聚类效果评估_第1张图片 

1.2 平均轮廓系数

聚类效果评估_第2张图片

聚类效果评估_第3张图片

2. 其他聚类质量函数

2.1方差比准则(Variance Ratio Criterion, VRC)

聚类效果评估_第4张图片

 2.2 戴维斯-博尔丁指数(Davies-Bouldin指数,DB指数)

聚类效果评估_第5张图片

 

 

 

你可能感兴趣的:(与数学的约会,聚类,机器学习,python)