深度聚类评估指标(Purity、NMI、RI、ARI)

深度聚类评估指标(Purity、NMI、ARI)

  • 深度聚类评估指标(Purity、ACC、NMI、RI、ARI)
    • Purity
      • 定义
      • 例子
    • NMI
      • 定义
      • 例子
    • RI
      • 定义
      • 例子
      • 一个求混淆矩阵的 Python 实现
    • ARI
      • 定义
      • 例子

深度聚类评估指标(Purity、ACC、NMI、RI、ARI)

Purity, NMI, RI 等上述指标均需要给定 truth label 才能对 cluster label 进行评价,但是均不要求后者的类标与前者一致。那什么时候需要进行类标签的 best map 呢?例如,我们需要对预测结果和真实值之间统计聚类正确的比例时就需要进行最佳类标的重现分配,这样才能保证统计的正确。

Purity

定义

例子

NMI

定义

深度聚类评估指标(Purity、NMI、RI、ARI)_第1张图片

例子

深度聚类评估指标(Purity、NMI、RI、ARI)_第2张图片
深度聚类评估指标(Purity、NMI、RI、ARI)_第3张图片
深度聚类评估指标(Purity、NMI、RI、ARI)_第4张图片

RI

定义

例子

深度聚类评估指标(Purity、NMI、RI、ARI)_第5张图片
深度聚类评估指标(Purity、NMI、RI、ARI)_第6张图片
深度聚类评估指标(Purity、NMI、RI、ARI)_第7张图片

一个求混淆矩阵的 Python 实现

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt

label = [0,0,1,0,1,0,0,1]
pred = [0,0,0,0,0,1,1,1]
bins = np.array([0,0.5,1]) # 表示x,y轴每个 bin 的坐标范围
tn, fp, fn, tp = plt.hist2d(label, pred, bins=bins, cmap='Blues')[0].flatten() # flatten 按列展开

ARI

定义

例子

你可能感兴趣的:(研究方向相关,深度聚类评估指标,Purity,NMI,RI)