分类/聚类结果评判指标: TP, TN, FP, FN,purity(纯度),F-scroe(F分数) python实现
Purity:聚类划分的purity为,其中K是聚类(cluster)的数目,m是整个聚类划分所涉及到的成员个数。下表是对洛杉矶时报的3204篇文章进行k-means聚类的结果,k=6,label数=6。python实现:defpurity(cluster,labels,k,label_set):p=np.zeros((k,len(label_set)))purity=0foriinrange(l