sklearn 相似度矩阵_什么是相似度分析(聚类分析的一种)?

sklearn 相似度矩阵_什么是相似度分析(聚类分析的一种)?_第1张图片
Non‐parametric multivariate analyses of changes in community structure​onlinelibrary.wiley.com
sklearn 相似度矩阵_什么是相似度分析(聚类分析的一种)?_第2张图片

相似性分析Analysis of similarities(ANOSIM)首先由KR Clarke 提出,是一种类似于ANOVA分析(方差)的非参数统计,不对原始数据进行操作,而是对排名差异矩阵进行分析。该测试广泛用于生态学、医学。

sklearn 相似度矩阵_什么是相似度分析(聚类分析的一种)?_第3张图片

sklearn 相似度矩阵_什么是相似度分析(聚类分析的一种)?_第4张图片

sklearn 相似度矩阵_什么是相似度分析(聚类分析的一种)?_第5张图片

sklearn 相似度矩阵_什么是相似度分析(聚类分析的一种)?_第6张图片

sklearn 相似度矩阵_什么是相似度分析(聚类分析的一种)?_第7张图片

sklearn 相似度矩阵_什么是相似度分析(聚类分析的一种)?_第8张图片

给定一组样本之间的等级差异矩阵,假设H0所有样本样本属于同一个组,经ANOSIM测试我们判定R是否可以拒绝H0假设,即组间的相似度大于或等于组内的相似度。

相似度R的计算方法如下:

4788ef9fc3356638df8c53702586a92e.png
R,相似度;rB,组内平均秩相似性;rW,组间平均秩相似性;M = n(n - 1)/ 2,其中n是样本数。

测试统计量R限制在值-1至1之间,其中正值表示组内的相似度更高,接近零的值表示组内与组间相似度之间没有差异。负R值表明组间的相似性大于组内的相似性。

假设检验H0是组内的相似度小于或等于组间的相似度,通常将R统计量与通过随机改组的位置来获得组间的R值,即R',重复n次。p值为实际 R > R' 次数的百分比。

ANOSIM与NMDS(非度量多维标度)齐名,重要度都很高,两种方法互为补充,补充了群体差异的可视化和统计检验。[2]

ANOSIM可在PRIMER,R Vegan package和PAST在内的多种统计软件中实现。

你可能感兴趣的:(sklearn,相似度矩阵)