Affinity Matrix(关联矩阵,相似度矩阵),Cosine Similarity, Jaccard similarity

Affinity Matrix

reference: DeepAI, Wikipedia

What is an Affinity Matrix?

Affinity Matrix, 也叫做 Similarity Matrix。即关联矩阵,或称为相似度矩阵,是一项重要的统计学技术,是一种基本的统计技术,用于组织一组数据点之间的彼此相似性。相似度(similarity)类似于距离(distance),但它不满足度量性质,两个相同的点的similarity scores为1,而在metric下将为0。

相似度量的典型例子是余弦相似度(cosine similarity)和Jaccard相似度(Jaccard Similarity)。这些相似性度量可以解释为两个点相关的概率。例如,如果两个数据点的坐标很接近,那么它们的余弦相似度分数(或各自的“相似度”分数)将非常接近于1。

Cosine Similarity

概念

余弦相似性度量内积空间中两个非零向量之间夹角的余弦。这种相似性度量特别关注方向,而不是大小。简而言之,在相同方向上对齐的两个余弦向量相似性度量为1,而两个垂直对齐的向量相似性度量为0。如果两个向量是截然相反的,这意味着它们的方向是完全相反的(即背对背),那么相似性度量是-1。

Affinity Matrix(关联矩阵,相似度矩阵),Cosine Similarity, Jaccard similarity_第1张图片

计算公式:

 similarity  = cos ⁡ ( θ ) = A ⋅ B ∥ A ∥ ∥ B ∥ = ∑ i = 1 n A i B i ∑ i = 1 n A i 2 ∑ i = 1 n B i 2 , \text { similarity }=\cos (\theta)=\frac{\mathbf{A} \cdot \mathbf{B}}{\|\mathbf{A}\|\|\mathbf{B}\|}=\frac{\sum_{i=1}^{n} A_{i} B_{i}}{\sqrt{\sum_{i=1}^{n} A_{i}^{2}} \sqrt{\sum_{i=1}^{n} B_{i}^{2}}},  similarity =cos(θ)=ABAB=i=1nAi2 i=1nBi2 i=1nAiBi,

输出将产生一个从-1到1的值,表示相似性。其中-1是不相似的,0是正交的(垂直的),1表示完全相似。

Jaccard Similarity

Jaccard指数,也被称为Jaccard相似系数,是用来衡量样本集的相似性和多样性的指标。即图像目标识别领域非常常见的评价指标IoU

计算公式

J ( A , B ) = ∣ A ∩ B ∣ ∣ A ∪ B ∣ = ∣ A ∩ B ∣ ∣ A ∣ + ∣ B ∣ − ∣ A ∩ B ∣ J(A, B)=\frac{|A \cap B|}{|A \cup B|}=\frac{|A \cap B|}{|A|+|B|-|A \cap B|} J(A,B)=ABAB=A+BABAB

可见集合相似度度量使用IoU(Jaccard Similarity)

你可能感兴趣的:(深度学习,矩阵,笔记,机器学习,矩阵)