Python学习系列文章: 目录
文章目录
- 一、概述
- 二、计算公式
- ① 杰卡德相似系数
- ② 杰卡德距离
杰卡德距离(Jaccard Distance),是用来衡量两个集合差异性的一种指标,它是杰卡德相似系数的补集。
杰卡德相似系数(Jaccard similarity coefficient):两个集合 A 和 B 的交集元素在 A,B 的并集中所占的比例,称为两个集合的杰卡德相似系数,用符号 J ( A , B ) J(A,B) J(A,B) 表示,则其表达式为: J ( A , B ) = ∣ A ∩ B ∣ ∣ A ∪ B ∣ J(A,B)=\frac{|A\cap B|}{|A\cup B| } J(A,B)=∣A∪B∣∣A∩B∣
杰卡德距离(Jaccard Distance):与杰卡德相似系数相反,用两个集合中不同元素占所有元素的比例来衡量两个集合的区分度。杰卡德距离的表达式为: J δ ( A , B ) = 1 − J ( A , B ) = ∣ A ∪ B ∣ − ∣ A ∩ B ∣ ∣ A ∪ B ∣ J_{\delta}(A,B)=1-J(A,B)=\frac{|A\cup B|-|A\cap B|}{|A\cup B|} Jδ(A,B)=1−J(A,B)=∣A∪B∣∣A∪B∣−∣A∩B∣