用户综合分析系统:大数据板块---余弦相似度

余弦相似度(应用:密码错误评估,成分评估)

余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。

余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。
用户综合分析系统:大数据板块---余弦相似度_第1张图片
上图两个向量a,b的夹角很小可以说a向量和b向量有很高的的相似性,极端情况下,a和b向量完全重合。如下图:
在这里插入图片描述
求余弦相似度的基本知识就是勾股定理以及三角函数,都是由它进行推导的。
三角形中边a和b的夹角 的余弦计算公式为:
用户综合分析系统:大数据板块---余弦相似度_第2张图片
二维坐标系中的相似度推算为:
用户综合分析系统:大数据板块---余弦相似度_第3张图片
三维坐标系中的相似度推算为:
用户综合分析系统:大数据板块---余弦相似度_第4张图片
推广到n维:
用户综合分析系统:大数据板块---余弦相似度_第5张图片
所以n维的余弦相似度的公式为:
用户综合分析系统:大数据板块---余弦相似度_第6张图片

你可能感兴趣的:(用户综合分析系统)