在NLP的任务里,会对生成两个词向量进行相似度的计算,常常采用余弦相似度公式计算。
余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。
我们知道,对于两个向量,如果他们之间的夹角越小,那么我们认为这两个向量是越相似的。余弦相似性就是利用了这个理论思想。它通过计算两个向量的夹角的余弦值来衡量向量之间的相似度值。
公式如下:
点积/(a的模*b的模)
numpy笔记相似度:
矩阵内积相似度:和哪个结果还是不一样的。