论文复现-4:ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer

文章目录

  • 文中的相似度测评距离
  • 相似度测评方法效果评估
    • 1. **pearson** 相关系数
    • 2.**spearman**相关系数

代码源文件:EmbeddingSimilarityEvaluator.py

文中的相似度测评距离

距离测评公式文章整理
相似度距离测评方法主要有:
余弦距离、曼哈顿距离、欧式距离、dot product

cosine_scores = 1 - (paired_cosine_distances(embeddings1, embeddings2))
manhattan_distances = -paired_manhattan_distances(embeddings1, embeddings2)# 一维范式
euclidean_distances = -paired_euclidean_distances(embeddings1, embeddings2)# 二维范式
dot_products = [np.dot(emb1, emb2) for emb1, emb2 in zip(embeddings1, embeddings2)]

论文复现-4:ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer_第1张图片

相似度测评方法效果评估

使用了两种相关系数:pearson 相关系数和spearman相关系数

eval_pearson_cosine, _ = pearsonr(labels, cosine_scores)
eval_spearman_cosine, _ = spearmanr(labels, cosine_scores)

1. pearson 相关系数

论文复现-4:ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer_第2张图片

2.spearman相关系数

原文链接:原文

论文复现-4:ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer_第3张图片
论文复现-4:ConSERT: A Contrastive Framework for Self-Supervised Sentence Representation Transfer_第4张图片

你可能感兴趣的:(人工智能,机器学习)