sentence Bert解读及代码示例

0-前序

Bert已经是相当6了,但在STS(语义文本相似性)任务中,需要将两个句子都输入到网络中,也就是说要过模型,这样计算量就大了。如下是文本相似性,并不是语义。

from transformers import BertTokenizer, BertModel
tokenizer = BertTokenizer.from_pretrained('bert-base-chinese')
model = BertModel.from_pretrained('bert-base-chinese')
inputs1 = tokenizer('今天的天气真好啊,暖和和的', return_tensors='pt')
inputs2 = tokenizer('今天天气真暖和啊', return_tensors='pt')
inputs3= tokenizer('今天天气真差劲啊', return_tensors='pt')
outputs1 = model(**inputs1)
outputs2 = model(**inputs2)
outputs3 = model(**inputs3)
outputs1 =outputs1.pooler_output
outputs2 =outputs2.pooler_output
outputs3 =outputs3.pooler_output
import torch
from sklearn.metrics.pairwise import cosine_similarity
torch.n

你可能感兴趣的:(NLP与推荐算法,bert,SBERT,NLP,自然语言处理,STS)