【Transformer】CLS(classification)有什么用?

CLS]就是classification的意思,可以理解为用于下游的分类任务。

一句话理解:【CLS】就是一个向量,只是不是某一个字的向量,是一个够代表整个文本的的语义特征向量,取出来就可以直接用于分类了。

意思就是它是代表整个语句的标签,代表该语句是什么含义(褒贬义/正确错误....)而不是仅仅代表一个单词的含义

主要用于以下两种任务:

单文本分类任务:对于文本分类任务,BERT模型在文本前插入一个[CLS]符号,并将该符号对应的输出向量作为整篇文本的语义表示,用于文本分类,如下图所示。可以理解为:与文本中已有的其它字/词相比,这个无明显语义信息的符号会更“公平”地融合文本中各个字/词的语义信息。

语句对分类任务:该任务的实际应用场景包括:问答(判断一个问题与一个答案是否匹配)、语句匹配(两句话是否表达同一个意思)等。对于该任务,BERT模型除了添加[CLS]符号并将对应的输出作为文本的语义表示,还对输入的两句话用一个[SEP]符号作分割,并分别对两句话附加两个不同的文本向量以作区分,如下图所示。

 

BERT的[CLS]有什么用_Mr_不想起床的博客-CSDN博客

你可能感兴趣的:(Transformer,transformer,自然语言处理,机器学习)