命名实体识别的三中标注方法BIO,BIOES,BMES

一、BMES  四位序列标注法

B表示一个词的词首位值,M表示一个词的中间位置,E表示一个词的末尾位置,S表示一个单独的字词。

我/S 是/S 广/B 东/M 人/E    (符号标注,‘东’是‘广’和‘人’的中间部分,凑成‘广东人’这个实体)

我/ 是/ 广东人/        (标注上分出来的实体块)

 

二、BIO  三位标注  (B-begin,I-inside,O-outside)

B-X 代表实体X的开头, I-X代表实体的结尾  O代表不属于任何类型的

三、BIOES   (B-begin,I-inside,O-outside,E-end,S-single)

B 表示开始,I表示内部, O表示非实体 ,E实体尾部,S表示改词本身就是一个实体。

你可能感兴趣的:(机器学习,深度学习,NLP)