命名实体识别 序列标注 HMM 条件随机场模型(CRF)

参考资料:https://www.bilibili.com/video/av60970191?from=search&seid=3977397025416398199

条件随机场:是给定一组输入随机变量条件下另一组输出随机变量的条件概率分布模型,特点是输出随机变量构成马尔科夫随机场。

线性链条件随机场,由输入序列对输出序列预测的判别模型,形式为对数线性模型,学习方法为极大似然估计或正则化的极大似然估计。线性链条件随机场应用于标注问题

命名实体识别(named entity recognize)NER

1 在通用领域中,分为人名、地名、组织机构名、日期时间和专用名词

2 在学术中,分为三大类,七小类:

          三大类:实体类、时间类、数字类

          七小类:人名、地名、组织机构名、时间、日期、货币、百分比

3 主要算法:

  • 早期:基于规则、基于字典
  • 传统机器学习方法:HMM、CRF
  • 深度学习方法:RNN-CRF,CNN-CRF
  • 最近的方法:Attention 迁移学习 半监督学习

一、HMM

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第1张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第2张图片

        通过计算统计量来实现,对于词性标注任务来说,L这一状态集合表示的是词性的集合,W这一观测集合表示的是词典,A这一状态转移矩阵是对于L词性集合中各个词性转移情况的集合,B这一状态下的发射矩阵是L这一状态矩阵对W这一词典中的概率统计,π这一初始状态下的概率分布,即在句子中第一个词一般是什么情况的词性的概率统计。

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第3张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第4张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第5张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第6张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第7张图片

因此要求得某句话的词性标注序列,用暴力带入即可,即在某个词性下这个词的概率及两个相邻词的概率等

暴力搜索法代价过大,一般使用基于动态规划的Vitebi方法

主要实现代码:

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第8张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第9张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第10张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第11张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第12张图片

二、CRF模型

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第13张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第14张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第15张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第16张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第17张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第18张图片

概率无向图模型即马尔科夫随机场,是一个由无向图表示的联合概率分布     

三、LSTM模型的序列标注

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第19张图片

 

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第20张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第21张图片

命名实体识别 序列标注 HMM 条件随机场模型(CRF)_第22张图片

 

你可能感兴趣的:(命名实体识别 序列标注 HMM 条件随机场模型(CRF))