实体抽取学习笔记

NLP信息抽取任务:
实体抽取
关系抽取
事件抽取

命名实体抽取:
用于序列标注的双向LSTM-CRF模型

前期知识储备

概率图模型:HMM、CRF

LSTM

词向量

深度学习

学习目标

实体抽取学习笔记_第1张图片
脉络
实体抽取学习笔记_第2张图片

论文研究背景、成果及意义

研究背景
命名实体识别是什么

实体抽取学习笔记_第3张图片
分类和序列标注区别:
序列上每个元素不是独立的,序列标注输入是特征序列,输入为类别序列。
如文本,文本中每个元素都有一个标签

序列标注的标注体系

O: other
I :inner
B: begin
E:end
S:single
实体抽取学习笔记_第4张图片
IO :31+1种表示方式,标签序列转化为ID1110022030
BIO:3
2+1种表示方式(常用)
BIOES:3*4+1种表示方式
实体抽取学习笔记_第5张图片
明明实体发展历程
实体抽取学习笔记_第6张图片
序列标记包括了词性标记(POS)、分块和命名实体识别(NER),一直是经典的NLP任务.

现有的序列标记模型大多数是线性统计模型:
HMM隐式马尔科夫
MEMMs最大熵马尔科夫模型
CRF条件随机场
实体抽取学习笔记_第7张图片

最近提出了基于卷积网络的模型来解决序列标记问题,Conv-CRF。由卷积网络和CRF层组成。Conv-CRF模型在序列标记任务上产生了良好的结果。

研究成果
实体抽取学习笔记_第8张图片
研究意义
实体抽取学习笔记_第9张图片
论文结构

实体抽取学习笔记_第10张图片
摘要
实体抽取学习笔记_第11张图片
下节内容:
实体抽取学习笔记_第12张图片

论文算法模型总览
概率图模型
实体抽取学习笔记_第13张图片

HMM:
马尔科夫模型:
通过过去的观测推荐后面的状态
一阶马尔科夫模型

隐马尔科夫模型:
有隐含的状态,无法观测,只能推测
数学定义:
实体抽取学习笔记_第14张图片
实体抽取学习笔记_第15张图片
HMM的初始隐状态概率
实体抽取学习笔记_第16张图片
HMM转移概率
实体抽取学习笔记_第17张图片
HMM发射概率
实体抽取学习笔记_第18张图片
HMM的3个基本问题
实体抽取学习笔记_第19张图片
极大似然估计进行监督学习
实体抽取学习笔记_第20张图片
用HMM序列标注问题

实体抽取学习笔记_第21张图片

CRF条件随机场
有两个假设
齐次马尔科夫假设(只与前面一个相关)
观察独立假设
实体抽取学习笔记_第22张图片

特征函数:

实体抽取学习笔记_第23张图片

实体抽取学习笔记_第24张图片

参数化形式
实体抽取学习笔记_第25张图片
从特征到概率
实体抽取学习笔记_第26张图片

CRF VS HMM
实体抽取学习笔记_第27张图片

BiLSTM-CRF

实体抽取学习笔记_第28张图片

BiLSTM+CRF模型结构

实体抽取学习笔记_第29张图片
STEP 1 Word Embedding
基于分布式假设的预训练语言模型,假设两个语义相近的词在高维空间中更近。
且两个词的距离有某种隐含的语义 man–woman=queen-king
实体抽取学习笔记_第30张图片
1.训练的时候遇见词A1,标签是K,测试时候遇见训练没见过的A1,由于两个词Embedding距离近,则可以以将A2预测为K
2.根据部分特征学习
Step 2:BiLSTM提取文本特征

实体抽取学习笔记_第31张图片
实体抽取学习笔记_第32张图片
解决梯度消失或者梯度爆照
实体抽取学习笔记_第33张图片
从LSTM到BiLSTM
实体抽取学习笔记_第34张图片
step3:得到P矩阵
实体抽取学习笔记_第35张图片
实体抽取学习笔记_第36张图片
实体抽取学习笔记_第37张图片
CRF约束标签,纠错,减少出错情况

step 4 :CRF层的引入
实体抽取学习笔记_第38张图片

转移分数矫正发射分数不合理地方
实体抽取学习笔记_第39张图片
step 5:最终结果的计算

实体抽取学习笔记_第40张图片
路径分数 score=发射分数+转移分数
实体抽取学习笔记_第41张图片

损失函数与维特比解码

前向算法
实体抽取学习笔记_第42张图片

Viterbi算法 解决预测问题
实体抽取学习笔记_第43张图片
实体抽取学习笔记_第44张图片

CRF损失函数
实体抽取学习笔记_第45张图片
当前节点德凡
实体抽取学习笔记_第46张图片
所有路径得分
实体抽取学习笔记_第47张图片
预测:
实体抽取学习笔记_第48张图片
实验结果和论文总结

实体抽取学习笔记_第49张图片
实体抽取学习笔记_第50张图片
实体抽取学习笔记_第51张图片
实体抽取学习笔记_第52张图片
实体抽取学习笔记_第53张图片

论文总结
实体抽取学习笔记_第54张图片
实体抽取学习笔记_第55张图片
拓展:

oov 问题
out of vacabulary
第二点重要
实体抽取学习笔记_第56张图片

实体抽取学习笔记_第57张图片
实体抽取学习笔记_第58张图片
neural N
实体抽取学习笔记_第59张图片

实践

参考:
内容来自与LSTM-CRF 知识图谱、信息抽取中最经典。。。
代码 :
https://github.com/macanv/BERT-BiLSTM-CRF-NER

https://github.com/zjy-ucas/ChineseNER
将main.py的clean,train改为true,运行main则可直接训练
如果运行报错,参考https://blog.csdn.net/qq_36591505/article/details/105118633

你可能感兴趣的:(深度学习)