cs224n学习笔记3

依存分析

两个句法分析工具:

Context-free grammars(CFGs) 上下文无关文法

Dependency structure 依存句法结构

Dependency syntax 依存句法

单词A修饰单词B,则称单词A是单词B的依赖,表示为B\toA

解决句法歧义问题,可探究词汇或短语间的依存结构,关于嵌套规则有一定的约束条件,最终可能的结构的个数称为Catalan数

cs224n学习笔记3_第1张图片

Treebanks 树库:人工标注的依存关系树

依存关系语法,依存结构

Projective dependency tree 投影依存树:依存关系相互嵌套,不出现交叉

非投影依存树往往可以通过移动短语位置调整为投影依存树

依存分析方法:动态编程、图算法(e.g. MST最小生成树)、约束补偿问题、确定型依存句法分析

Arc-standard transition-based parser 基于弧标准转换的依存分析

一种确定型依存句法分析方法(deterministic dependency parsing)

思路是使用机器学习分类器,优点:线性时间复杂度

在一个栈和一个缓冲区上进行三种操作:Shift、Left-Arc、Right-Arc

cs224n学习笔记3_第2张图片

随后使用机器学习分类器训练得到每种状态下选择的操作(复杂模型中每种弧代表的依存关系还需要进一步给出类别标签)

用于训练的变量数据:稀疏的特征矩阵,如单词的位置和词性

评价指标:UAS(仅考查弧的准确率)、LAS(考查弧上的标签)

对于算法的改进:使用引入词向量、POS标签(part-of-speech tags)和弧标签(前置状态下选择的弧标签)稠密的数据训练

你可能感兴趣的:(学习笔记,nlp,自然语言处理)