依存树解析任务目前有两种做法,一是Transition-based approach, 另一种就是graph-based方法;针对每种方法文中给出了将一句话解析成依存书的具体实现步骤,本文的方法是用的graph-based框架。
本文的框架图:
graph-based方法: 从左向右解析句子,针对句中的每个词,找该词的head词(该词到head词之间的arc)以及从该词到head词之间的依存关系类型。
假设句子长度为L+1, 那么针对每个词可能的head word个数就是L个(除词本身以外的其他所有词都可能是该词的head word),所以不同的句子中的词分类时类别是不同的。
举个例子:
句1长为10,句2长为7, 那么句1中的word i 的候选head word 个数是9,即类别为9, 句2中word j 的候选 head word个数是6.
其中公式(6)就是就是套用的公式(2)所得
针对每个arc, arc的标签类别个数就是依存标签的个数是固定的:
比较好的paper解析:
http://www.hankcs.com/nlp/parsing/deep-biaffine-attention-for-neural-dependency-parsing.html