CYK算法

这个部分最好还是看wiki吧。。

先了解下上下文无关文法CFG:


:非终结符

:终结符

:规则的集合

:句子初始符

其中:,V为总词汇表

是由V中元素所构成的串,至少含有一个非终结符,这样才能由取代。


CFG:,则,,其实就是非终结符 由 词汇表(非终结符和终结符的并集)中的任一个词取代。


乔姆斯基范式:CNF

或者,ABC都为非终结符,为终结符。

CYK的算法:

CYK算法_第1张图片

还可以参考后面的例子:

先对V11/V22/V33等赋初值。

当l=1的时候,先确定V12,V23,V34,V45,V56,

当l=2的时候,确定V13,V24,V35,V46

当l=3的时候,确定V14,V2,V36,

当l=4的时候,确定V15,,V26,,

当l=5的时候,确定V16

V16是由V11和V26,V12和V36,V13和V46,V14和V56,V15和V66中的并集确定的。

具体可以参照图片:


你可能感兴趣的:(NLP)