正则表达式引擎 NFA 和DFA

书上面 的《精通正则表达式》

 NFA 称为表达式主导引擎

DFA 称为 文本主导

一般情况下文本主导的DFA要快一点。正则表达式NFA引擎因为需要对同样的文本尝试不同的子表达式匹配。会相对慢点。

正则表达式引擎说使用的两种基本技术,都有对应的正式名字,非确定性有穷自动机(NFA) 和确定性有穷自动机(DFA) 

下面是一个例子,还是上面的那本书上面的例子

如果用to(nite|knight|night) 来匹配文本 tonight 如果是NFA引擎的话从t开始 每次检查一部分,同时检查当前文本是否匹配表达式的当前部分。如果是,则继续表达式的下一部分。如此继续。知道所有的表达式都能匹配。即整个表达式匹配成功。


DFA在扫描字符串的时候会记录当前有效的所有匹配可能。 具体到上面的那个例子。引擎移动到t的时候它会在当前处理的匹配可能中添加一个潜在的可能。

有效的可能匹配为两个(knight被淘汰出局) 扫描到g 时。就只剩下一个可能的匹配。当h 和t 匹配完成后,引擎发现匹配完成,报告成功。

 


具体的就很多讲那个匹配原理的,暂时就记这么多。




你可能感兴趣的:(操作系统)