FST有限状态转换器 Lucene

一.前缀树

FST有限状态转换器 Lucene_第1张图片

二.FSA

FST有限状态转换器 Lucene_第2张图片

1.确定性:任何输入,最多只能遍历一个transition
2.非循环:不能重复遍历同一个状态
3.唯一性:只有输入序列末尾指向“最终”状态,才能说明找到了

输入“msb”,指向节点4(终结点)查找成功 输入“ms”,指向节点2(非终结点),查找不成功
但输入“wl”,虽然满足FSA的3个条件,但词典中没有wl这个词

三.FST有限状态转换

网址
http://examples.mikemccandless.com/fst.py
FST有限状态转换器 Lucene_第3张图片

FST最重要的功能是实现KEY到Value的映射,相当于HashMap,但FST的查询速度要比HashMap慢。但比HashMap节约内存。

1.确定性:任何输入,最多只能遍历一个transition
2.非循环:不能重复遍历同一个状态
3.唯一性:转换器有相关的值,final节点会输出一个值

你可能感兴趣的:(ELK,elasticsearch,Lucene)