Lucene为什么采用FST?为了模糊查询

对于Term词典,其实规模并没有大到当前的内存空间不能接受。英文词汇量一共也就几万,中文也类似,所占有的存储空间并不大。dragonToolkit是用有序链表存储Term词典的。这个确实是没有FST查询效率高的。
Lucene为什么采用FST结构呢?为了满足模糊查询的要求。满足前缀查询、模糊查询、正则表达式查询。

你可能感兴趣的:(C++,搜索引擎)