搜索提示是如何实现的

经典的想法就是一个Trie的 keysWithPrefix 问题。

更高级的,进一步考察,keysWithPrefix需要做prefix下的inOrder遍历,但是每当用户type下一个字符,那个提示列表瞬间就显示出来了,不像是遍历很大一棵树,除非保证这棵trie不是很大,比如只是到了一定popular程度的词才才放进来,这是一个办法。


还有一个思路,就是倒排索引的思想,用户输入的所有搜索词(一般就是一个短语)也可以看作是一个doc集合,可以为这个doc集合建立倒排,只是一般的倒排是WordId -> DocId也就是doc包含的word指向doc的索引,对于搜索词doc,它包含的word的意义可以扩展,除了一般意义的包含的词,再加上所有的前缀,后缀。比如 搜索词 crack the code interview,所有的前缀指向它,所有的后缀指向它(键入code interview, interview也可以列出它),甚至只键入code也可以列出它,这个就是看你给这个短语添加怎样的link 了。

之前方法的trie是不用数据的,类似一个set。倒排的思路trie是一个symbol table,是有数据的,数据就是这个key可以指向的phrase列表。

索引就是一个symbol table,更本质的,索引就是一个link,就是一个为记录添加什么样的link的问题,从不同字段(dimension)的角度,确定了dimension又可以有不同match的方式,full match, prefix match,还是any word match.




你可能感兴趣的:(系统分析设计,架构)