经典问题:前缀补全

1、问题介绍

在使用搜索引擎进行搜索时,当你没有完全输入你想查询的关键词时,搜索引擎会自动给出一些补全关键词:

例如:在百度搜索中输入中文‘刘德’,结果如下:

经典问题:前缀补全_第1张图片经典问题:前缀补全_第2张图片

 

另外点击bing右下角的设置,跳转下搜索设置页面,可以关闭‘开启搜索建议’:

经典问题:前缀补全_第3张图片

 

2、那么这是如何实现的呢?

2.1 使用Sina的SAE(Sina App Engine)服务中的KVDB实现中文、拼音、全拼的自动补全

参考下面的文章:http://blog.csdn.net/anuan/article/details/7188271

这个文章讲述如理使用sina的SAE(Sina App Engine)服务中的KVDB实现中文、拼音、全拼的自动补全。

使用SAE KVDB快速实现 支持中文/拼音/全拼/的AutoComplete

2.2  拼音输入法

这个跟《编程之美》讲到的拼音输入法思想类似,但有区别。
现在的拼音输入是会记录用户的所有输入记录,建立本地词库,将经常性输入的词排在前面,加速输入的速度。在输入领域这个叫:联想。

3、Sina的KVDB主页:

关键点:noSQL、KVDB(Key-Value DataBase)、10亿、一主多从分布式架构、B+树存储、前缀查找

        http://sae.sina.com.cn/?m=devcenter&catId=199


        因为传统关系型数据库在分布式环境下表现的扩展性不足等缺点,近年来NoSQL的概念渐渐成为业界关注的焦点,越来越多的技术人员也习惯于使用NoSQL数据库进行日常开发,SAE为了应对这种新需求,也进行了NoSQL方向的研发。
        KVDB是SAE开发的分布式key-value数据存储服务,用来支持公有云计算平台上的海量key-value存储。KV DB支持的存储容量很大,对每个用户支持100G的存储空间,可支持1,000,000,000条记录,用户可以用KV DB存放简单数据,如好友关系等。

        KVDB是高性能高可靠存储,根据我们内部测试,读写都可以达到10w qps。KV DB采用一主多从的分布式架构,SAE提供热备和定期冷备,发生宕机时,会自动切换到健康的DB上。

        KVDB的使用非常方便,用户在使用时,只需要先调用init()函数,就可以调用KV的各种读写函数,值得一提的是,因为KV DB的实际存储选择用B+树实现,所以KV DB还支持前缀查找。

 

你可能感兴趣的:(经典问题:前缀补全)