LinkedIn的线上搜索 — 分布式搜索相关

我的废话:
   某个项目缘故对分布式搜索的方式和技术的话题开始高度关注,看了不少资料,如 Apache Solr 和 Katta 。好东西大家应该分享, 最近看到LinkedIn 推出的新产品 LinkedIn Signal ,该产品在架构设计上和分布式搜索有着紧密的联系,LinkedIn搜索引擎架构师王坚 (John Wang) 在团队的blog上公布了一些产品内幕,这一资料让我得到了很多启发。
如图所示:


    * Zoie - Realtime indexing/search system. 
    * Bobo - Faceted Search Engine  
    * Sensei - distributed realtime searchable database with dynamic clustering. Leverages Zoie and Bobo.

以上几个东东 是LinkedIn 搜索团队自己开发的,来满足用户线上的搜索需求。

整篇详细内容如下:
http://sna-projects.com/blog/2010/10/linkedin-signal-a-look-under-the-hood

值得借鉴的几点:
    * 对于线上搜索的前端展现策略,结构的设计不可忽视
    * 如何利用多进程并行计算来提高计算效率,
    * 对大索引文件sharding 的存储策略,
    * 索引文件分布在不同集群机器的查询策略,
    * 数据库/数据源和索引库的实时同步机制。

口水:
    看的东西一多就容易忘,所以找个地方先记下来,怕忘。

–end–

你可能感兴趣的:(cluster,架构设计,Lucene,Lucene,分布式搜索)