搜索器的工作原理

     目前大部份的搜索器的原理都 是文本输入模式,没有有图片的模式,目前的的搜索 工作原理googleRot,和百度蜘蛛 baiduSpidi,爬行周期一般是一个月的(28)天,爬行完了,存库再建立索引和进行搜索 呢,国内目前的的主流搜索哟,不可能每个蜘蛛都会爬完所以的页面的,有可能只会爬完20%的页面的的需求,所以说有时间标记,如果 他那个有更新的话的,爬行周期变为原来的一半,没有的话,就会变为原来的2倍,延长爬行周期,有利于搜索的有用的信息的哟 

    现在目前的国内的搜索引擎都没有解决的搜索的的相关的性和个性化的需求问题,比如我要搜索 体育,我是一个篮球爱好者搜索的的话的应该能垫款搜索相关的篮球的信息的哟,如果 我 是一个足球爱好者,应该能搜索相关足球的的信息,不应该是 每一个人的搜索的信息的都 一样,所以目前的有许多的搜索引擎的都 有相关的,音乐的的www.music.com,新闻的 www.news.com 搜索引擎的,这个信息的的也比较的全的,爬行周期比较短。

     目前google 搜索引擎的 的采用的算法是pageRank 和 百度的超链分析法是 一样呢,也就是看那个页面的的链接的url那个引用的最多的,百度的竞价排名是有违垫款搜索引擎原理的,是一种搜索引擎盈利模式。

      影响搜索引擎的有网站布局,和关键字的位置分析法。看那那个关键字在哪里,比如<邓小平的一生> 和 < 改革开发>  都有 邓小平的但是位置不同的,所引用的权重就不同了

      如果我们不想蜘蛛爬行我们的程序的可以在我们网站的根目录加入Robots.txt加入 user-agaent   : *  disallow: 不允许那些目录进行访问,可以阻止蜘蛛的爬行的,蜘蛛爬行会增加服务器的负担,有时候根本就不需要蜘蛛爬行。

你可能感兴趣的:(搜索引擎)