为什么百度不能直接收录javaeye的博客

 

关键字 :baidu,google,javaeye博客

 

 

 

   在javaeye的博客上发表一篇文章,google会在很短的时间内就收录到,百度就慢了很多。并且这两个搜索结果不太一样,google能准确地指向这篇文章,而百度通常情况下收录的是javaeye的wiki(知识库)而间接地收录,却不直接收录这篇文章,很让人费解。

 

   下面以博客的标题作为关键字,分别在baidu和google查询收录情况:

 

   1  baidu:

 

   

 

 

   2 google:

 



 
    从图中可以看出,google查询结果的第二条直接指向这篇文章,第一条收录的是javaeye的wiki(知识库),昨晚刚发表这篇文章之后大概半小时,google就已经收录了这篇文章,还未收录wiki这条(第一条),而baidu当时还没有收录。今天,baidu已经收录了wiki这一条,而没有直接收录这篇文章。

 

    很惊讶,google的爬虫也太强大了吧,刚更新没多久,怎么那么快就爬来了;也很纳闷,baidu的爬虫难道这么傻吗,它都已经收录到wiki这条,难道就不知道去收录这条wiki的出处?虽然你的爬虫不如google的那么智能,但也不能傻到这般呀!不过刚才看了robbin的这篇文章 ,我估计应该是javaeye对baidu的爬虫动了手脚(robbin,貌似这对baidu有点不公平呀)。

 

    还有,javaeye的wiki是不是每篇博客都收录呀,wiki和文章本身对应的文章id是一样的,都是440856,如果是这样的话,我就得怀疑javaeye的动机了,你们是不是故意不让baidu的爬虫爬到这篇文章本身,别人在baidu搜索的时候,先引导到wiki这张页面,然后让用户再点一次链接到这篇文章本身去。啦啦啦,wiki那里的推荐文章旁边可有一个大大的广告哦,你们不会是为了广告吧!呵呵,开个玩笑,我还是挺支持javaeye的,只是每次baid搜到javaeye的博客时就觉得特烦,我得点两次才能真正看到我想要看的东西!

 

 

 

 

 

你可能感兴趣的:(编程,百度,Google,Blog)