douban.com 豆瓣的日记页面屏蔽了百度蜘蛛

通过curl伪造百度蜘蛛的头,尝试抓取豆瓣上的日记文章,发现返回404.

而谷歌蜘蛛没有被屏蔽。

而经测试,豆瓣的group组文章可以被百度蜘蛛抓取。

最后通过百度搜索豆瓣的日记和组,发现日记文章基本没有收录,就算偶尔有几个也是11年的快照。

组页面正常。 

你可能感兴趣的:(douban.com 豆瓣的日记页面屏蔽了百度蜘蛛)