百度为什么不收录你的网站(附阿里软件互联平台SEO看法)

本人非SEO工程师,写这篇文章的主要目的是自我学习、沉淀积累。以下观点如有错误,请指正!

百度的收录一般都是让人捉摸不透的,变化无常,人工干扰相当的严重。最近几个月,百度对新站的收录时间越来越长,很多新站干脆不被收录。百度不收录你的网站肯定有它的原因的,只不过最近增加了对新站的考察期,一般考察期为半个月到一个月。真正导致百度收录难的原因,我个人也在学习和总结,目前整理几条原因,与大家分享(新手请先看下百度网页搜索帮助):

百度官方给出的不收录原因是:
百度使用自动的spider程序抓取互联网上的网页,大多数情况下,网站都能被百度自动收录。虽然百度希望尽可能多的抓取互联网上的网页,但为了确保用户的搜索体验以及某些不确定的原因,仍会有少数网站无法被百度收录,如果您的网站未被收录,通常是由以下原因引起的:
1. 您的网站所在服务器不稳定,被百度暂时性去除,稳定之后,问题会得到解决。
2. 您的网站有设计缺陷,导致spider无法正常抓取。
3. 您的网页不符合用户的搜索体验。
4. 网页是复制自互联网上的高度重复性的内容。
5. 网页做了很多针对搜索引擎而非用户的处理,使得用户从搜索结果中看到的内容与页面实际内容完全不同,或者使得网页在搜索结果中获得了不恰当的排名,从而导致用户产生受欺骗感觉。
6. 您的网页内容有不符合国家法律和法规规定的地方。
7. 您网站的robots协议禁止百度抓取。
8. 其他技术性问题。

另外个人总结导致不收录的SEO作弊因素如下:
1.请不要使用隐藏文本或隐藏链接,内容中的隐藏文字或链接可能导致您的网站被认为不可信赖;
2.请不要使用隐藏真实内容、欺骗性Javascript 重定向和”桥页”;
3.请不要创建包含大量重复内容的多个网页、子域名或域名,其它URL或域名用301/400转向到相应URL或域名下;
4.请不要使用专门针对搜索引擎制作的”桥页”,也不要采用如联属计划这类原创内容很少或几乎没有原创内容的”俗套”(cookie cutter)方式;
5.请不要向百度发送自动查询;
6.请不要在页面上堆彻关键字;
7.一个URL对应一个内容页面,请不要为一个内容页面创建多个URL,总之URL和内容要保持唯一性;
8.请不要用技术判断SIPDER,以展示给SPIDER和用户不同的页面(CLOCKING);

最近帮同事研究阿里软件的SEO,百度site下只找到相关网页约1,520篇,简直糟糕透了,从UI、code、QA任一角度去看页面SEO都是不合格的。之前我们是做软件,不做平台的,工程师们没有考虑到那么多,但是现在不一样了,所以我们还是需要自我检讨,同时学习淘宝中国站阿里妈妈口碑等各位兄弟大哥在web方面的经验。虽然阿里软件平台SEO这块目前不是我这边负责,但是我还是会积极参与平台SEO改良中,相信不用等多久,我们就可以给大家一份满意答案的问卷!

你可能感兴趣的:(seo)