百度收录量、索引量、Site值等问题小结

1、收录量、索引量、Site值

很多人分不清以上三者的关系,我整理了一张图:

百度收录量、索引量、Site值等问题小结_第1张图片

先有收录,它是百度蜘蛛在用户网站搜索到的页面,收录量是所有收录的页面的数量。

索引是在收录的基础上,经过一定的优化算法变成索引库中的索引值,是百度可用于搜索的真正页面数据。索引量指可以被搜索用户搜索到的网站数据库中索引数量。

以“site:域名”查出来的数据可以认为是索引量,但仅仅是其估值。索引量的真实数据是以百度站长平台索引量工具为准。

百度收录量、索引量、Site值等问题小结_第2张图片

上图引自百度资源平台,也表明了收录与索引的关系,收录数大于索引数,只有收录后才有可能进入索引库。

 

2、如何做好收录的准备工作

收录是百度的事情,但是网络做好收录的准备工作是网站方的事情。开发好网站后,要做好以下几件事情:

1) 就是在网站根目录下增加robots.txt的文件

robots是一个约定俗成的规范,即允许哪些目录蜘蛛可以访问,哪些不可以。正常如果都允许爬行的话,直接写一个空文件放在根目录下就行。例如允许所有的robot访问,robots.txt文件内容如下:

User-agent: *

Disallow:

2)向百度主动告知你开发的网站情况

有以下几种方式可使百度了解你网站内容:

主动推送:最为快速的提交方式,建议你将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。可以使用脚本或使用下面的工具:百度实时推送工具,urls.txt中包含你网站的页面链接。

百度收录量、索引量、Site值等问题小结_第3张图片

sitemap:你可以定期将网站链接放到Sitemap中,然后将Sitemap提交给百度。百度会周期性的抓取检查提交的Sitemap,对其中的链接进行处理,但收录速度慢于主动推送。sitemap一般是一个xml文件,如以下格式:

手工提交:如果您不想通过程序提交,那么可以采用此种方式,手动将链接提交给百度。这是最为简单的方式,但是如果链接比较多,就较为麻烦。

自动推送:是轻量级链接提交组件,将自动推送的JS代码放置在站点每一个页面源代码中,当页面被访问时,页面链接会自动推送给百度,有利于新页面更快被百度发现。

以上多种方式可以组合提交。百度对已提交的数据,不保证一定会抓取及收录所有网址,是否收录与页面质量相关。   

3) 做好官网的认证工作

在百度的资源管理平台中的用户中心,站点管理中添加网站,网站通过认证后,再进一步提交资料,完成百度关联主体的认证。这一步要需要输入网站备案号,企业的相关资质,管理人员相关信息,提交后等待百度审核通过后才算完成关联主体的认证。站点关联主体是移动资源进入搜索的一个必要环节。站点关联主体以及主体认证能够更好的验证站点的真实性,对百度来说,站点关联主体更可靠,能够更好的保障网民的权益。但是站点关联主体不影响当前网站的排名、流量。

 

3、如何提升收录率

这一步也就是SEO的范围,涉及范围比较广,搜索引擎优化(SEO)是指”用于通过增加其搜索引擎页面排名来增加网站流量的方法。搜索引擎优化通常涉及提高内容的质量,确保内容丰富的相关关键字等,还确保网站的HTML得到优化”。这一步我认为最主要的还是网页编制须满足百度或其它搜索引擎的编制规则,选择合适的关键词,做好网站安全,并且坚持不断的添加、更新有质量、新颖、符合热点的文章。

4、相关站长工具

站长建站时用于对网站质量查询与制作帮助的一些工具,简称站长工具。表现形式主要有WEB形式的工具箱、Flash形式工具箱、终端形式工具箱、微信端的站长工具。

常用的站长工具除了搜索平台提供的工具外,可以使用第三方的站长工具来帮助分析判断,例如下面的站长之家和爱站网:

     1)chinaz中国站长之家

http://www.chinaz.com/

     2)爱站网站长之家

https://www.aizhan.com/

你可能感兴趣的:(开发)