SEO实操手册|九、增加收录

本章主要介绍SEO优化工作中,在增加收录技术方面需要了解的工作。

本文版权由“ 北朔潜龙 ”所有,仅供学习使用,请勿转载或用于商业用途。

九、增加收录

  1、影响收录的因素


SEO实操手册|九、增加收录_第1张图片
影响收录的因素

      如果你的网站没有被收录,请检查你的内容质量与爬虫抓取量

  2、爬虫抓取方式

      搜索引擎爬虫抓取方式

SEO实操手册|九、增加收录_第2张图片
蜘蛛抓取流程

  3、模仿

      (httrack 网站镜像工具“整站下载器”)http://www.httrack.com/英文;下载-安装(中文版本)

  4、收录原理

      过程:robots.txt—首页—栏目页—CSS/JS—内容页

  5、爬虫内部因素

       A)爬虫内部因素

           1.网站速度影响爬虫访问

              机房—DNS服务器—CDN—出口宽带—硬件—操作系统—服务器—软件—程序

           2.nofollow标签的使用控制爬虫抓取

              Nofollow是指不追踪此链接

              Nofollow掉每个页面重复出现的链接和对SEO无价值的页面,减少爬虫重复抓取每个页面内的链接,提高爬虫抓取效率增强对重复页面的抓取。

              使用方法:rel=“nofollow”举例“京东商城”使用火狐浏览器插件“Highfight nofollow links”查看

          3.其他影响爬虫抓取的因素

             防火墙规则,防攻击设计,防止采集设置规则;一个网站访问N次后,自动断开,爬虫被拒。

             分隔硬盘:在服务器下安装多个虚拟机,硬盘转速慢,爬虫访问不到网页,多个返回码;一个链接返回多个返回码,搜索引擎是不会抓取的。

  6、爬虫外部因素

       A)外部链接

           外链的作用有两个,一个是吸引爬虫来抓取,另一个是提升排名,相关性、流通性、广泛性(给每个网页加外链,不要全部指向首页)

      B)文章

           文章的原创度,更新频率及独特性,原创文章一定收录,只是时间问题。

      C)权重

           权重是指搜索引擎对你的网站的信任程度,权重高的网站爬虫数量多,抓取及时,权重高的网站有爬虫长期“隐居”。

      D)网站地图

          网站地图促进爬虫抓取,是增进收录的重要因素

      E)PR值

          PR值是谷歌对于网站质量的衡量标准,但是PR对SEO的作用非常小,有些参考价值,但是意义并不是很大。

  7、爬虫外部因素

      A)爬虫抓取页面的过程中是可以看到网页URL、Html代码 和 head信息

      B)URL规范化

          1.静态化、唯一化

             http://www.seojiaoxue.com/?P=9

             http://www.seojiaoxue.com/9.html

            网站中同一网页,只对应一个URL

            1.1如果网站上多重URL都能访问同样的内容,会有如下危险

            1.1.1搜索引擎会选一种标准,可能会与正版不同

            1.1.2用户可能为同一网页的不同URL推荐,多重URL形式分散了该网页的权重

            1.2如果你的网站上已存在多重URL形式,建议按以下方式处理

            1.2.1在系统中只使用正常形式的URL,不让用户接触到非正常形式的URL

            1.2.2不把session ID统计代码等不必要的内容放到URL中

            1.2.3不同形式的URL:301永久跳转正常形式

            1.2.4防止用户输错启用备用域名,301永久跳转到主域名

            1.2.5使用robots.txt禁止baiduspider抓取不想向用户展示的形式

  2.URL中带有拼音/英文在排名上有优势

      C)W3C标准

            Html代码符合标准,结构层、表现层、行为层标签的完整性,用开源程序就好了。

      D)Heal信息的正确性(服务器)

           抓包工具httpwatck(下载、安装、使用)

      D)Accept

          指不能够接受返回数据的规范*/*表示所有

          Accept-language           zh-cn

          表示能够接受的返回数据语言

           Accept-encoding           gzip.deflate

           Accept-encoding表明了浏览器可接受的除了纯文本之外的内容编码的类型,比如zip压缩文件的压缩内容

          Last-modified     fri     04       jan 2008       01:01:00      gmt

          指定被请求资源上次被修改的日期和时间节省宽带,减少重复抓取

          Server           Apache

          一种标明WEB服务器软件及其版本号的头标

          Content-length

          内容长度通过文字长度判断是否更新过但是不准,如果文字一样就无法判断了

      E)内容与收录

           1.原创性

           1.1原创文章一定会收录,但只是时间问题

           1.2原创性是影响网站权重的很重要的因素,其他因素没有原创性重要

           1.3原创影响权重,权重影响收录,收录影响排名,排名影响流量

SEO实操手册|九、增加收录_第3张图片
原创结构

            2.重复性

            2.1转载或采集的页面内容和之前页面都一样,URL不统一也是重复,网页的相似度高就算重复页面,页面重复SEO负页面。

            2.2重复页面与总页面比例要低于30%,网站大量重复会被惩罚,避免重复的方法。

            2.2.1在网站的正文部分多调用些随机调用增加文章内容

            2.2.2URL唯一化,解决重复性最高境界就是原创

            3.排名模型

            3.1真有排名秘籍吗?有多少人知道搜索引擎算法?

            3.1.1没有秘籍,没有人知道全部的算法,工程师,SE给客户最好的搜索结果,给用户最好的价值,搜索引擎给我们排名,流量是被搜索引擎给我们的数据和SEO经验,总结出了SEO排名模版。

            4.定义

            4.1基于对搜索引擎的排名特种和算法一集SEO经验分析得出一个排名的原理,这个原理就是SEO模型

           4.2操作

           4.2.1网站结构符合:内容也的相关推荐板块

           4.2.2内链和外链

           4.2.3其他:SEO频道和锚文本等

           5.注意

           5.1网页都是相关性的(信任投票)注意质量

           5.2相关网页数量很多

你可能感兴趣的:(SEO实操手册|九、增加收录)