本章主要介绍SEO优化工作中,在增加收录技术方面需要了解的工作。
本文版权由“ 北朔潜龙 ”所有,仅供学习使用,请勿转载或用于商业用途。
九、增加收录
1、影响收录的因素
如果你的网站没有被收录,请检查你的内容质量与爬虫抓取量
2、爬虫抓取方式
搜索引擎爬虫抓取方式
3、模仿
(httrack 网站镜像工具“整站下载器”)http://www.httrack.com/英文;下载-安装(中文版本)
4、收录原理
过程:robots.txt—首页—栏目页—CSS/JS—内容页
5、爬虫内部因素
A)爬虫内部因素
1.网站速度影响爬虫访问
机房—DNS服务器—CDN—出口宽带—硬件—操作系统—服务器—软件—程序
2.nofollow标签的使用控制爬虫抓取
Nofollow是指不追踪此链接
Nofollow掉每个页面重复出现的链接和对SEO无价值的页面,减少爬虫重复抓取每个页面内的链接,提高爬虫抓取效率增强对重复页面的抓取。
使用方法:rel=“nofollow”举例“京东商城”使用火狐浏览器插件“Highfight nofollow links”查看
3.其他影响爬虫抓取的因素
防火墙规则,防攻击设计,防止采集设置规则;一个网站访问N次后,自动断开,爬虫被拒。
分隔硬盘:在服务器下安装多个虚拟机,硬盘转速慢,爬虫访问不到网页,多个返回码;一个链接返回多个返回码,搜索引擎是不会抓取的。
6、爬虫外部因素
A)外部链接
外链的作用有两个,一个是吸引爬虫来抓取,另一个是提升排名,相关性、流通性、广泛性(给每个网页加外链,不要全部指向首页)
B)文章
文章的原创度,更新频率及独特性,原创文章一定收录,只是时间问题。
C)权重
权重是指搜索引擎对你的网站的信任程度,权重高的网站爬虫数量多,抓取及时,权重高的网站有爬虫长期“隐居”。
D)网站地图
网站地图促进爬虫抓取,是增进收录的重要因素
E)PR值
PR值是谷歌对于网站质量的衡量标准,但是PR对SEO的作用非常小,有些参考价值,但是意义并不是很大。
7、爬虫外部因素
A)爬虫抓取页面的过程中是可以看到网页URL、Html代码 和 head信息
B)URL规范化
1.静态化、唯一化
http://www.seojiaoxue.com/?P=9
http://www.seojiaoxue.com/9.html
网站中同一网页,只对应一个URL
1.1如果网站上多重URL都能访问同样的内容,会有如下危险
1.1.1搜索引擎会选一种标准,可能会与正版不同
1.1.2用户可能为同一网页的不同URL推荐,多重URL形式分散了该网页的权重
1.2如果你的网站上已存在多重URL形式,建议按以下方式处理
1.2.1在系统中只使用正常形式的URL,不让用户接触到非正常形式的URL
1.2.2不把session ID统计代码等不必要的内容放到URL中
1.2.3不同形式的URL:301永久跳转正常形式
1.2.4防止用户输错启用备用域名,301永久跳转到主域名
1.2.5使用robots.txt禁止baiduspider抓取不想向用户展示的形式
2.URL中带有拼音/英文在排名上有优势
C)W3C标准
Html代码符合标准,结构层、表现层、行为层标签的完整性,用开源程序就好了。
D)Heal信息的正确性(服务器)
抓包工具httpwatck(下载、安装、使用)
D)Accept
指不能够接受返回数据的规范*/*表示所有
Accept-language zh-cn
表示能够接受的返回数据语言
Accept-encoding gzip.deflate
Accept-encoding表明了浏览器可接受的除了纯文本之外的内容编码的类型,比如zip压缩文件的压缩内容
Last-modified fri 04 jan 2008 01:01:00 gmt
指定被请求资源上次被修改的日期和时间节省宽带,减少重复抓取
Server Apache
一种标明WEB服务器软件及其版本号的头标
Content-length
内容长度通过文字长度判断是否更新过但是不准,如果文字一样就无法判断了
E)内容与收录
1.原创性
1.1原创文章一定会收录,但只是时间问题
1.2原创性是影响网站权重的很重要的因素,其他因素没有原创性重要
1.3原创影响权重,权重影响收录,收录影响排名,排名影响流量
2.重复性
2.1转载或采集的页面内容和之前页面都一样,URL不统一也是重复,网页的相似度高就算重复页面,页面重复SEO负页面。
2.2重复页面与总页面比例要低于30%,网站大量重复会被惩罚,避免重复的方法。
2.2.1在网站的正文部分多调用些随机调用增加文章内容
2.2.2URL唯一化,解决重复性最高境界就是原创
3.排名模型
3.1真有排名秘籍吗?有多少人知道搜索引擎算法?
3.1.1没有秘籍,没有人知道全部的算法,工程师,SE给客户最好的搜索结果,给用户最好的价值,搜索引擎给我们排名,流量是被搜索引擎给我们的数据和SEO经验,总结出了SEO排名模版。
4.定义
4.1基于对搜索引擎的排名特种和算法一集SEO经验分析得出一个排名的原理,这个原理就是SEO模型
4.2操作
4.2.1网站结构符合:内容也的相关推荐板块
4.2.2内链和外链
4.2.3其他:SEO频道和锚文本等
5.注意
5.1网页都是相关性的(信任投票)注意质量
5.2相关网页数量很多