PR值算法原理总体上基于下面2个前提:
1、一个网页被多次引用,则它可能是很重要的;
一个网页虽然没有被多次引用,但是被重要的网页引用,则它也可能是很重要的;一个网页的重要性被平均的传递到它所引用的网页。这种重要的网页称为权威(Authoritive)网页。
2、假定用户一开始随机的访问网页集合中的一个网页,然后跟随网页的链接向前浏览网页,不回退浏览,那么浏览下一个网页的概率就是被浏览网页的PageRank值
影响PR值的因素
PR值体现为从0到10的11个数值,在Google的工具栏上以一条横向绿色柱状图显示,0级情况下呈白色。它是针对网页而不是网站,因此一个网站的首页和内页往往有着迥然不同的PR值。由于Google市场拓展进程的原因,中文网页的PR值整体上低于英文网页。对中文网站来说,拥有3级PR是基础, 4级PR算达标,5级PR可谓良好,而6、7级PR就算相当优秀的网站。当然,由于PR最直接的影响因素是来自链接,因此这种评级并不代表内容的级别水准,网站内容质量对PR的影响是间接的、长期的。根据PR值的算法原理,可知影响一个网站(首页)PR值的因素主要包括:
1、网站的导入链接质量:
根据前文对高质量导入链接的分析,则获得高PR值需要获得来自以下网站的链接:
◆ 加入搜索引擎分类目录与已经加入目录的网站交换链接
◆ 获得来自PR值不低于4并与你的主题相关或互补的网站的链接
◆ 你的链接出现在流量大、知名度高、频繁更新的重要网站上(如新闻源)
◆ 与你交换链接的网站具有很少导出链接
◆ 与内容质量高的网站链接(PR值上升潜力大)
2、 导出链接数量:
根据PR计算原理,由于"一个网页的重要性被平均的传递到它所引用的网页",因此反过来看,一个页面内过多的导出链接将潜在引起该页PR值的流失。但从内容的角度看,适当数量的与主题有关联的导出链接给搜索引擎带来良好的印象。因此,一个页面,尤其是首页的导出链接数量的把握,应该兼顾到PR值和关键词内容二者之间的平衡,即控制导出链接数量,以不超过10个为宜。
3、搜索引擎收录一个网站的页面数量
在探讨SEO的时候,人们过多关注核心关键词排名以及首页的表现情况,却往往忽略了一个极其重要的问题:即搜索引擎对一个网站收录的页面数量。后者在SEO中也有着极其重要的意义。一个用核心关键词查询排名不佳的网站,可能由于被抓取大量网页而在用户使用其它关键词查询时,内页获得前三甲排名。由于用户搜索时使用的关键词具有分散性,使得这种情况往往给网站带来极大访问量。
正因为收录页面的数量直接影响访问量,因此对PR值的影响也是很大的。被收录页面越多,主页PR越高。不过需要强调的是,此处所指的数量是指被收录数与网站页面总数的比值,而不是收录页面的绝对数值。比如一个拥有50个页面的网站被收录了10个页面,网站的被收录比值是1/5,一个拥有5000个页面的网站被收录了500个页面,比值是1/10,结果是收录10个页面比收录500个页面的网站还更具排名优势。但对各个搜索引擎来说,究竟达到多大的比值算是良好,目前还没有相关的数据。
附:查询网站收录页面数量:在搜索引擎中输入:site:www.kuziyuan.com(如果输入:site:admin5.com,则获得的是在admin5.com域名下所有二级域名的网页数量)。
第一部分:域名和主机对SEO的影响
域名与主机是网站的基础,商业网站选择域名与主机尤其应注重形象和质量,为网络营销开展打好坚实基础。同时,选择好域名与主机也是搜索引擎优化开始的第一步。
域名选择与SEO
域名与IP:每一个网站的域名对应一个IP地址,IP 地址是在网络上分配给每台计算机或网络设备的数字标识。域名必须经过域名服务器(DNS)进行解析,转换成数字IP,才能让计算机理解辨认,如:219.136.248.149 大部分中小企业网站都存放在由一台服务器划分出来的若干虚拟主机上,由多个网站共享一台服务器和IP地址,一些WEB服务器中有成百上千个域名共享一个IP地址的情况。这样对站长来说成本较低,但对网站的搜索引擎排名带来以下潜在风险:
1、共享主机的其他网站如果被搜索引擎惩罚,将或多或少波及你的网站。如果同一IP下有一个网站作弊,那么我们的搜索引擎会对该IP下的所有网站进行惩罚。不过幸运的是,大部分搜索引擎不会如此武断,如Google,一般是不会进行这种连带性惩罚的。
2、如果搜索引擎对有些Spammer服务器进行了惩罚,其IP被认为是Spam,则连带该IP下的所有网站都会受到牵连,使这些网站的排名下降或在搜索引擎中被清除。
工具推荐:
查域名IP:http://www.123cha.com/ip
查关键词:http://key.admin5.com
IP反查:http://www.whois.sc/members/reverse-ip.html (查看某IP地址下共享哪些域名。免费注册)
二级域名(次域名):
二级域名形式如:yourname.vv11.com,而不是www.vv11.com
拥有自己的独立域名是网站对搜索引擎友好的基础。目前有很多网站提供免费空间,如博客(Blog)免费空间, 企业免费空间, 免费自助建站,电子商务平台等,通常为用户分配一个二级域名,或页面存放于网站的某一路径下。这都极不利于搜索引擎重视你的网站,二级域名除了用户访问不方便以外,还主要有以下弊端:
1、如果你所使用二级域名的主域名受到惩罚,那么你的网站也会受到牵连;
2、很多搜索引擎会规定每个域名下的收录数(如:www.vv11.com、english.vv11.com与bbs.vv11.com),如果www.vv11.com这一域名的收录数上限是30,而你的网站是第31个,则你的网站被搜索引擎收录的机会就会少至又少了;
3、当域名供应商停止营业,那么你辛苦经营的网站也随着你域名的失去而付诸东流;
4.网站流量排名的时候,你所有的流量都会归功于所依托的顶级域名。
最好为自己的二级域名网站注册一个独立域名,然后做域名转发(免费),目前很多拍卖网的店铺都适合采用此种方法,对顾客访问和网站管理很有用。
域名中的字符:取域名的原则除了方便用户访问之外,对搜索引擎而言,涉及到域名中是否包含关键词的问题。英文网页内容的网站如果在域名中含有关键字,或以复合关键字作域名,都应该用短横线隔开。如:www.made-in-china.com 而不是 www.madeinchina.com。这是因为搜索引擎通常会把分隔符"-"当作一个空格来看待,因而能够识别出你的关键词,为网站排名加分(尽管影响不是很大)。短横线隔开后的关键词组还可以获得更多的词组搜索结果,如www.madeinchina.com被认为只有一个词madeinchina,而made-in-china则被看作正常的made in China词组。
有些搜索引擎目录对网站在分类目录中的排名顺序是根据域名或网站title名称的数字顺序或字母顺序甚至中文笔画,总体上数字又比字母靠前。Yahoo!中国称,"在同一类目中,网站是按照拼音顺序来排列的"。
google则根据其独创的"网页级别"技术"分辨出常用的重要网站,排放在目录的前面以提升网页搜索的效率"。此外,域名的后缀选择也有一定讲究。有一种观点认为:在同等情况下,代表非商业性网站的后缀.org和.net有着比.com更高的排名优势;对中文网站来说,表示中国域的.cn和.com.cn又比无地区性的.com有一定优势。
主机选择与SEO
主机服务商选择:
主机对网站的搜索引擎排名影响很大。在寻找主机提供商的时候,千万不要只考虑价格因素。如果你多次向Google提交网站,但Google却一直没有对其进行索引,则有可能是网站所在的服务器出了问题。因此选择服务器时要特别注意以下几点:
1、避免使用免费主机
由于免费主机里面经常会出现Spammers、镜像网站、桥页等"搜索引擎垃圾",很多搜索引擎都不愿意索引免费主机上的网站;同时搜索引擎目录如Yahoo也很难收录来自免费主机的商业站点。此外,免费主机的服务很难保证,常常服务器超载,速度奇慢,宕机频繁,甚至关闭服务,这都会直接影响网站排名。
2、选择有信誉的主机提供商
搜索引擎的索引程序定期或不定期地来访问收录的网站。对经常更新的网站,Google的Googlebot漫游器——俗称"蜘蛛",一般每天都会小幅度地"爬"一下,一个月进行一次大的索引。如果蜘蛛在索引时出现网页打不开或下载速度缓慢,则放弃索引。所以你的网站在任何时候都要正常工作,以博取蜘蛛的欢心。这就要求网站存放的主机系统提供快速、稳定、安全的服务,最好有24小时客服支持和维护,保证你的网站 快速、可靠、稳定地运行。
主机转移:
如果你想转移网站的主机服务,要在取消原来的服务提供商之前,先找好新的供应商。先在新的服务商处开个帐号,确保所有的文件都正确无误地传到新服务器上。网站在新服务器上运行无碍后再联系你的原供应商,告知对方将终止合作,但确保他们不会马上关你的网站。再联系你的域名注册商(可能是原主机提供商),变更域名服务器(DNS)。域名服务器的功能就是把你的域名解析成计算机能够识别的IP地址。把旧的域名服务器改成新的,这个过程到生效时间大概24-48小时之内,少数情况下可能要72小时。这期间,如果一个搜索引擎刚好来抓你的网页,要么抓到旧的IP地址上的网站,要么抓到新的域名解析生效后的网站,总之都不会出现网站打不开的空档。
第二部分:搜索引擎优化的核心:关键字策略
根据潜在客户或目标用户在搜索引擎中找到你的网站时输入的语句,产生了关键字 (Keywords)的概念,这不仅是搜索引擎优化的核心,也是整个搜索引擎营销都必须围绕的核心
关键字的选择
首先确定你的核心关键字,再围绕核心关键字进行排列组合产生关键词组或短句。对企业、商家而言,核心关键字就是他们的经营范围,如产品/服务名称、行业定位,以及企业名称或品牌名称等。总结起来,选择关键字有以下技巧:
1、站在客户的角度考虑潜在客户在搜索你的产品时将使用什么关键词?
这可以从众多资源中获得反馈,包括从你的客户、供应商、品牌经理和销售人员那里获知其想法。
2、将关键词扩展成一系列词组/短语毋用单一词汇,而是在单一词汇基础上进行扩展
如:设计→网站设计→深圳网站设计。英文关键词可以采用搜索引擎overture的著名工具Keyword Suggestion Tool对这些关键词组进行检测,可查看你的关键词在过去24小时内被搜索的频率,最好的关键词是那些没有被广泛滥用而又很多人搜索的词。中文工具可以通过百度的"相关搜索"和Google提供的KeywordSandbox工具进行关键词匹配和扩展。
工具推荐:
Google AdWords关键字工具:查询特定关键词的常见查询及扩展匹配https://adwords.google.com/select/KeywordSandbox
百度关键字工具:查询特定关键词的常见查询、扩展匹配及查询热度 http://www2.baidu.com/inquire/dsquery.php
百度 yahoo google 关键词指数查新 http://key.admin5.com
3、进行多重排列组合改变短语中的词序以创建不同的词语组合
使用不常用的组合,组合成一个问句。包含同义词、替换词、比喻词和常见错拼词。包含所卖产品的商标名和品名。使用其它限定词来创建更多的两字组合,三字、四字组合。
4、毋用意义太泛的关键字
如果你从事包装机械制造,则选择"机械"作为你的核心关键字就无益于吸引到目标客户。实际上,为了准确找到需要的信息,搜索用户倾向使用具体词汇及组合寻找信息(尤其是二词组合),而不是使用那些大而泛的概念。此外,使用意义太广的关键字,也意味着你的网站要跟更多的网站竞争排名,难以胜出。
5、用自己的品牌做关键词
如果是知名企业,则别忘了在关键词中使用你的公司名或产品品牌名称。
6、使用地理位置地理位置对于服务于地方性的企业尤其重要。如果你的业务范围以本地为主,则在关键词组合中加上地区名称如"深圳网站建设"。
7、回顾竞争者使用的关键词
查寻竞争者的关键词可让你想到一些你可能漏掉的词组。但不要照抄任何人的关键词,因为你并不清楚他们如何要使用这些关键词——你得自己想关键词。寻找别人的关键词只是对你已经选好的关键词进行补充。
8、不用与自己无关的关键字
总是会有人将热门的词汇列入自己的META关键字中——尽管这个热门关键字跟自己网站内容毫不相干。甚至有人把竞争对手的品牌也加入到自己的关键字中,这不仅侵权,可能被起诉(国外多起类似案例),并且由于这些所谓"热门"词汇并未在网站内容中出现,因此对排名并无实质帮助,过多的虚假关键词还可能受到处罚降低排名。
9、控制关键词数量
一页中的关键词最多不要超过3个为佳,然后所有内容都针对这几个核心关键词展开,才能保证关键词密度合理。搜索引擎也会认为该页主题明确。如果确实有大量关键词需要呈现,可以分散写在其它页面并针对性优化,让这些页面也具有"门页(entry)"的效果。这也是为什么首页和内页的关键词往往要有所区分的原因。最典型的情况是拥有不同的产品和服务的情况下,对每个产品进行单网页优化,而不是罗列在一个首页上。
附:查看竞争对手关键词的方法:在浏览器中打开目标网页→点击"查看"→点击"源文件"→"<meta name="keywords" content="后面的文字即该网站关键词
关键字密度
在确定了自己的关键字之后,需要在网页文本中适当出现这些关键字。关键字在网页中出现的频次,即关键字密度 (Keyword Density) ,就是在一个页面中,占所有该页面中总的文字的比例,该指标对搜索引擎的优化起到重要作用。关键字密度一般在 1% 到 7% 较为合适,超过这一标准就有过高或过低之嫌。
切记避免进行关键字堆砌,即一页中关键字的出现不是根据内容的需要而安排,而是为了讨好搜索引擎人为堆积关键字(Stuffing)。这已经被搜索引擎归入恶意行为(Spamming), 有遭到惩罚的危险。
工具推荐:
关键词密度检查(英文):频繁出现的关键词及其密度 asp">www.seotoolkit.co.uk/keyword_density_analyser.asp
关键字分布
关键字的分布原则堪称:无所不在,有所侧重。
1、网页代码中的Title,META标签(关键字keywords和描述description)
如:e书www.ebook.com的代码:
<title>e书——电子书公益下载中心</title>
<meta http-equiv="title" content="e书——电子书公益下载中心">
<meta name="classification" content="arts and literature">
<meta name="description" content="电子书下载,公益,电子图书下载,电子书籍,任你一览无余。">
<meta name="keywords" content="电子书,电子图书,公益,电子书籍,书库,图书,书,书籍,电子书下载,免费电子书">
2、网页正文最吸引注意力的地方
正文内容必须适当出现关键词,并且"有所侧重",意指用户阅读习惯形成的阅读优先位置——从上到下,从左至右——成为关键词重点分布位置,包括:页面靠顶部、左侧、标题、正文前200字以内。在这些地方出现关键词对排名更有帮助。如把一段富含关键词的文本网站介绍置于网站最顶部(这个地方通常被安排用来放banner广告的)。这样做的好处是让用户和蜘蛛都以最快速度了解该网站内容,并且以蜘蛛重视的<b>黑体显示,对其排名作用很大。代码显示如下:
<b><font color=#999999>本站是一个非商业性的网站,旨在为广大的搜索引擎研究者提供一个学习、交流场所。在这里你可以找到很多有关于搜索引擎优化资料(seo资料,文章)、网站优化资料。这些资料可以帮助你将你的网站进行适当的优化以迎合多个搜索引擎的搜索规则,从而得到较好的排名。</font></b>
3、超链接文本(锚文本)
除了在导航、网站地图、锚文本中有意识使用关键字,还可以人为增加超链接文本。如一个童装厂商网站可以通过加上以下行业资源:中国童装网 织里童装网…… 等含有"童装"文字的链接来达到增加超链接文本的目的。这也值得网站在添加友情链接时做参考,即链接对象中最好包含有你的关键字或相关语义的网站。
4、Header标签
即正文标题<H1><H1/>中的文字。搜索引擎比较重视标题行中的文字。用<b></b>加粗的文字往往也是关键词出现的地方。
5、图片Alt属性
搜索引擎不能抓取图片,因此网页制作时在图片属性Alt中加入关键字是对搜索引擎友好的好办法,它会认为该图片内容与你的关键字一致,从而有利于排名。 英文网页内容的网站在进行域名选择和网页文件夹命名时,也可以考虑包含关键字(对关键词组则要用短横线隔开),如www.made-in-china.com。不过对Google排名作用非常微小。
第三部分:对搜索引擎友好的网页设计制作
一般的网页设计都由网页设计师完成。设计师设计网站往往仅从美观、创意和易用的角度考虑,这对于一个期望获得搜索引擎排名优秀的商业网站来说,已经远远不够了,网站策划人员至少应该为设计师递交一份需求备忘录,提醒在设计中需要配合和注意的环节。
目录结构和URL
URL是统一资源定位,即每个网页的网址、路径。网站文件的目录结构直接体现于URL。清晰简短的目录结构和规范的命名不仅有利于用户体验和网址传播,更是搜索引擎友好的体现。
目录层次:
对于一个小型网站来说,一般只有一层子目录,如下:
http://www.vv11.com/dir1/page.htm
www.vv11.com是域名,dir1是一级目录名,page是文件名。
对搜索引擎而言,这种单一的目录结构最为理想,即扁平结构(Flat)。
而对规模大一些的网站,往往需要二到三层子目录。象这样:
http://www.vv11.com/dir1/dir2/dir3/page.htm
搜索引擎还是会去抓取二到三层子目录下的文件,但最好不要超过3层,如果超过4层,象以下这个页面,搜索引擎就很难去搜索它了:http://www.vv11.com/dir1/dir2/dir3/dir4/page.htm
当然,以下情况下,即使深入第四层甚至更深层次的页面,也同样能被搜索到:
1、如果该页提供了重要内容,有大量来自其它网站的外部链接(Inbound Links);
2、如果在首页上增加一个该页的链接,可以通过首页直接到达,搜索Spider还是可以轻易地找到它;
3、如果有其它网站在顶级页面上链接了该页,其效果就好似你在自己的首页上做了该链接。
此外,图形、脚本、CGI-BIN和CSS样式表则各自建立专门的目录收入其中,一般不放在根目录下。
目录和文件命名:
根据关键字无所不在的原则,可以在目录名称和文件名称中使用到关键词。但如果是关键词组,则需要用分隔符分开。我们常用连字符"-"和下划线"_"进行分隔,URL中还经常出现空格码"%20"。因此,如果以"中国制造"作文件名,就可能出现以下三种分隔形式:
made-in-china.htm
made_in_china.htm
made%20in%20china.htm
但事实上,至少在目前Google并不认同"_"为分隔符。对Google来说, made-in-china和made%20in%20china都等于made in china,但made_in_china就被读成了madeinchina,连在一起之后,关键词就失去了意义。
因此,目录和文件名称如果有关键词组,要用连字符"-"而不是下划线"_"进行分隔。
URL应该越短越好。有人为了单纯增加关键字而额外建多一个带有关键字的子目录,改变目录结构。由于URL中含有关键字本身对排名提高帮助并不大,因而这种做法多此一举,也是搜索引擎反感的。
绝对URL和相对URL:
绝对URL:即网页路径使用包含顶级域名在内的完整的URL。
如:www.vv11.com/page1/index.html是一个绝对路径,其中/page1/index.html则为相对路径,由浏览器自动在该链接前加上www.vv11.com。
总体上,Google在排名时并不在意URL使用的是相对路径还是绝对路径。 动态URL: 目前很多网站都有数据库驱动生成的URL,即动态URL,往往表现为在URL中出现"?"、"="、"%",以及"&"、"$"等字符。动态URL极不利于搜索引擎抓取网页,严重影响网站排名,通常是通过技术解决方案将动态URL转化成静态的URL形式,如:
将http://www.vv11.com/messages.php?id=2&type=5 转化为http://www.vv11.com/messages/2/5/ 下文将会专门提到动态URL的解决方案。
导航结构
网站导航是对引导用户访问网站的的栏目、菜单、在线帮助、布局结构等形式的统称。其主要功能在于引导用户方便地访问网站内容,是评价网站专业度、可用度的重要指标。同时对搜索引擎也产生诸多提示作用。概括地讲,网站在导航方面应注意以下几点:
1、主导航醒目清晰
主导航一般体现为一级目录,通过它们用户和蜘蛛程序都可以层层深入访问到网站所有重要内容。因此主栏目必须在网站首页第一屏的醒目位置体现,并最好采用文本链接而不是图片。
2、"面包屑型(Breadcrumbs)"路径
所谓"面包屑"是比喻用户通过主导航到目标网页的访问过程中的路径提示,使用户了解所处网站中的位置而不至于迷失"方向",并方便回到上级页面和起点。路径中的每个栏目最好添加链接。
如下: 网信设计: 网信日志 > 技术资讯 > 网络营销
即使没有详细的路径来源,也至少应该在每个子页面提示回首页的链接,包括页面的LOGO作链接。
3、首页突出重要内容
除了主栏目,还应该将次级目录中的重要内容以链接的方式在首页或其它子页中多次呈现,以突出重点。搜索引擎会对这种一站内多次出现的链接给予充分重视,对网页级别(PageRank)提高有很大帮助,这也是每个网站首页的网页级别一般高于其它页面级别的重要因素,因为每个子页都对首页进行了链接。
4、使用网站地图
网站地图(Site Map)是辅助导航的手段,最初是为用户设计,以方便用户快捷到达目标页。良好的网站地图设计常常以网站拓扑结构体现复杂的目录关系,具有静态、直观、扁平、简单的特点。多采用文本链接,不用或少用修饰性图片,以加快页面加载速度。以上特点符合搜索引擎友好的要求,因此网站地图在SEO中也有重要的意义。尤其对于那些采用图片导航和动态技术生成的网页,通过在网站地图中进行文本链接,可在一定程度上弥补蜘蛛程序无法识别图片和动态网页造成的页面不可见的风险。
需要注意,网站地图也要突出重点,尽量给出主干性内容及链接,而不是所有细枝末节。一页内不适宜放太多链接。Google明确提出"如果网站地图上的链接超过大约 100 个,则最好将网站地图拆成多个网页"。
工具推荐:
Xenu:http://home.snafu.de/tilman/xenulink.html 生成网站地图
框架结构
框架结构,即帧结构(Frame)网页表现为一个页面内的某一块保持固定,其它部分信息可以通过滚动条上下或左右移动显示,如左边菜单固定,正文信息可移动,或者顶部导航和LOGO部分保持固定,其它部分上下或左右移动。我们的邮箱通常都采用框架建构。框架型网页的另一个表现是,深层页面的域名通常不会在URL中体现出来,即使进入深层子页面,浏览器显示出来的URL仍然是主页的URL。
框架型网站的优越性体现在页面的整体一致性和更新方便上。尤其对于那些大型网站而言,框架结构的使用可以使网站的维护变得相对容易。但框架对搜索引擎来说是一个很大的问题,这是由于大多数搜索引擎都无法识别框架,也没有什么兴趣去抓取框架中的内容。此外,某些浏览器也不支持框架页面。
如果网页已经使用了框架,或出于某种原因一定要使用框架结构,则必须在代码中使用"Noframes"标签进行优化,把Noframe标签看做是一个普通文本内容的主页。在<Noframe></Noframe>区域中包含指向frame页的链接以及带有关键词的描述文本,同时在框架以外的区域也出现关键词文本。这样,搜索引擎才能够正确索引到框架内的信息。
还有一个办法是采用iframe即内联框架(Inner Frame)技术来避免Frame带来的不便。所谓iframe也是框架的一种形式,它是相当于在主浏览器窗口中内嵌一个子窗口,内容自动打开。iframe可以嵌在网页中的任意部分,也可以随意定义其大小,其代码显示为:
<iframe src=xx width=x height=x scrolling=xx frameborder=x></iframe>"
对搜索引擎来说,iframe中的文字是可见的,也可以跟踪到其中链接指向的页面,不过与用户所见不同的是,搜索引擎将iframe内容看成单独的一个页面内容,与被内嵌的页面无关。
图像优化
一般而言,搜索引擎只识读文本内容,对图像是不可见的。同时,图像文件直接延缓页面加载时间,如果超过20秒网站还不能加载,用户和搜索引擎极有可能离开你的网站。因此,除非你的网站内容是图片为主,比如游戏站点或者图片至关重要,否则尽量避免使用大图片,更不要采用纯图像制作网页(SPLASH PAGE)。
网站图片优化的核心有两点:增加搜索引擎可见的文本描述,以及在保持图像质量的情况下尽量压缩图像的文件大小。
Alt属性:
每个图像<IMG>标签中都有ALT属性,搜索引擎会读取该属性以了解图像的信息。因此,最好在所有插图的ALT属性中都有文字描述,并带上该页关键字在其中。
如:www.vv11.com的主页LOGO部分代码为:
<img src="/article/UploadPic/2007-3/200739223415731.gif" alt="深圳市网信设计工作室" width="200" height="70" border="0">
文本说明:
除了ALT属性文字,还可以考虑以下方法直接优化图像,使之被搜索到:
1、在图片上方或下方加上包含关键词的描述文本;
2、在代码中增加一个包含关键词段的heading标题标签,然后在图片下方增加文字描述。
3、在图片下方或旁边增加如"更多某某"链接,包含关键词。
4、创建一些既吸引用户又吸引搜索引擎的文本内页,先把流量吸引到这些页面,再提供文本链接指向你的图片页面。
总体上,网页应尽量减少装饰性图片以及大图片。而Alt属性中的文字对搜索引擎来说,其重要性比正文内容的文字要低。
Gif和JPGE图像优化:
Alt属性和文本说明都只是对图像之外的文本环境进行优化,下面简单谈谈对图片本身的优化处理。对图片文件优化的目的是在尽量不影响图像画面效果的情况下,将其文件大小降到最低,以加快页面整体下载速度。
网页图片格式主要有GIF和JPGE两种形式。一般来讲,GIF适用于线图和企业标识;JPEG适宜照片元素的格式。主要通过减少GIF颜色数量、缩小图片尺寸和降低分辩率来缩小文件,也可以采用层叠样式表达到优化的目的。PhotoShop的版本越高越适用于网络图形。此外,将大图片切割成若干小图片于不同的表格区间内进行拼接,也可以相对加快下载时间。
工具推荐(英文):
www.xat.com/internet_technology/download.html (图片优化工具)
FLASH优化
FLASH优化:
由于FLASH优美的视觉效果和广阔的创意空间,FLASH技术在网页设计和网络广告中的应用非常广泛,很多网站首页甚至全部用FLASH设计。但FLASH网页有一个非常致命的问题,即大部分搜索引擎无法识别FLASH中的信息。Google也只能检索到部分Flash文件中的内嵌链接。
以下列举一个制造机电设备的企业网站首页的代码,用FLASH制作,请注意是否可以看见有意义的文本:
<html>
<head>
<title>欢迎光临!/title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<style type="text/css">
<!-- body {
margin-left: 0px;
margin-top: 0px;
margin-right: 0px;
margin-bottom: 0px;
} -->
</style>
<link rel="stylesheet" href="style.txt" type="text/css">
</head>
<body bgcolor="#FFFFFF" text="#000000">
<table border="0" width="100%" height="100%" cellspacing="0" cellpadding="0">
<tr>
<td width="100%" background="images/bg.jpg"><div align="center">
<center>
<table width="777" border="0" align="center" cellpadding="0" cellspacing="0">
<tr>
<td><object classid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,29,0" width="777" height="455">
<param name="movie" value="/article/UploadPic/2007-3/200739223415598.swf">
<param name="quality" value="high">
<embed src="/article/UploadPic/2007-3/200739223415598.swf" quality="high" pluginspage="http://www.macromedia.com/go/getflashplayer" type="application/x-shockwave-flash" width="777" height="455"></embed>
</object></td>
</tr>
</table>
<br><span class="style2">本页使用FLASH技术,如果无法正常浏览请下载并<a href="http://www.macromedia.com/shockwave/download/triggerpages/flash.html">安装插件</a>或<a href="asp-bin/big5/?page=1">直接进入</a><br> if you are not able to view the animated <a href="http://www.macromedia.com/shockwave/download/triggerpages/flash.html">pleass install plug-in </a> first <br><!--网站计数器开始-->
<script language="Javascript" src="counter/count.asp"></script>
<!--炯剖鹘崾?->
</span>
</center>
</div>
</td>
</tr>
</table>
</body>
</html>
同时再采用模拟蜘蛛程序的工具,测试到搜索引擎对该页抓取结果如下:
Spidered Text (蜘蛛可识别的文本):
Welcome 本页使用FLASH技术,如果无法正常浏览请下载并 安装插件 或 直接进入 if you are not able to view the animated pleass install plug-in first
Spidered Links(蜘蛛可识别的链接):
http://www.macromedia.com/shockwave/download/triggerpages/flash.html
asp-bin/big5/?page=1 (下载FLASH插件的链接地址)
http://www.macromedia.com/shockwave/download/triggerpages/flash.html
因此可以得出结论是:
蜘蛛程序没有在这个企业网站首页获得任何有意义的文本内容,也没有获得该Flash首页中进入"中文版""英文版"关键性内容的链接。
FLASH优化可以从以下三个方面来考虑:
1、做一个辅助HTML版本: 保留原有FLASH版本的同时,还可以设计一个HTML格式的版本,这样既可以保持动态美观效果,也可以让搜索引擎通过HTML版本的网页来发现网站。
2、将Flash内嵌HTML文件: 还可以通过改变网页结构进行弥补,即不要将整个网页都设计成Flash动画,而是将Flash内容嵌入到HTML文件中,这样对于用户浏览并不会削弱视觉效果,搜索引擎也可以从HTML代码中发现一些必要的信息,尤其是进入内容页面的链接。 即使首页全部动用了FLASH,也应该将进入内页的关键性按钮/链接置于FLASH文件之外,以独立纯文本链接的方式呈现。上文案例将"中文版"链接置于FLASH文件中,使得蜘蛛程序一无所获,无法抓取到内页信息。
3、付费登录搜索引擎: 如果FLASH网站错过了被免费的技术型搜索引擎自动检索的机会,或者搜索结果排名效果不太理想,可以通过付费登录或做搜索引擎关键词广告,同样被用户搜索到。
总体上,商业网站应尽量少用FLASH,站点间进行广告交换时也要避免采用FLASH广告为上策。
表格使用
表格是网页最重要的排版方式。如果某个网页采用了大段的长篇文本,除了可以将一页文本分成多面,还可以考虑将文本置入不同表格中,这样不仅管理方便,也使得该页加载时每个表格内容依次加载,这样访问者就可以一边看已下载内容一边等待剩余部分加载,而不是等待很久之后才一齐加载出来。
表格之内套嵌太多表格也不利于页面加载,因浏览器是先加载完大表格之后再加载内嵌的小表格,因此内嵌表格会最终降低整页加载速度。
网页减肥
代码设置不妥不仅延长网页加载时间,也严重影响蜘蛛程序对网页内容的抓取。通过对网页代码进行清减(俗称"网页减肥"),去掉臃肿杂乱的代码,减小网页文件大小,能够加快网页加载速度,让蜘蛛快速索引到重要内容。正常情况下一个页面的文件大小在15K左右,最好不要超过50K。网页减肥重点涉及以下几个要点:
CSS样式
网页制作应通过CSS(层叠样式表单)来统一定制字体风格,以使代码标准化,避免大量的字体和格式化标签如< h1 >< /h1 >、< font size=×× color=×× >< /font >充斥页面。通过css可以控制任何HTML标签的风格。例如<td>, <p>, <body>, <table>, <tr>, <th>等。只要在HTML的<head>区内的<style type="text/css">和</style>之间指定对应标签的风格如字体,颜色,大小即可,例如:
<style type="text/css">
<!--
h2 { font-family: "宋体"; font-size: 12pt; color: #333366; background-color: #FFCCCC; font-weight: bold }
h1 { font-family: "Arial"; font-size: 12pt; color: #993300 } -->
</style>
仅通过以上设置,就把文字的字体、字号、颜色、背景色等统一起来,不用对每段文字单独进行格式定义,从而减少大量重复性标签。注意把所有css文件单独存放在命名为css的外部文件中。通过设置CSS样式,也可以提升导航文本的美观度,达到与图片导航同样优美观的效果,这点尤其提醒网页设计师注意,没有必要将导航条用图片呈现。
Javascript:
正常情况下,网页尽量以<HTML>作为代码的开始端。但采用Javascript技术的网页往往在页面一开始就堆积大量JAVA代码,以至META及关键字迟迟不能出现,被推至页面底部,对搜索引擎很不友好。有两种方法可以使之得以改善:
1、将脚本移至页面底部
大部分的JAVA代码都可以移到页面结束标签之上,而不影响网站功能。这样就能一开始突出关键词,并加快页面加载时间。
2、将JAVA脚本置入一个 .js扩展名的文件。
包含你的Javascript的.js文件通常在网站访问者的浏览器中被缓存下来,使得下次访问速度加快,也使得网站修改和维护起来更加方便。例:一段JAVA代码正常情况下显示如下:
<script language=Javascript>
<!-- 此处是你的代码,将它们拷贝到一个.js文件 //-->
</script>
忽略开始及结束标签,将中间的代码单独保存为扩展名为.js的文件,如文件名为"mycode.js"的一个文件,然后将此文件上传到服务器上与该页同样的目录下。最后将上文列举的完整的Javascript置换为简单的一行:
<script language=Javascript src=mycode.js></script>
这样,一个"mycode.js"文件就将大段冗长复杂的JAVA代码置换了。
工具推荐:
网页减肥工具:http://www.7733.com/softdown/softdoc/net_opt.htm 去除网页中多余代码,减小网页
第四部分:SEO指导下的技术支持
对搜索引擎最友好(Search Engine Friendly)的网页是静态网页,但大部分内容丰富或互动型网站都不可避免采用到相关技术语言来实现内容管理和交互功能。SEO思想指导下的技术支持,主要是对特定代码的优化和对动态网页进行静态处理的措施。
Title标签和Meta标签
以.html或.htm为扩展名的HTML文档称为静态网页。Meta称为元标志,用于网页的<head>与</head>中。Meta 标签的用处很多,目前几乎所有的搜索引擎机器人都通过自动查找Meta值来给网页分类,是籍此判断网页内容的基础。其中最重要的是description(网站描述)和keywords(网站关键词)。另外一个基本的属性是Title标签,提示搜索引擎关于本页的主题。Meta和Title的形式在html语言中体现为:
<head>
<title>title标题</title>
<meta name="keywords" content="网页描述">
<meta name="description" content="关键词">
......
</head>
尽管Meta本身不足以解决排名问题,但对Meta标签的书写仍然是搜索引擎优化的基础工作。清晰准确的Meta文字与正文内容的关键词相呼应,是排名加分的重要条件之一。
标题(Title):
网页优化可以说是从Title开始的。在搜索结果中,每个抓取内容的第一行显示的文字就是该页的Title,同样在浏览器中打开一个页面,地址栏上方显示的也是该页的Title。因此,Title可谓一个页面的核心。对Title的书写要注意以下问题:
1、title简短精炼,高度概括,含有关键词,而不是只有一个公司名。但关键词不宜过多,不要超过3个词组。企业网站的title通常以公司名+关键词为内容
2、前几个词对搜索引擎最重要,因此关键词位置尽量靠前。
3、最好将title组织成符合语法结构和阅读习惯的短句或短语,避免无意义的词组罗列式title
关键词(Keywords):
Keywords提示搜索引擎:本网站内容围绕这些词汇展开。因此keywords书写的关键是每个词都能在内容中找到相应的匹配才有利于排名。Meta中的关键词书写技巧见前文的"关键词策略"。
描述(Description):
描述部分用简短的句子告诉搜索引擎和访问者关于本网页的主要内容。用该网站的核心关键词搜索后得到的搜索结果中,描述往往显示为标题后的几行描述文字。Description一般被认为重要性在title和keywords之后。描述的书写要注意以下问题:
1、描述中出现关键词,与正文内容相关
2、同样遵循简短原则,字符数含空格在内不要超过200个字符
3、补充在title和keywords中未能充分表述的说明
其它Meta标签:
为了限制搜索引擎对内容的抓取,可以采用以下几个Robots Meta标签:
<meta name="Robots" content="all|none|index|noindex|follow|nofollow">
其中:
all:文件将被检索,且页面上的链接可以被查询;
none:文件将不被检索,且页面上的链接不可以被查询;
index:文件将被检索;
follow:页面上的链接可以被查询;
noindex:文件将不被检索,但页面上的链接可以被查询;
nofollow:文件将不被检索,页面上的链接可以被查询。
但并不是所有的搜索引擎都支持meta中的robots标签,但是所有搜索引擎都支持一个功能更强的robots.txt的文本文件来达到上述功能(关于robots.txt文件应用的介绍,E书专家平文胜曾专门撰文详细解说"robots.txt和Robots META标签")。其它常用meta标签还有:
<META name author> 网站作者
<META name classification> 网站所属目录类别
<META name copyright> 版权声明
<META name generator> 网站用什么软件做的 ……
首页、重要的内页的title和meta标签最好分别书写,针对栏目主题体现不同的内容。
动态网页优化
动态网站是指网站内容的更新和维护是通过一个带有数据库后台的软件,即内容管理系统(CMS)完成。一般采用ASP,PHP,Cold Fusion,CGI等程序动态生成页面。动态页面在网络空间中实际并不存在,它们的大部分内容通常来自与网站相连的数据库,只有接到用户的请求,在变量区中输入一个值以后才会生成。动态网页扩展名显示为.asp、.php、cfm或.cgi,而不是静态网页的.html或者.htm。其URL中通常出现"?"、"="、"%",以及"&"、"$"等符号。网站使用动态技术的好处,除了增加网站交互功能,还具有容易维护和更新的优点,因此为许多大中型网站采用。
但大多数搜索引擎的蜘蛛程序都无法解读符号"?"后的字符。这就意味着动态网页很难被搜索引擎检索到,因而被用户找到的机会也大为降低。因此,建设网站之前首先要端正思想,即能够采用静态表现的网页尽量不要用动态实现,重要的网页用静态表现。同时使用技术将动态网页转化成静态网页形式,使URL中不再包含"?""="等类似的符号。也可以通过对网站进行一些改动,间接增加动态网页的搜索引擎可见度。即坚持"动静结合,以静制动"的原则。
不同技术的解决方案:
针对不同程序开发的动态网页有着相应的解决方案。以下是作者Karen编译的部分内容:
1、CGI/ Perl
如果你在网站中使用的是CGI或者Perl,可用一个脚本拾取环境变量前的所有字符,再将URL中剩余的字符赋值给一个变量。这样,你就可以在URL中使用该变量了。 不过,对于那些内置了部分SSI(Server-Side Include:服务器端嵌入)内容的网页,主要的搜索引擎都能够提供索引支持。那些以.shtml为后缀名的网页也被解析成SSI文件,相当于通常的.html文件。但如果这些网页在其URL中使用的是cgi-bin路径,则仍有可能不被搜索引擎索引。
2、ASP
ASP(Active Server Pages: Web 服务器端动态网页开发技术)被用于基于微软的网络服务器中。使用ASP开发的网页,一般后缀名为.asp。只要避免在URL中使用符号"?",大多数搜索引擎都能够支持用ASP开发的动态网页。
3、Cold Fusion
如果你使用的是Cold Fusion,那么你就需要在你的服务器端重新对其进行配置,使其能够将一个环境变量中的符号"?"用符号"/"代替,并将替换后的数值传给URL。这样一来,最后到达浏览器端的就是一个静态的URL页。当搜索引擎对该转换后的文件进行检索时,它不会遭遇"?",因而可继续对整个动态页的索引,从而使你的动态网页对搜索引擎仍然具有可读性。
4、Apache 服务器
Apache是最流行的HTTP服务器软件之一。它有一个叫做 mod_rewrite的重写模块,即URL重写转向功能。该模块能够使你将包含环境变量的URL转换为能够为搜索引擎支持的URL类型。对于那些发布后无须多少更新的网页内容如新闻,可采用该重写转向功能。
建立静态入口:
在"静动结合,以静制动"的原则指导下,还可以通过对网站做一些修改,尽可能增加动态网页的搜索引擎可见度。如将动态网页编入静态主页或网站地图的一个链接中,以静态目录的方式呈现该动页面。或者为动态页面建立一个专门的静态入口页面(gateway/entry),链接到动态页面,然后将静态入口页面递交给搜索引擎。
对一些重要的、内容相对固定的页面制作为静态网页,如包含有丰富关键词的网站介绍、用户帮助,以及含有重要页面链接的网站地图等。网站首页尽量全部采用静态形式,并将重要动态内容以文本链接方式全部呈现,虽然增加了维护工作量,但从SEO的角度看是值得的。
也可以考虑为你的重要动态内容创建静态的镜象网站。
付费登录搜索引擎:
当然,对于整个网站都采用与数据库相连的内容管理系统(CMS)发布的动态网站而言,提高搜索引擎可见度的最直接办法就是进行付费登录,直接提交动态网页到搜索引擎目录,或做关键字广告,保证网站被搜索引擎收录。
搜索引擎对动态网站支持的改进
搜索引擎一直在提高自己对于动态页面的支持。到目前为止,GOOGLE、HOTBOT和百度等开始尝试抓取动态网站页面(甚至包括URL带 "?"的页面)。但这些搜索引擎抓取动态页面时,为了避免"搜索机器人陷阱"(spider traps,脚本错误,这种错误会让搜索机器人进行无限循环的抓取,无法退出)",都只抓取从静态页面链接过去的动态页面,而从动态页面链出去的动态页面都不再抓取,即不会对动态页面中的链接进行深入访问。
对于直接使用动态的URL地址,请注意:
· 文件URL中不要有Session Id,同时不要用ID作为参数名称(特别是对于GOOGLE);
如:《网络营销基础与实践》一书,在当当网的介绍页面URL地址是:asp?product_id=493698">http://www.dangdang.com/product_detail/product_detail.asp?product_id=493698,该页就无法被读取。
·参数越少越好,尽量不要超过2个;
·尽量不要在URL中使用参数,这样可以增加动态页面被抓取的深度和数量。
附:
Google 向网站管理员提供的信息:www.google.com/webmasters/guidelines.html
百度常见站长问题:http://www.baidu.com/search/guide.html#2
第五部分:搜索引擎优化的重点:链接策略
链接是网站的灵魂。用户通过超级链接获得丰富的网站内容,搜索引擎蜘蛛也是沿着一个网站的页面链接层层跟踪深入,完成对该网站的信息抓取。对搜索引擎尤其是Google来说,决定一个网站排名的关键,是外部有多少高质量的链接指向这个网站。这就是外部链接或反向链接,也称导入链接(Inbound links或backlinks)。而从网站引向其它网站的导出链接以及网站内部页面间的彼此链接也对排名带来或多或少的影响。
搜索引擎分类目录
搜索引擎目录(Directory)即搜索引擎的人工分类目录。今天,登录分类目录是网站建成后非常基础、重要的工作,尤其登录几大主要分类目录,其重要性不在于访问者是否通过目录链接找到你的网站,而主要在于通过这些目录你的网站获得了重要的、高质量的外部链接,这对于你的网站提高排名具有举足轻重的作用。
目前,对于中文网站来说,最重要的分类目录有以下几个:开放式目录ODP,Yahoo!,门户搜索引擎目录搜狐、网易、新浪。可以分为免费登录和付费登录两种情况。无论是免费还是付费,都须通过手工输入登录。
免费登录:
最著名最重要的登录是全球最大的开放式目录库Open Directory Project:www.dmoz.org。
ODP的宗旨是:建立网上最全面最权威的目录,以及建立一个被公众认为高质量的资源库。在这一宗旨下,全球志愿编辑员选择高质量内容的网站核准进入分类目录。
由于Google等重要搜索引擎都采用ODP的数据库,是Google每月一次深度索引的基础,因此向ODP提交网页成为每个网站完成后的首要工作。登录ODP目录是免费的,但要接受较为严格的人工审核和较长时间的等待,并且最后可能网站登录不成功,还要经历反复提交的过程。
由于DMOZ目录在网站排名中举足轻重的作用,使得越来越多良莠不齐的的网站向DMOZ提交或违规提交,而志愿加入的人工编辑队伍中出现以权谋私的现象和素质不高的情况,诸多因素使得现在登陆DMOZ非常困难,没有一个网站敢保证被DMOZ收录。因此,要确保登录成功,唯一的办法是小心谨慎地完全遵守DMOZ登录条款。以下是必须遵守的提交注意事项:
1、确保网站内容是原创而非转载、镜象或复制
如果你的网站内容只是一些会员制产品/服务信息及链接,或是大量拷贝其它站点内容,那么你的网站极有可能被DMOZ拒绝。即使对已经收录的站点,一旦发现它们是镜象、复制或非原创,DMOZ也会将其从目录中剔除。所以务必在网站中加入产品或服务的原创介绍信息。
2、不要采用虚假、作弊和夸张的手段
被搜索机器人反感的做法,同样被目录编辑拒之门外。下文将有专门章节讲到什么是搜索引擎作弊行为。网站说明中任何虚假、夸张的文字都会遭到拒绝。对违法性内容,也是不会收录的。
3、确保网站外观的良好性
如果网站内容出现大量拼写错误、死链接或"正在建设中"的字样,或者下载缓慢,都会阻碍编辑对你的网站的收录。此外,对于来自免费主机的网站,被DMOZ收录的机会很少。
4、确保网站中包含具体联系信息
一个DMOZ编辑称,如果他在网站中找不到实际联系地址或电话号码,他就会认为这个网站不具备可信度。因此,如果你的网站中只有一个Email地址作为联系信息,是极不利于收录成功的。
5、确保网站提交到正确的目录
选择合适的分类目录及子目录是网站提交的核心。很多网站登录失败只是由于提交选择的目录不正确所致。所以在提交网站之前,必须先浏览整个目录,最好也了解一下竞争对手的网站都放在哪个目录下。确认之后,才在该目录页面右上角点击"提交网页"。
6、记下提交日期、目录名和编辑邮箱
向ODP提交完你的网站后,记下提交的日期及目录。如果你提交的那个目录下有编辑员信息,最好把编辑的名字和邮箱也记下来。这些信息,对于你需要询问提交网站的处理状态或再次提交时,非常有用。
7、不要多次重复提交网站
因为编辑是根据网站的提交日期顺序进行处理的,一个目录下往往有很多网站在队列中等候审批。从提交成功到最后收录,最快也要2周时间,最晚的甚至要等到半年以后。因此,你需要耐心等待结果。如果网站非常庞大,且拥有很多不同内容的分支时,你可以尝试将不同内容的网页分别向DMOZ下的相应目录进行提交。
一旦DMOZ收录了你的网站,那很快就可以被Google,Lycos,Netscape,AOL, HotBot,DirectHit等一些大型搜索引擎和门户网站收录。
其它的重要免费目录包括Yahoo目录。Yahoo是最早开始做分类目录的网站,直到今天登录Yahoo目录也是网站推广的重要环节。Google把来自Yahoo目录的链接作为网站排名的重要分值。
工具推荐:
检查网站是否登录多个重要目录:www.123promotion.co.uk/directory/index.php
付费登录(Paid Inclusion):
英文Yahoo实行付费登录商业网站政策,国内的门户搜索引擎目录也对商业网站纷纷采用付费登录。付费登录商业模式包括普通登录和固定排名,一般按年付费,网站在付费之后立即登录目录,无须等待和受到其它因素的影响。门户搜索引擎的搜索程序也比较偏重于对自身付费目录数据的抓取。
总体上,付费登录对于商业网站和采用了大量不利于搜索引擎友好的手段建设的网站来说,还是有必要的。
关于自动登录软件(Submitting Tools):
自从有了B2B商务平台和搜索引擎营销以来,就出现了向这些中间平台和搜索引擎提交供求信息或网站的自动登录软件,并一度在市面上广为流行。搜索引擎自动登录软件的功能是承诺将客户的网站一次性登录到全球N个搜索引擎目录,有的甚至保证可以使网站在搜索引擎中的排名获得极大提升。实际上,已经有诸多营销实践者对此类自动登录软件实际效果提出了质疑:
1、真正为网站带来访问量的搜索引擎主要集中于几大主流搜索引擎,其它的小搜索引擎搜索量极小,即使网站被这些小搜索引擎收录成功,也不能指望通过他们带来什么访问量。
2、今天的主流搜索引擎目录往往采用付费登录或严格的人工审核,这些目录极其反感由自 动登录软件提交的网站,有的明确提出拒绝自动提交方式。
3、在软件自带的几千个搜索引擎中,软件本身提示登录成功的大概有百分之六七十,是否真正登录成功,实际操作中很难一个一个去检验。
4、如果网站有来自其它网站的导入链接,即使不用登录,主流搜索引擎机器人同样会抓取 到你的网页。
5、如果从增加外部导入链接的角度出发,英文网站针对英文搜索引擎的自动提交可以一试,聊胜于无,但不可对其抱有太大的期望。
总体上,盛行于免费推广时期的自动登录软件在今天各大主流商业推广平台纷纷实施付费政策的商业模式下,已经越来越丧失价值。
高质量导入链接
搜索引擎在决定一个网站的排名时,不仅要对网页内容和结构进行分析,还围绕网站的链接展开分析。对网站排名致关重要的影响因素是获得尽可能多的高质量外部链接,也称导入链接。网站即使没有向目录提交,但由于其他重要网站上有你的网站链接,一样可以获得搜索引擎的快速抓取,并为取得好排名加分。
将导入链接纳入排名重要指标的依据在于,搜索引擎认为,如果你的网站富有价值,其它网站会提及你;对你提及越多,说明价值越大。由此引申出链接广度(Link Popularity)在搜索引擎优化中的重要地位。
唯其如此,人们想方设法地为网站"制造"外部链接,导致涌出大量垃圾(spam)链接和网站,于是搜索引擎在算法调整中,仅对高质量的外部链接给予重视,对类似Spam的做法往往给予适得其反的结果。 因此,今天对链接广度要有这样的认识:即使获得上百个质量低劣的或内容毫不相干的站点的链接,也抵不上一个高质量且内容高度相关或互补的站点的链接。
链接质量分析:
来自以下网站的链接都可以称为高质量的链接:
◆ 搜索引擎目录中的链接以及已加入目录的网站的链接
◆ 与你的主题相关或互补的网站
◆ PR值不低于4的网站
◆ 流量大、知名度高、频繁更新的重要网站(如搜索引擎新闻源)
◆ 具有很少导出链接的网站
◆ 以你的关键词在搜索结果中排名前三页的网站
◆ 内容质量高的网站
相比高质量链接,以下链接堪称垃圾链接,对网站排名不起作用或起反作用:
◆ 留言簿、评论或BBS中大量发贴夹带网站链接
◆ 已经加入太多导出链接的网站(几十甚至上百个"友情链接"中有一个你的网站)
◆ 加入链接基地(Link Farm)、大宗链接交换程序(bulk link exchange programs)、交叉链接(Cross Link) 等链接程序,与大量会员网站自动交换链接,被搜索引擎视为典型的垃圾链接,极有可能受到惩罚或牵连。Google就会对那些使用链接程序的站点进行永久性删除。
还有两种导入链接被误认为可以增加链接广度:
◆ 点击付费的搜索引擎广告链接,如百度竞价排名和Google的右侧关键词广告。
◆ 多层级的网络会员制联盟(Affiliate program)链接。
这些链接不会直接指向你的网站,而是指向盟主的网站,以方便他们跟踪点击计费,因此不会提高你网站的链接广度。
当然,如果你本身主持该会员制联盟,你的服务器就在跟踪会员网站并将它们指回你的站点,这种情况下还是有助于提高你的链接广度。
怎样获得高质量导入链接:
1、向搜索引擎目录提交网站
见前文
2、寻找网站交换链接
俗称友情链接或互惠链接。互惠链接的基础是你的网站内容具有较高质量,否则请求链接不容易成功。
交换链接对象包括:
◆ 已经加入搜索引擎分类目录的相关网站
所有主要搜索引擎中的与你的行业相关的目录下的网站,都是理想的链接对象。
◆ 与你的竞争对手链接的相关网站
要找到这些网站,可以在搜索引擎中输入"link:",跟着输入竞争者的域名如。
"link:theirdomain.com"和"link:www.theirdomain.com"这样还可以在获得链接的同时与对手竞争获得目标客户。
◆ 生意链中的对象
竞争对手与你的主题最相关,但交换链接不大可能,因此可以考虑与你的生意链中的上下游合作伙伴,包括分销商,代理商,供应商等的网站交换链接。
◆ 容易被找到的相关网站
如那些做搜索引擎广告的网站或其它大力宣传推广的网站,以及自然排名不错的相关网站。
找到以上网站之后,再对其进行链接分析,考察是否属于高质量链接对象。诸如流量ALEXA排名、PR值高低和导出链接的数量都是考察的基本条件。最好为对方提供链接的HTML源代码信息,这样链接交换对象只需简单复制这些代码并嵌入自己网页即可。注意,由于你的网站可以通过好几个不同的URL达到。在交换链接时必须提供一个统一的URL,一般以符合大多数人群使用习惯的http://www.vv11.com为准。
交换链接的过程,是经过对对方网站仔细分析后,通过诚恳的一对一的联系最终获得,而不是漫天撒网的垃圾邮件轰炸来请求交换链接。
3、网站被主动链接或转载
这是最获搜索引擎赏识的链接,也是搜索引擎重视外部链接的根本原因。如果你的网站内容丰富,质量高,其它相关网站会主动将你的网站链接到他们的网站。尤其当你的网站提供很多相关免费资源、知识库时,被其它网站链接和转载的机会都很高。
4、在重要网站发表专业文章
围绕目标关键词在一些重要站点发表文章,在文章中或结尾带上你的网站签名,或在作者简介中放上你的链接和围绕关键字的网站描述。这样也是既可以获得高质量互惠链接,亦可能获得目标客户。在你的博客日志或个人主页上也不要忘了加上网站链接。注意你发表的每篇文章标题都应该包含关键词在内。要网站,指那些流量高,威信度高的网站。个人体会是,可以用你网站的关键词去主流搜索引擎订阅新闻,那些被作为新闻源的网站都被搜索引擎看作重要网站。搜索引擎对这些新闻源每天检索一次,更新频繁,这些网站上的链接自然也成为被更新的对象,效果极佳。
、在所在行业目录提交网站
尽可能向更多的相关网络目录、行业目录、商务目录、黄页、白页提交你的网站,加入企业库。
工具推荐:
查询网站有哪些导入链接及数量:
www.sowang.com/so/ (综合查询:含链接广度、PR、ALEXA排名)
http://tool.admin5.com pr whois alexa查询
www.marketleap.com/publinkpop(可同时与多个竞争对手网站进行比较)
www.uptimebot.com(同时检测10个搜索引擎的收录情况)
asp">www.seotoolkit.co.uk/link_popularity_checker.asp
搜索框命令:
在google中输入:link:www.vv11.com
在Yahoo中输入:link:http://www.vv11.com
导出链接和内部链接
导出链接就是你的网站中指向其它网站的链接。搜索引擎机器人除了分析你的导入链接,也会分析你引出去的站点,如果导出链接站点内容与你的网站主题相关联,同样有利于搜索引擎友好。这也是交换链接要选择主题相关网站的原因。最后,一个网站内页面间的链接也被纳入链接分析之中,影响到网站的页面等级,最终影响排名。
导出链接:
在你的网站上如果增加一些与你关键词有关的行业/专业的资源性网站链接,不仅有利于丰富网站内容,也有利于提升搜索引擎对你网站的好印象。
这一点尤其值得一些站长注意。由于缺乏原创资料,他们常常转摘其它网站的文章作自己网站的内容,但又不注明来源,惟恐导出链接助长了竞争对手,不利于自己的网站访问量。其实,对搜索引擎来说,适量、适当的导出链接是很有必要的。
当然,导出不同于导入,即使主题相关,也要控制数量。因为从"网页级别"的角度看,搜索引擎认为一个页面奉献的导出链接数量越多,则该网站其它页面的受益相应就减少。所以一个页面导出链接数量应受到合理控制,不要超过15个。首页的导出链接更要控制在10个以内,多出的应单独安排在次级页面。Google认为一个页面的最大导出链接数量不应超过100个。
内部链接:
除了导入导出链接,一个站点的页面之间也往往彼此链接,如一篇文章结束后的"相关文章"列表,将该网站中同一主题下的其它文章都链接在内,不仅方便访问者,也有利于搜索引擎。网站应有意识将重要内容页面对次链接于其它页面,让搜索引擎知道这是你的重要页面,从而给予更高的PR值,进行重点索引。
网站还可以通过建立多个二级域名子站,子站间彼此相链,再一起链回主站,形成一个子站群包围主站,对提高排名相当有利。
无论是导出链接还是内部链接,都要保证链接有效而不是死链接,死链过多不仅给用户造成不便,也极不利于搜索引擎友好,影响排名。
附:免费链接检测工具:
1、 Xenu:http://home.snafu.de/tilman/xenulink.html
2、 W3C:http://validator.w3.org/checklink
关键词链接文本及上下文语意
搜索引擎比较重视链接文本中出现的关键词。因此无论是导出链接、导入链接还是内部链接,都最好兼顾到链接文本中含有关键字。比如导出链接最好选择那些有关键词命名的网站,如一个网页设计的网站可以在行业资源中添加名称中带有"网页设计"四字的导出链接。
需要注意的是,如果一个网站的导入链接的文本完全相同,则可能遭致搜索引擎忽略或惩罚。因为搜索引擎希望导入链接是别人自然创建的,这种统一文字使搜索引擎怀疑该网站是为了增加链接广度而进行人为制造的结果。因此网站在对外交换友情链接时最好使用不同的文本,如网信工作室的链接文本就包括"网信"、"网信设计工作室"、"深圳网页设计工作室"等。
除了链接文本,链接周围的文字即上下文(Context) 语意也非常重要。链接分析系统通过检查链接上下文内容来确定网站与其链接对象之间的关联度,以评估该页面的内容质量。通过语意分析,也可以判断出关键词是否作弊。
第六部分:危险的搜索引擎优化作弊
由于技术型搜索引擎在网站排名过程中完全由蜘蛛程序自动完成,未有人工参与,这为那些针对排名原理而采用欺骗蜘蛛程序的手段提供成功的可能性。因此在SEO的发展过程中,一直伴随着关于作弊方法的讨论,成为业界关注的话题。
SEO作弊手段
做SEO必须了解基本的作弊手段,目的是避免无意间采用了相关手段遭到处罚。以下是被视为作弊的常见手段:
1、关键字堆砌:
为了增加关键词的出现频次,故意在网页代码中,如在META、title、注释、图片ALT以及 URL地址等地方重复书写某关键词的行为(Stuffing)。
2、虚假关键词:
通过在META中设置与网站内容无关的关键词,如在Title中设置热门关键词,以达到误导用户进入网站的目的。同样的情况也包括链接关键词与实际内容不符的情况。
3、隐形文本/链接:
为了增加关键词的出现频次,故意在网页中放一段与背景颜色相同的、包含密集关键字的文本。访客看不到,搜索引擎却能找到。类似方法还包括超小号文字、文字隐藏层等手段。隐形链接是在隐形文本的基础上在其它页面添加指向目标优化页的行为。
4、重定向(Re-Direct):
使用刷新标记(Meta Refresh)、CGI程序、Java、Javascript或其它技术,当用户进入该页时,迅速自动跳转到另一个网页。重定向使搜索引擎与用户访问到不同的网页。
5、偷换网页:
也称"诱饵行为(Bait-&-Switch)",是在一个网页成功注册并获得较好排名后,用另一个内容无关的网页来替换它的行为。
6、复制站点或内容:
通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为。镜象站点(Mirror Sites)是此中典型。
7、桥页/门页(Bridge/Doorway/Portal/Entry):
针对某一关键词专门制作一个优化的页面,链接指向或重定向到目标页面。有时候为动态页面建立静态入口,或为不同的关键词建立不同内页也会用到类似方法,但与桥页不同的是,前者是网站实际内容所需而建立的,是访问者所需要的,而桥页本身无实际内容,只针对搜索引擎作了一堆充斥了关键词的链接而已。
8、隐形页面(Cloaked Page) 指同一个网址下对不同的访问者选择性返回不同的页面内:
搜索引擎得到了高度优化的网页内容,而用户则看到不同的内容。
9、重复注册:
违反网站提交纪律,突破时间间隔限制,将一个网页在短时间内反复提交给同一个搜索引擎以获得收录的做法。
10、垃圾链接:
加入"链接工厂"(亦称"大量链接机制")指由大量网页交叉链接而构成的一个网络系统。一个站点加入 "链接工厂"后,一方面它可得到来自该系统中所有网页的链接,同时作为交换它需要"奉献"自己的链接。籍此方法来提升链接得分。
11、包含指向作弊网页的链接:
这种情况,有的是无辜被作弊网页牵连,有的则是桥页之故。
搜索引擎对作弊的处罚
由于作弊行为完全背离了搜索引擎对搜索结果排名的初衷——对用户有利的原则,破坏了正常的搜索结果,严重影响搜索引擎质量和声誉,并昭示出搜索引擎技术的漏洞,因此作弊行为被搜索引擎厂商深恶痛绝。一旦被侦破为作弊,将视情节轻重给予不同程度的处罚。发生在2005年3月底的Google清理部分垃圾性搜索结果(清理"广告位出租"的SEO垃圾)以及关闭部分作弊情节严重的作弊站长网站事件,就是典型的处罚案例。
搜索引擎技术的发展也是侦破作弊技术的发展。今天,搜索引擎对于蒙蔽它的手段识别技术越来越精,过去可能还行得通的手段在今天就有着被处罚的危险。以下是部分搜索引擎对于作弊行为的处罚:
百度:根据网页的作弊情况,会受到不同程度的惩罚。
·较轻微的惩罚,是系统在给网页排名时略为降低该网页的排名。
·较常见的惩罚,是作弊网站的某些关键词(或所有关键词)的排名降到其它任何网站之后。
·较严厉的惩罚,对于作弊行为和后果特别恶劣的网站,将从百度中消失。
·特别补充,含恶意代码或恶意插件等用户极端反感内容的网页,虽然不是作弊,但只要用户投诉,一经确认也会被百度拒绝收录。
中搜
·中搜采用多种方法惩罚作弊。封杀、只索引部分正常内容(不减权)、整个网页排序推后、连带责任。
·根据历史纪录,中搜有作弊黑名单,黑名单中的网站是重点防范、监控对象;根据作弊监控算法计算出来分值很高的网站也会被重点审查。
·有轻微作弊的基本正常网页,中搜会只收录正常内容,如隐含文字等内容不建索引。
·有较多作弊特征的网页会被减权,基本上在前几页没有机会出现。
·包含有指向作弊网页的链接的网页会被牵连,承担连带责任。
·中搜会搜索引擎技术的各个环节监控作弊,同时重点监控排序剧变的网页,网站不分大小、不分领域、部分亲属远近都受到每周7*24小时的监控。除自动监控系统外,还有一个人工监控小组打击作弊。
Google Google没有明确给出处罚条款,但站主通过以下情况可以了解到网站是否受到处罚:
·网站的PageRank变为"0"
Google工具栏上的PageRank指示为"0"
·网站在Google的外部链接数变为"0"
Google工具栏上的Backlinks或在Google搜索框中键入"link:www.yourdomain.com"命令显示没有外部链。
·网站排名骤降
以核心关键词搜索,原有的排名下降明显。不过这种情况有时候是算法更新的原因,与处罚无关。
·网站在Google中消失
直接输入网址,找不到该网站。
被处罚的网站一般情况下如果解除作弊,还是可以获得"新生",情况特别严重者除外。
附:向Google举报作弊网站:www.google.com/contact/spamreport.html(Googe的反作弊技术发展就是基于这类举报中出现的案例)
向百度投诉垃圾网页http://www.baidu.com/search/spamreport.html
第七部分:网页级别(PageRank)
Google搜索引擎采用的核心软件称为 PageRank,这是由Google创始人开发出的一套用于网页评级的系统,是Google搜索排名算法中的一个组成部分,级别从1到10级,10级为满分,PR值越高说明该网页在搜索排名中的地位越重要,也就是说,在其他条件相同的情况下,PR值高的网站在Google搜索结果的排名中有优先权。网页级别由此成为Google所有网络搜索工具的基础
网页级别概述
Google对网页级别的描述
作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从网页 A 链接到网页 B 时,Google 就认为"网页 A 投了网页 B 一票"。Google 根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,Google 还要分析投票的网页。"重要"的网页所投出的票就会有更高的权重,并且有助于提高其它网页的"重要性"。
重要的、高质量的网页会获得较高的网页级别。Google 在排列其搜索结果时,都会考虑每个网页的级别。当然,如果不能满足您的查询要求,网页级别再高对您来说也毫无意义。因此,Google 将网页级别与完善的文本匹配技术结合在一起,为您找到最重要、最有用的网页。Google 所关注的远不只是关键词在网页上出现的次数,它还对该网页的内容(以及该网页所链接的内容)进行全面检查,从而确定该网页是否满足您的查询要求。
PR值算法原理总体上基于下面2个前提:
1、一个网页被多次引用,则它可能是很重要的;
一个网页虽然没有被多次引用,但是被重要的网页引用,则它也可能是很重要的;一个网页的重要性被平均的传递到它所引用的网页。这种重要的网页称为权威(Authoritive)网页。
2、假定用户一开始随机的访问网页集合中的一个网页,然后跟随网页的链接向前浏览网页,不回退浏览,那么浏览下一个网页的概率就是被浏览网页的PageRank值
影响PR值的因素
PR值体现为从0到10的11个数值,在Google的工具栏上以一条横向绿色柱状图显示,0级情况下呈白色。它是针对网页而不是网站,因此一个网站的首页和内页往往有着迥然不同的PR值。由于Google市场拓展进程的原因,中文网页的PR值整体上低于英文网页。对中文网站来说,拥有3级PR是基础, 4级PR算达标,5级PR可谓良好,而6、7级PR就算相当优秀的网站。当然,由于PR最直接的影响因素是来自链接,因此这种评级并不代表内容的级别水准,网站内容质量对PR的影响是间接的、长期的。根据PR值的算法原理,可知影响一个网站(首页)PR值的因素主要包括:
1、网站的导入链接质量:
根据前文对高质量导入链接的分析,则获得高PR值需要获得来自以下网站的链接:
◆ 加入搜索引擎分类目录与已经加入目录的网站交换链接
◆ 获得来自PR值不低于4并与你的主题相关或互补的网站的链接
◆ 你的链接出现在流量大、知名度高、频繁更新的重要网站上(如新闻源)
◆ 与你交换链接的网站具有很少导出链接
◆ 与内容质量高的网站链接(PR值上升潜力大)
2、 导出链接数量:
根据PR计算原理,由于"一个网页的重要性被平均的传递到它所引用的网页",因此反过来看,一个页面内过多的导出链接将潜在引起该页PR值的流失。但从内容的角度看,适当数量的与主题有关联的导出链接给搜索引擎带来良好的印象。因此,一个页面,尤其是首页的导出链接数量的把握,应该兼顾到PR值和关键词内容二者之间的平衡,即控制导出链接数量,以不超过10个为宜。
3、搜索引擎收录一个网站的页面数量
在探讨SEO的时候,人们过多关注核心关键词排名以及首页的表现情况,却往往忽略了一个极其重要的问题:即搜索引擎对一个网站收录的页面数量。后者在SEO中也有着极其重要的意义。一个用核心关键词查询排名不佳的网站,可能由于被抓取大量网页而在用户使用其它关键词查询时,内页获得前三甲排名。由于用户搜索时使用的关键词具有分散性,使得这种情况往往给网站带来极大访问量。
正因为收录页面的数量直接影响访问量,因此对PR值的影响也是很大的。被收录页面越多,主页PR越高。不过需要强调的是,此处所指的数量是指被收录数与网站页面总数的比值,而不是收录页面的绝对数值。比如一个拥有50个页面的网站被收录了10个页面,网站的被收录比值是1/5,一个拥有5000个页面的网站被收录了500个页面,比值是1/10,结果是收录10个页面比收录500个页面的网站还更具排名优势。但对各个搜索引擎来说,究竟达到多大的比值算是良好,目前还没有相关的数据。
附:查询网站收录页面数量:在搜索引擎中输入:site:www.kuziyuan.com(如果输入:site:admin5.com,则获得的是在admin5.com域名下所有二级域名的网页数量)。
工具推荐:www.marketleap.com/siteindex 可获得网站在多个主流搜索引擎中的网页收录数
4、首页PR的高低
尽管对PR的界定是针对网页而不是网站,但由于每个网页都依托某一网站而存在,首页是推广的核心页面,所以网站首页PR高低对内页各PR也产生直接影响。一般而言,一个网站各页面的PR值呈现以下走向:首页﹥一级页面﹥二级页面﹥三级页面……每深入一级,PR降低1-2个档次。更深层次可能就无法列入评级范围了。当然,如果一个深层内页有很多外部或内部链接,情况则另当别论。
5、文件类型
Google可以索引到的网页和文件类型包括:pdf、asp、jsp、hdml、shtml、xml、cfm、doc、xls、ppt、rtf、wks、lwp、wri、swf。做成PDF格式的文件往往都是网站比较重要的内容或文章。因此Google默认PDF格式文件的PR天生为3,高于一般HTML文件。
同理,Google给予XML、PS、Word、Power Point、Excel等类型页面的PR也比普通网页文件高。因此,对于网站比较有价值的内容,建议做成PDF格式。
6、PR值的更新
Google 每个月进行一次彻底的数据更新(Dance),更新后的网站排名和导入链接都会有某些变化,但其PR更新时间一般要延迟至dance后三个月左右,而且网站的PR值相对稳定,要上升或下降一级PR是很不容易的事情。
工具推荐:
查看PR值是否处于更新期间:www.seochat.com/seo-tools/future-pagerank (如果结果出现不一致的情况,则处于更新期间)
PR值的作用
由于网页级别的高低直接受链接的影响,而链接仅是SEO的一个方面,因此PR的高低只能反映出SEO的部分效果。一个网页如果拥有高PR值能够说明的仅是:
◆ 网页比较重要,拥有了排名靠前的优先权,并不能与排名靠前直接划上等号
◆ 具有了获得高质量导入链接的谈判优势 搜索引擎会加快对网页数据的更新
◆ 看上去挺美
正因为具有了排名靠前的优先权和谈判优势,使得高PR网站往往最终确实产生高排名,业内不少人士就干脆直接将PR与SEO划等号,这不仅不正确,也不利于SEO实施。因为PR值不高的网站同样有可能获得好的排名,而PR高的不见得有理想的排名。并且,在这样的思想指导下,人们往往片面追求链接效应,忽略了SEO对于内容、结构、关键词等方面的分析和改进,而后者才是用户和搜索引擎长期关注的焦点。网络营销专家冯英健博士认为:PR值的高低应该是包括SEO在内的搜索引擎营销所产生的自然结果而不应作为追求的目标。
结论:在SEO的过程中,不能忘记内容建设,不能忘记优质外链,但忘掉PR可没什么大不了的。
第八部分:搜索引擎优化管理
如果说搜索引擎优化体现在网站建设和推广的每一个环节,则对搜索引擎优化的管理贯彻于网站推广和维护的长期过程中。在搜索引擎技术不断发展,排名算法不断更新,同行竞争越来越激烈的背景下,任何一个排名的领先或落后都是暂时的现象,没有一劳永逸的结果。只有长期坚持的、优秀的SEO管理,才是保持排名优势的不二法门。
搜索引擎优化诊断分析
获得专业的搜索引擎优化诊断分析报告,可以使搜索引擎营销策略更有效。
将搜索引擎优化诊断分析报告配合网信工作室专业性评价系统,可以全方位透彻了解网站的网络营销表现,还可以针对存在的问题获得专家的分析建议。
Google沙盒效应(Sandbox Effect)
关于Google沙盒现象,业界众说纷纭。基本上可以这样理解:这是Google对于那些刚发布不久就有良好排名的"可疑"站点置于某种屏蔽程序中进行一段时期的"隔离审查"。待网站表现稳定之后,再解除屏蔽,给予其应得的实际排名和PR值。这段时长可能延续3个月左右。
之所以出现沙盒现象,主要是Google针对过度进行SEO——尤其采用了作弊手段如"制造"大量导入链接而获得高排名的网站采取的防备措施。因此,如果你的网站在发布不久后以核心关键词在Google排名中出现由高走低的不稳定现象,多半是被Google请进了沙盒。
当然,还有一种观点认为:Google为了在搜索结果(SERP)中为用户提供更多新信息,往往给予新发布的网站更多"关照",使得新网站暂时获得排名优势;但随着Google数据更新不断加快,这种对新网站的照顾开始解除,于是该网站排名趋向正常。
无论原因怎样,对待沙盒效应,正确的态度和方法是:保持冷静,当排名在短时间内迅速上升时不应盲目乐观,因为这是不稳定的表现。应该利用这个有利时机,频繁更新网站内容,提高内容质量,获得更多高质量导入链接,增加网站访问量,才能将排名优势一直保持下去。
网站数据更新
网站经营者都希望发布的重要内容如新产品信息或重要新闻被蜘蛛快速抓取并出现在搜索结果中。但现今我们点击搜索结果中的链接,往往进入后发现内容与结果描述不同,这是因为搜索到的结果是搜索蜘蛛在上次光顾该网站时抓取到的信息,之后该页内容更新,蜘蛛程序却还没有来得及抓取,从而造成的搜索结果与实际内容不符。不过,各搜索引擎都在加快 对网站访问的频率,除了每月一次全面的深度检索,还对频繁更新的网站进行数天甚至每天简单检索一次,以保证搜索结果的时效性。总结起来,Google对网站信息的更新取决于以下因素:
1、网站自身的更新频率
一个长期没有更新的网站,无论是用户和蜘蛛程序都会减少对它的访问。可以说,更新越频繁,蜘蛛程序光顾越多,你的新信息出现在搜索结果首页的机会也越大,被抓取到的网页数量也越多。
2、网站的结构
如果一个网站拥有优化的结构,蜘蛛访问起来很顺利的话,那么它会更乐意访问该网站。
3、服务器的性能
如果蜘蛛程序前来索引你的网站,而你的服务器迟迟不能加载页面,或根本不能访问,那么搜索引擎就会尝试在下一次更新时再来,如果多次出现同样的情况,搜索引擎就会减少对该站的访问,或将它在数据库里删除。
4、PR值的高低
正如高PR值拥有了获得高排名的优势,很多业内人士认为PR值的高低同样是搜索引擎判断更新频次的重要因素。
5、Meta"revisit-after"
有人在Meta中如下设置:<META NAME="revisit-after" CONTENT="5 days">,以次提示蜘蛛程序每5天访问一次。实际上,由于Google基本上已经将Meta所起的作用降到很低,因此类似标签是没有多大作用的。但是,如果将时间设为30天以后的数值,被认为是有效的。
综上所述,网站维护得力,才是搜索引擎经常更新网站数据的根本原因。
Google数据更新
Google有8个数据中心,共享超过一万台的服务器。一般在每月中下旬开始升级数据库。这期间,新的网站被加入,无效网站被删除,对收录网站进行全面深度检索,也可能在这期间调整算法。由于每次升级都会引起很多网站排名波动,俗称Google数据更新。有人则直接把Google 数据更新定义成Google重新安排它的搜索结果排名的过程。
Google数据更新对于SEO来说,涉及的注意事项如下:
1、网站的提交及更新时间
在数据更新期间,新网站被收录的机会增大,因此宜在数据更新其间提交新网站及加大网站更新力度。
2、静观其变,及时跟进
由于数据调整有一个过程,数据更新期间的普遍表现是排名波动不稳定,忽上忽下。也可能在这期间调整排名算法。宜在数据更新结束后,针对排名升降结果和竞争对手的排名情况调整自己的SEO策略。
工具推荐:
检查是否出现Google Dance:www.webrankinfo.com/english/tools/Googledance.php 也可以简单地在以下地址输入同样的关键词进行查询:www.google.com、www2.google.com、www3.google.com。如果出现不同数量的搜索结果,则说明Google 正在经历数据更新。
网站流量分析
网站流量统计分析是网站运营和维护的基础工作。在分析访问数据的基础上对网站内容及营销策略进行调整,以期获得更好的营销效果,是进行流量分析的最终目的。获取网站访问统计资料通常有两种方法:一种是通过在自己的网站服务器端安装统计分析软件来进行网站流量监测;另一种是采用第三方提供的网站流量分析服务。
对SEO来说,流量分析中有两个重要统计指标:访问来源(Referrer)和搜索使用的关键词,即用户通过哪些链接进入自己的网站,以及通过哪些关键词找到自己。这些链接可能是各大搜索引擎,可能是某些导入链接,也可能就是你发布在某网站上的文章的URL;而关键词分析则可以了解哪些关键词及组合能带来访问量。这样就对网站的链接及关键词需要强化和弱化的方面了如指掌。
网站访问数据分析对SEO的指导是多方面的。但由于市面上大部分流量统计软件目前仅停留在统计数据的罗列上,缺乏对营销指导的结论性报告,因此这些模式化的分析结果实际上只是半成品,还需要网络营销专业人士对这些原始数据进行深度剖析,其对于SEO的指导作用才能真正发挥出来。
SEO工具/系统
借助一些小工具或网站系统,可以高效、及时地检测、分析网站优化和运营情况,从而指导运营维护工作的深入开展。
搜索引擎及目录免费登录入口:
Google:http://www.Google.com/intl/zh-CN/add_url.html
百度:http://www.Baidu.com/search/url_submit.htm
中搜:http://service.chinasearch.com.cn/NetSearch/pageurlrecord/frontpageurl.jsp
搜狐:asp?Step=REGFORM&;class">http://db.sohu.com/regurl/regform.asp?Step=REGFORM&;class=
网易:http://seek.163.com/cgi-bin/search/add_url.cgi
新浪:http://bizsite.sina.com.cn/newbizsite/docc/index-2jifu-09.htm
一搜:http://www.yisou.com/search_submit.html?source=yisou_www_hp
雅虎中国目录:http://cn.Yahoo.com/docs/info/suggest.html (分类目录)
DMOZ目录:http://dmoz.org/World/Chinese_Simplified (分类目录)
英文搜索引擎自动提交:http://www.trafficzap.com/searchsubmit.php
域名与主机工具:
域名批量查询:http://www.whois.sc
IP转换成域名:http://www.whois.sc/members/reverse-ip.html (查看某IP地址下共享哪些域名。免费注册)
关键字工具:
Google AdWords关键字工具:
查询特定关键词的常见查询及扩展匹配 https://adwords.google.com/select/KeywordSandbox
百度关键字工具:
查询特定关键词的常见查询、扩展匹配及查询热度 http://www2.baidu.com/inquire/dsquery.php
搜狐关键字工具:
关键字搜索热度 asp">http://db.sohu.com/regurl/pv_price/query_consumer.asp
网易关键字工具:
关键字搜索热度 http://adpsearch.163.com/find_price.php Overture
关键字使用频率工具(英文):
特定关键词的常见查询及被查询次数 http://inventory.overture.com/d/searchinventory/suggestion
关键字密度检查(英文):
频繁出现的关键词及其密度 asp">www.seotoolkit.co.uk/keyword_density_analyser.asp
蜘蛛程序模拟器:
模拟蜘蛛可抓取到的文本及链接
www.webconfs.com/search-engine-spider-simulator.php
asp">www.spannerworks.com/seotoolkit/spider_viewer.asp
URL检测工具:
检测网站URL结构、无效链接等 下载地址: www.wuyue.cn/soft/XENU.ZIP http://validator.w3.org/checklink
相似页面检测器:
对比两个页面间的相似度,来判断是否有受到惩罚的危险 www.webconfs.com/similar-page-checker.php
链接广度检测工具:
www.sowang.com/so/ (综合查询:含链接广度、PR、ALEXA排名)
www.marketleap.com/publinkpop(可同时与多个竞争对手网站进行比较)
www.uptimebot.com(同时检测10个搜索引擎的收录情况)
asp">www.seotoolkit.co.uk/link_popularity_checker.asp
www.123promotion.co.uk/directory/index.php(检查网站是否登录多个重要分类目录)
SEO效果检测工具:http://www.jingzhengli.com/
排名监测工具:
网站以某一关键词在搜索引擎中的排名。
www.cleverstat.com/Google-monitor.htm(查Google排名
www.trafficzap.com/keyrank.php (查Google、Yahoo排名)
(注:由于排名检测占用了本来可以用来响应用户请求的服务器资源,违反了Google服务条款。因此Google强烈要求不要使用排名检查工具。)
查看网页级别:
Google工具栏下载:http://toolbar.google.com (PageRank值)
www.trafficzap.com/pagerank.php (PageRank值)
www.seochat.com/seo-tools/future-pagerank(查看PR值是否处于更新期间)
www.digitalpoint.com/tools/webrank (Yahoo的WebRank值)
查看ALEXA网站访问量全球排名:
ALEXA 工具栏下载:http://download.alexa.com/index.cgi?p=Dest_W_b_40_T1www.trafficzap.com/sitepopularity.php
第九部分:选择正规SEO服务商
为了在短期内把客户网站排名"做上去"从而收费,一些低质SEO服务商们不惜采用种种危险的作弊手段,并制造出大量的垃圾链接
和垃圾结果,不仅败坏了正规SEO的行业名声,也搅乱了整个市场。对此,Google特在网站向网站管理员提供的信息中,针对选择"搜索引擎优化服务商"有如下告诫:
您可以通过某些迹象来判断是否正在与不道德的 SEO 打交道。下面所列出的只是其中很少的一部分,因此,只要有任何疑虑,您都应当相信您的直觉。 如果 SEO 具有以下行为,一定要想尽办法果断摆脱它:
◆ 拥有影子域名(即域名重定向)
◆ 在桥页上放置指向其他客户的链接
◆ 出售在地址栏中输入关键字的功能
◆ 对实际搜索结果和搜索结果中的广告不加区分
◆ 保证排名,但只依靠随意可得的晦涩冗长的关键字词组
◆ 使用多个别名或伪造的WHOIS 信息(域名注册信息)
◆ 从"虚假的"搜索引擎、间谍软件 (spyware) 或变脸软件 (scumware) 获取点击量
◆ 自身的域名或者所拥有的域名已从 Google 索引中删除,或者在 Google 的索引中没有被列出。(原文见Google官方网站:www.google.com/intl/zh-CN/webmasters/seo.html)
结束语
无论如何,不要作弊!