PR值算法原理总体上基于下面2个前提:
1、一个网页被多次引用,则它可能是很重要的;
一个网页虽然没有被多次引用,但是被重要的网页引用,则它也可能是很重要的;一个网页的重要性被平均的传递到它所引用的网页。这种重要的网页称为权威(Authoritive)网页。
2、假定用户一开始随机的访问网页集合中的一个网页,然后跟随网页的链接向前浏览网页,不回退浏览,那么浏览下一个网页的概率就是被浏览网页的PageRank值
影响PR值的因素
PR值体现为从0到10的11个数值,在Google的工具栏上以一条横向绿色柱状图显示,0级情况下呈白色。它是针对网页而不是网站,因此一个网站的首页和内页往往有着迥然不同的PR值。由于Google市场拓展进程的原因,中文网页的PR值整体上低于英文网页。对中文网站来说,拥有3级PR是基础, 4级PR算达标,5级PR可谓良好,而6、7级PR就算相当优秀的网站。当然,由于PR最直接的影响因素是来自链接,因此这种评级并不代表内容的级别水准,网站内容质量对PR的影响是间接的、长期的。根据PR值的算法原理,可知影响一个网站(首页)PR值的因素主要包括:
1、网站的导入链接质量:
根据前文对高质量导入链接的分析,则获得高PR值需要获得来自以下网站的链接:
◆ 加入搜索引擎分类目录与已经加入目录的网站交换链接
◆ 获得来自PR值不低于4并与你的主题相关或互补的网站的链接
◆ 你的链接出现在流量大、知名度高、频繁更新的重要网站上(如新闻源)
◆ 与你交换链接的网站具有很少导出链接
◆ 与内容质量高的网站链接(PR值上升潜力大)
2、 导出链接数量:
根据PR计算原理,由于"一个网页的重要性被平均的传递到它所引用的网页",因此反过来看,一个页面内过多的导出链接将潜在引起该页PR值的流失。但从内容的角度看,适当数量的与主题有关联的导出链接给搜索引擎带来良好的印象。因此,一个页面,尤其是首页的导出链接数量的把握,应该兼顾到PR值和关键词内容二者之间的平衡,即控制导出链接数量,以不超过10个为宜。
3、搜索引擎收录一个网站的页面数量
在探讨SEO的时候,人们过多关注核心关键词排名以及首页的表现情况,却往往忽略了一个极其重要的问题:即搜索引擎对一个网站收录的页面数量。后者在SEO中也有着极其重要的意义。一个用核心关键词查询排名不佳的网站,可能由于被抓取大量网页而在用户使用其它关键词查询时,内页获得前三甲排名。由于用户搜索时使用的关键词具有分散性,使得这种情况往往给网站带来极大访问量。
正因为收录页面的数量直接影响访问量,因此对PR值的影响也是很大的。被收录页面越多,主页PR越高。不过需要强调的是,此处所指的数量是指被收录数与网站页面总数的比值,而不是收录页面的绝对数值。比如一个拥有50个页面的网站被收录了10个页面,网站的被收录比值是1/5,一个拥有5000个页面的网站被收录了500个页面,比值是1/10,结果是收录10个页面比收录500个页面的网站还更具排名优势。但对各个搜索引擎来说,究竟达到多大的比值算是良好,目前还没有相关的数据。
附:查询网站收录页面数量:在搜索引擎中输入:site:www.kuziyuan.com(如果输入:site:admin5.com,则获得的是在admin5.com域名下所有二级域名的网页数量)。
第一部分:域名和主机对SEO的影响
域名与主机是网站的基础,商业网站选择域名与主机尤其应注重形象和质量,为网络营销开展打好坚实基础。同时,选择好域名与主机也是搜索引擎优化开始的第一步。
域名选择与SEO
域名与IP:每一个网站的域名对应一个IP地址,IP 地址是在网络上分配给每台计算机或网络设备的数字标识。域名必须经过域名服务器(DNS)进行解析,转换成数字IP,才能让计算机理解辨认,如:219.136.248.149 大部分中小企业网站都存放在由一台服务器划分出来的若干虚拟主机上,由多个网站共享一台服务器和IP地址,一些WEB服务器中有成百上千个域名共享一个IP地址的情况。这样对站长来说成本较低,但对网站的搜索引擎排名带来以下潜在风险:
1、共享主机的其他网站如果被搜索引擎惩罚,将或多或少波及你的网站。如果同一IP下有一个网站,那么我们的搜索引擎会对该IP下的所有网站进行惩罚。不过幸运的是,大部分搜索引擎不会如此武断,如Google,一般是不会进行这种连带性惩罚的。
2、如果搜索引擎对有些Spammer服务器进行了惩罚,其IP被认为是Spam,则连带该IP下的所有网站都会受到牵连,使这些网站的排名下降或在搜索引擎中被清除。
工具推荐:
查域名IP:http://www.123cha.com/ip
查关键词:http://key.admin5.com
IP反查:http://www.whois.sc/members/reverse-ip.html (查看某IP地址下共享哪些域名。免费注册)
二级域名(次域名):
二级域名形式如:yourname.vv11.com,而不是www.vv11.com
拥有自己的独立域名是网站对搜索引擎友好的基础。目前有很多网站提供免费空间,如博客(Blog)免费空间, 企业免费空间, 免费自助建站,电子商务平台等,通常为用户分配一个二级域名,或页面存放于网站的某一路径下。这都极不利于搜索引擎重视你的网站,二级域名除了用户访问不方便以外,还主要有以下弊端:
1、如果你所使用二级域名的主域名受到惩罚,那么你的网站也会受到牵连;
2、很多搜索引擎会规定每个域名下的收录数(如:www.vv11.com、english.vv11.com与bbs.vv11.com),如果www.vv11.com这一域名的收录数上限是30,而你的网站是第31个,则你的网站被搜索引擎收录的机会就会少至又少了;
3、当域名供应商停止营业,那么你辛苦经营的网站也随着你域名的失去而付诸东流;
4.网站流量排名的时候,你所有的流量都会归功于所依托的顶级域名。
最好为自己的二级域名网站注册一个独立域名,然后做域名转发(免费),目前很多拍卖网的店铺都适合采用此种方法,对顾客访问和网站管理很有用。
域名中的字符:取域名的原则除了方便用户访问之外,对搜索引擎而言,涉及到域名中是否包含关键词的问题。英文网页内容的网站如果在域名中含有关键字,或以复合关键字作域名,都应该用短横线隔开。如:www.made-in-china.com 而不是 www.madeinchina.com。这是因为搜索引擎通常会把分隔符"-"当作一个空格来看待,因而能够识别出你的关键词,为网站排名加分(尽管影响不是很大)。短横线隔开后的关键词组还可以获得更多的词组搜索结果,如www.madeinchina.com被认为只有一个词madeinchina,而made-in-china则被看作正常的made in China词组。
有些搜索引擎目录对网站在分类目录中的排名顺序是根据域名或网站title名称的数字顺序或字母顺序甚至中文笔画,总体上数字又比字母靠前。Yahoo!中国称,"在同一类目中,网站是按照拼音顺序来排列的"。
google则根据其独创的"网页级别"技术"分辨出常用的重要网站,排放在目录的前面以提升网页搜索的效率"。此外,域名的后缀选择也有一定讲究。有一种观点认为:在同等情况下,代表非商业性网站的后缀.org和.net有着比.com更高的排名优势;对中文网站来说,表示中国域的.cn和.com.cn又比无地区性的.com有一定优势。
主机选择与SEO
主机服务商选择:
主机对网站的搜索引擎排名影响很大。在寻找主机提供商的时候,千万不要只考虑价格因素。如果你多次向Google提交网站,但Google却一直没有对其进行索引,则有可能是网站所在的服务器出了问题。因此选择服务器时要特别注意以下几点:
1、避免使用免费主机
由于免费主机里面经常会出现Spammers、镜像网站、桥页等"搜索引擎垃圾",很多搜索引擎都不愿意索引免费主机上的网站;同时搜索引擎目录如Yahoo也很难收录来自免费主机的商业站点。此外,免费主机的服务很难保证,常常服务器超载,速度奇慢,宕机频繁,甚至关闭服务,这都会直接影响网站排名。
2、选择有信誉的主机提供商
搜索引擎的索引程序定期或不定期地来访问收录的网站。对经常更新的网站,Google的Googlebot漫游器——俗称"蜘蛛",一般每天都会小幅度地"爬"一下,一个月进行一次大的索引。如果蜘蛛在索引时出现网页打不开或下载速度缓慢,则放弃索引。所以你的网站在任何时候都要正常工作,以博取蜘蛛的欢心。这就要求网站存放的主机系统提供快速、稳定、安全的服务,最好有24小时客服支持和维护,保证你的网站 快速、可靠、稳定地运行。
主机转移:
如果你想转移网站的主机服务,要在取消原来的服务提供商之前,先找好新的供应商。先在新的服务商处开个帐号,确保所有的文件都正确无误地传到新服务器上。网站在新服务器上运行无碍后再联系你的原供应商,告知对方将终止合作,但确保他们不会马上关你的网站。再联系你的域名注册商(可能是原主机提供商),变更域名服务器(DNS)。域名服务器的功能就是把你的域名解析成计算机能够识别的IP地址。把旧的域名服务器改成新的,这个过程到生效时间大概24-48小时之内,少数情况下可能要72小时。这期间,如果一个搜索引擎刚好来抓你的网页,要么抓到旧的IP地址上的网站,要么抓到新的域名解析生效后的网站,总之都不会出现网站打不开的空档。
第二部分:搜索引擎优化的核心:关键字策略
根据潜在客户或目标用户在搜索引擎中找到你的网站时输入的语句,产生了关键字 (Keywords)的概念,这不仅是搜索引擎优化的核心,也是整个搜索引擎营销都必须围绕的核心
关键字的选择
首先确定你的核心关键字,再围绕核心关键字进行排列组合产生关键词组或短句。对企业、商家而言,核心关键字就是他们的经营范围,如产品/服务名称、行业定位,以及企业名称或品牌名称等。总结起来,选择关键字有以下技巧:
1、站在客户的角度考虑潜在客户在搜索你的产品时将使用什么关键词?
这可以从众多资源中获得反馈,包括从你的客户、供应商、品牌经理和销售人员那里获知其想法。
2、将关键词扩展成一系列词组/短语毋用单一词汇,而是在单一词汇基础上进行扩展
如:设计→网站设计→深圳网站设计。英文关键词可以采用搜索引擎overture的著名工具Keyword Suggestion Tool对这些关键词组进行检测,可查看你的关键词在过去24小时内被搜索的频率,最好的关键词是那些没有被广泛滥用而又很多人搜索的词。中文工具可以通过百度的"相关搜索"和Google提供的KeywordSandbox工具进行关键词匹配和扩展。
工具推荐:
Google AdWords关键字工具:查询特定关键词的常见查询及扩展匹配 https://adwords.google.com/select/KeywordSandbox
百度关键字工具:查询特定关键词的常见查询、扩展匹配及查询热度 http://www2.baidu.com/inquire/dsquery.php
百度 yahoo google 关键词指数查新 http://key.admin5.com
3、进行多重排列组合改变短语中的词序以创建不同的词语组合
使用不常用的组合,组合成一个问句。包含同义词、替换词、比喻词和常见错拼词。包含所卖产品的商标名和品名。使用其它限定词来创建更多的两字组合,三字、四字组合。
4、毋用意义太泛的关键字
如果你从事包装机械制造,则选择"机械"作为你的核心关键字就无益于吸引到目标客户。实际上,为了准确找到需要的信息,搜索用户倾向使用具体词汇及组合寻找信息(尤其是二词组合),而不是使用那些大而泛的概念。此外,使用意义太广的关键字,也意味着你的网站要跟更多的网站竞争排名,难以胜出。
5、用自己的品牌做关键词
如果是知名企业,则别忘了在关键词中使用你的公司名或产品品牌名称。
6、使用地理位置地理位置对于服务于地方性的企业尤其重要。如果你的业务范围以本地为主,则在关键词组合中加上地区名称如"深圳网站建设"。
7、回顾竞争者使用的关键词
查寻竞争者的关键词可让你想到一些你可能漏掉的词组。但不要照抄任何人的关键词,因为你并不清楚他们如何要使用这些关键词——你得自己想关键词。寻找别人的关键词只是对你已经选好的关键词进行补充。
8、不用与自己无关的关键字
总是会有人将热门的词汇列入自己的META关键字中——尽管这个热门关键字跟自己网站内容毫不相干。甚至有人把竞争对手的品牌也加入到自己的关键字中,这不仅侵权,可能被起诉(国外多起类似案例),并且由于这些所谓"热门"词汇并未在网站内容中出现,因此对排名并无实质帮助,过多的虚假关键词还可能受到处罚降低排名。
9、控制关键词数量
一页中的关键词最多不要超过3个为佳,然后所有内容都针对这几个核心关键词展开,才能保证关键词密度合理。搜索引擎也会认为该页主题明确。如果确实有大量关键词需要呈现,可以分散写在其它页面并针对性优化,让这些页面也具有"门页(entry)"的效果。这也是为什么首页和内页的关键词往往要有所区分的原因。最典型的情况是拥有不同的产品和服务的情况下,对每个产品进行单网页优化,而不是罗列在一个首页上。
附:查看竞争对手关键词的方法:在浏览器中打开目标网页→点击"查看"→点击"源文件"→"<meta name="keywords" content="后面的文字即该网站关键词
关键字密度
在确定了自己的关键字之后,需要在网页文本中适当出现这些关键字。关键字在网页中出现的频次,即关键字密度 (Keyword Density) ,就是在一个页面中,占所有该页面中总的文字的比例,该指标对搜索引擎的优化起到重要作用。关键字密度一般在 1% 到 7% 较为合适,超过这一标准就有过高或过低之嫌。
切记避免进行关键字堆砌,即一页中关键字的出现不是根据内容的需要而安排,而是为了讨好搜索引擎人为堆积关键字(Stuffing)。这已经被搜索引擎归入恶意行为(Spamming), 有遭到惩罚的危险。
工具推荐:
关键词密度检查(英文):频繁出现的关键词及其密度 asp">www.seotoolkit.co.uk/keyword_density_analyser.asp
关键字分布
关键字的分布原则堪称:无所不在,有所侧重。
1、网页代码中的Title,META标签(关键字keywords和描述description)
如:e书www.ebook.com的代码:
<title>e书——电子书公益下载中心</title>
<meta http-equiv="title" content="e书——电子书公益下载中心">
<meta name="classification" content="arts and literature">
<meta name="description" content="电子书下载,公益,电子图书下载,电子书籍,任你一览无余。">
<meta name="keywords" content="电子书,电子图书,公益,电子书籍,书库,图书,书,书籍,电子书下载,免费电子书">
2、网页正文最吸引注意力的地方
正文内容必须适当出现关键词,并且"有所侧重",意指用户阅读习惯形成的阅读优先位置——从上到下,从左至右——成为关键词重点分布位置,包括:页面靠顶部、左侧、标题、正文前200字以内。在这些地方出现关键词对排名更有帮助。如把一段富含关键词的文本网站介绍置于网站最顶部(这个地方通常被安排用来放banner广告的)。这样做的好处是让用户和蜘蛛都以最快速度了解该网站内容,并且以蜘蛛重视的<b>黑体显示,对其排名作用很大。代码显示如下:
<b><font color=#999999>本站是一个非商业性的网站,旨在为广大的搜索引擎研究者提供一个学习、交流场所。在这里你可以找到很多有关于搜索引擎优化资料(seo资料,文章)、网站优化资料。这些资料可以帮助你将你的网站进行适当的优化以迎合多个搜索引擎的搜索规则,从而得到较好的排名。</font></b>
3、超链接文本(锚文本)
除了在导航、网站地图、锚文本中有意识使用关键字,还可以人为增加超链接文本。如一个童装厂商网站可以通过加上以下行业资源:中国童装网 织里童装网…… 等含有"童装"文字的链接来达到增加超链接文本的目的。这也值得网站在添加友情链接时做参考,即链接对象中最好包含有你的关键字或相关语义的网站。
4、Header标签
即正文标题<H1><H1/>中的文字。搜索引擎比较重视标题行中的文字。用<b></b>加粗的文字往往也是关键词出现的地方。
5、图片Alt属性
搜索引擎不能抓取图片,因此网页制作时在图片属性Alt中加入关键字是对搜索引擎友好的好办法,它会认为该图片内容与你的关键字一致,从而有利于排名。 英文网页内容的网站在进行域名选择和网页文件夹命名时,也可以考虑包含关键字(对关键词组则要用短横线隔开),如www.made-in-china.com。不过对Google排名作用非常微小。
第三部分:对搜索引擎友好的网页设计制作
一般的网页设计都由网页设计师完成。设计师设计网站往往仅从美观、创意和易用的角度考虑,这对于一个期望获得搜索引擎排名优秀的商业网站来说,已经远远不够了,网站策划人员至少应该为设计师递交一份需求备忘录,提醒在设计中需要配合和注意的环节。
目录结构和URL
URL是统一资源定位,即每个网页的网址、路径。网站文件的目录结构直接体现于URL。清晰简短的目录结构和规范的命名不仅有利于用户体验和网址传播,更是搜索引擎友好的体现。
目录层次:
对于一个小型网站来说,一般只有一层子目录,如下:
http://www.vv11.com/dir1/page.htm
www.vv11.com是域名,dir1是一级目录名,page是文件名。
对搜索引擎而言,这种单一的目录结构最为理想,即扁平结构(Flat)。
而对规模大一些的网站,往往需要二到三层子目录。象这样:
http://www.vv11.com/dir1/dir2/dir3/page.htm
搜索引擎还是会去抓取二到三层子目录下的文件,但最好不要超过3层,如果超过4层,象以下这个页面,搜索引擎就很难去搜索它了:http://www.vv11.com/dir1/dir2/dir3/dir4/page.htm
当然,以下情况下,即使深入第四层甚至更深层次的页面,也同样能被搜索到:
1、如果该页提供了重要内容,有大量来自其它网站的外部链接(Inbound Links);
2、如果在首页上增加一个该页的链接,可以通过首页直接到达,搜索Spider还是可以轻易地找到它;
3、如果有其它网站在顶级页面上链接了该页,其效果就好似你在自己的首页上做了该链接。
此外,图形、脚本、CGI-BIN和CSS样式表则各自建立专门的目录收入其中,一般不放在根目录下。
目录和文件命名:
根据关键字无所不在的原则,可以在目录名称和文件名称中使用到关键词。但如果是关键词组,则需要用分隔符分开。我们常用连字符"-"和下划线"_"进行分隔,URL中还经常出现空格码"%20"。因此,如果以"中国制造"作文件名,就可能出现以下三种分隔形式:
made-in-china.htm
made_in_china.htm
made%20in%20china.htm
但事实上,至少在目前Google并不认同"_"为分隔符。对Google来说, made-in-china和made%20in%20china都等于made in china,但made_in_china就被读成了madeinchina,连在一起之后,关键词就失去了意义。
因此,目录和文件名称如果有关键词组,要用连字符"-"而不是下划线"_"进行分隔。
URL应该越短越好。有人为了单纯增加关键字而额外建多一个带有关键字的子目录,改变目录结构。由于URL中含有关键字本身对排名提高帮助并不大,因而这种做法多此一举,也是搜索引擎反感的。
绝对URL和相对URL:
绝对URL:即网页路径使用包含顶级域名在内的完整的URL。
如:www.vv11.com/page1/index.html是一个绝对路径,其中/page1/index.html则为相对路径,由浏览器自动在该链接前加上www.vv11.com。
总体上,Google在排名时并不在意URL使用的是相对路径还是绝对路径。 动态URL: 目前很多网站都有数据库驱动生成的URL,即动态URL,往往表现为在URL中出现"?"、"="、"%",以及"&"、"$"等字符。动态URL极不利于搜索引擎抓取网页,严重影响网站排名,通常是通过技术解决方案将动态URL转化成静态的URL形式,如:
将http://www.vv11.com/messages.php?id=2&type=5 转化为http://www.vv11.com/messages/2/5/ 下文将会专门提到动态URL的解决方案。
导航结构
网站导航是对引导用户访问网站的的栏目、菜单、在线帮助、布局结构等形式的统称。其主要功能在于引导用户方便地访问网站内容,是评价网站专业度、可用度的重要指标。同时对搜索引擎也产生诸多提示作用。概括地讲,网站在导航方面应注意以下几点:
1、主导航醒目清晰
主导航一般体现为一级目录,通过它们用户和蜘蛛程序都可以层层深入访问到网站所有重要内容。因此主栏目必须在网站首页第一屏的醒目位置体现,并最好采用文本链接而不是图片。
2、"面包屑型(Breadcrumbs)"路径
所谓"面包屑"是比喻用户通过主导航到目标网页的访问过程中的路径提示,使用户了解所处网站中的位置而不至于迷失"方向",并方便回到上级页面和起点。路径中的每个栏目最好添加链接。
如下: 网信设计: 网信日志 > 技术资讯 > 网络营销
即使没有详细的路径来源,也至少应该在每个子页面提示回首页的链接,包括页面的LOGO作链接。
3、首页突出重要内容
除了主栏目,还应该将次级目录中的重要内容以链接的方式在首页或其它子页中多次呈现,以突出重点。搜索引擎会对这种一站内多次出现的链接给予充分重视,对网页级别(PageRank)提高有很大帮助,这也是每个网站首页的网页级别一般高于其它页面级别的重要因素,因为每个子页都对首页进行了链接。
4、使用网站地图
网站地图(Site Map)是辅助导航的手段,最初是为用户设计,以方便用户快捷到达目标页。良好的网站地图设计常常以网站拓扑结构体现复杂的目录关系,具有静态、直观、扁平、简单的特点。多采用文本链接,不用或少用修饰性图片,以加快页面加载速度。以上特点符合搜索引擎友好的要求,因此网站地图在SEO中也有重要的意义。尤其对于那些采用图片导航和动态技术生成的网页,通过在网站地图中进行文本链接,可在一定程度上弥补蜘蛛程序无法识别图片和动态网页造成的页面不可见的风险。
需要注意,网站地图也要突出重点,尽量给出主干性内容及链接,而不是所有细枝末节。一页内不适宜放太多链接。Google明确提出"如果网站地图上的链接超过大约 100 个,则最好将网站地图拆成多个网页"。
工具推荐:
Xenu:http://home.snafu.de/tilman/xenulink.html 生成网站地图
框架结构
框架结构,即帧结构(Frame)网页表现为一个页面内的某一块保持固定,其它部分信息可以通过滚动条上下或左右移动显示,如左边菜单固定,正文信息可移动,或者顶部导航和LOGO部分保持固定,其它部分上下或左右移动。我们的邮箱通常都采用框架建构。框架型网页的另一个表现是,深层页面的域名通常不会在URL中体现出来,即使进入深层子页面,浏览器显示出来的URL仍然是主页的URL。
框架型网站的优越性体现在页面的整体一致性和更新方便上。尤其对于那些大型网站而言,框架结构的使用可以使网站的维护变得相对容易。但框架对搜索引擎来说是一个很大的问题,这是由于大多数搜索引擎都无法识别框架,也没有什么兴趣去抓取框架中的内容。此外,某些浏览器也不支持框架页面。
如果网页已经使用了框架,或出于某种原因一定要使用框架结构,则必须在代码中使用"Noframes"标签进行优化,把Noframe标签看做是一个普通文本内容的主页。在<Noframe></Noframe>区域中包含指向frame页的链接以及带有关键词的描述文本,同时在框架以外的区域也出现关键词文本。这样,搜索引擎才能够正确索引到框架内的信息。
还有一个办法是采用iframe即内联框架(Inner Frame)技术来避免Frame带来的不便。所谓iframe也是框架的一种形式,它是相当于在主浏览器窗口中内嵌一个子窗口,内容自动打开。iframe可以嵌在网页中的任意部分,也可以随意定义其大小,其代码显示为:
<iframe src=xx width=x height=x scrolling=xx frameborder=x></iframe>"
对搜索引擎来说,iframe中的文字是可见的,也可以跟踪到其中链接指向的页面,不过与用户所见不同的是,搜索引擎将iframe内容看成单独的一个页面内容,与被内嵌的页面无关。
图像优化
一般而言,搜索引擎只识读文本内容,对图像是不可见的。同时,图像文件直接延缓页面加载时间,如果超过20秒网站还不能加载,用户和搜索引擎极有可能离开你的网站。因此,除非你的网站内容是图片为主,比如游戏站点或者图片至关重要,否则尽量避免使用大图片,更不要采用纯图像制作网页(SPLASH PAGE)。
网站图片优化的核心有两点:增加搜索引擎可见的文本描述,以及在保持图像质量的情况下尽量压缩图像的文件大小。
Alt属性:
每个图像<IMG>标签中都有ALT属性,搜索引擎会读取该属性以了解图像的信息。因此,最好在所有插图的ALT属性中都有文字描述,并带上该页关键字在其中。
如:www.vv11.com的主页LOGO部分代码为:
<img src="/article/UploadPic/2007-3/200739223415731.gif" alt="深圳市网信设计工作室" width="200" height="70" border="0">
文本说明:
除了ALT属性文字,还可以考虑以下方法直接优化图像,使之被搜索到:
1、在图片上方或下方加上包含关键词的描述文本;
2、在代码中增加一个包含关键词段的heading标题标签,然后在图片下方增加文字描述。
3、在图片下方或旁边增加如"更多某某"链接,包含关键词。
4、创建一些既吸引用户又吸引搜索引擎的文本内页,先把流量吸引到这些页面,再提供文本链接指向你的图片页面。
总体上,网页应尽量减少装饰性图片以及大图片。而Alt属性中的文字对搜索引擎来说,其重要性比正文内容的文字要低。
Gif和JPGE图像优化:
Alt属性和文本说明都只是对图像之外的文本环境进行优化,下面简单谈谈对图片本身的优化处理。对图片文件优化的目的是在尽量不影响图像画面效果的情况下,将其文件大小降到最低,以加快页面整体下载速度。
网页图片格式主要有GIF和JPGE两种形式。一般来讲,GIF适用于线图和企业标识;JPEG适宜照片元素的格式。主要通过减少GIF颜色数量、缩小图片尺寸和降低分辩率来缩小文件,也可以采用层叠样式表达到优化的目的。PhotoShop的版本越高越适用于网络图形。此外,将大图片切割成若干小图片于不同的表格区间内进行拼接,也可以相对加快下载时间。
工具推荐(英文):
www.xat.com/internet_technology/download.html (图片优化工具)
FLASH优化
FLASH优化:
由于FLASH优美的视觉效果和广阔的创意空间,FLASH技术在网页设计和网络广告中的应用非常广泛,很多网站首页甚至全部用FLASH设计。但FLASH网页有一个非常致命的问题,即大部分搜索引擎无法识别FLASH中的信息。Google也只能检索到部分Flash文件中的内嵌链接。
以下列举一个制造机电设备的企业网站首页的代码,用FLASH制作,请注意是否可以看见有意义的文本:
<html>
<head>
<title>欢迎光临!/title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<style type="text/css">
<!-- body {
margin-left: 0px;
margin-top: 0px;
margin-right: 0px;
margin-bottom: 0px;
} -->
</style>
<link rel="stylesheet" href="style.txt" type="text/css">
</head>
<body bgcolor="#FFFFFF" text="#000000">
<table border="0" width="100%" height="100%" cellspacing="0" cellpadding="0">
<tr>
<td width="100%" background="images/bg.jpg"><div align="center">
<center>
<table width="777" border="0" align="center" cellpadding="0" cellspacing="0">
<tr>
<td><object classid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,29,0" width="777" height="455">
<param name="movie" value="/article/UploadPic/2007-3/200739223415598.swf">
<param name="quality" value="high">
<embed src="/article/UploadPic/2007-3/200739223415598.swf" quality="high" pluginspage="http://www.macromedia.com/go/getflashplayer" type="application/x-shockwave-flash" width="777" height="455"></embed>
</object></td>
</tr>
</table>
<br><span class="style2">本页使用FLASH技术,如果无法正常浏览请下载并<a href="http://www.macromedia.com/shockwave/download/triggerpages/flash.html">安装插件</a>或<a href="asp-bin/big5/?page=1">直接进入</a><br> if you are not able to view the animated <a href="http://www.macromedia.com/shockwave/download/triggerpages/flash.html">pleass install plug-in </a> first <br><!--网站计数器开始-->
同时再采用模拟蜘蛛程序的工具,测试到搜索引擎对该页抓取结果如下:
Spidered Text (蜘蛛可识别的文本):
Welcome 本页使用FLASH技术,如果无法正常浏览请下载并 安装插件 或 直接进入 if you are not able to view the animated pleass install plug-in first
Spidered Links(蜘蛛可识别的链接):
http://www.macromedia.com/shockwave/download/triggerpages/flash.html
asp-bin/big5/?page=1 (下载FLASH插件的链接地址)
http://www.macromedia.com/shockwave/download/triggerpages/flash.html
因此可以得出结论是:
蜘蛛程序没有在这个企业网站首页获得任何有意义的文本内容,也没有获得该Flash首页中进入"中文版""英文版"关键性内容的链接。
FLASH优化可以从以下三个方面来考虑:
1、做一个辅助HTML版本: 保留原有FLASH版本的同时,还可以设计一个HTML格式的版本,这样既可以保持动态美观效果,也可以让搜索引擎通过HTML版本的网页来发现网站。
2、将Flash内嵌HTML文件: 还可以通过改变网页结构进行弥补,即不要将整个网页都设计成Flash动画,而是将Flash内容嵌入到HTML文件中,这样对于用户浏览并不会削弱视觉效果,搜索引擎也可以从HTML代码中发现一些必要的信息,尤其是进入内容页面的链接。 即使首页全部动用了FLASH,也应该将进入内页的关键性按钮/链接置于FLASH文件之外,以独立纯文本链接的方式呈现。上文案例将"中文版"链接置于FLASH文件中,使得蜘蛛程序一无所获,无法抓取到内页信息。
3、付费登录搜索引擎: 如果FLASH网站错过了被免费的技术型搜索引擎自动检索的机会,或者搜索结果排名效果不太理想,可以通过付费登录或做搜索引擎关键词广告,同样被用户搜索到。
总体上,商业网站应尽量少用FLASH,站点间进行广告交换时也要避免采用FLASH广告为上策。
表格使用
表格是网页最重要的排版方式。如果某个网页采用了大段的长篇文本,除了可以将一页文本分成多面,还可以考虑将文本置入不同表格中,这样不仅管理方便,也使得该页加载时每个表格内容依次加载,这样访问者就可以一边看已下载内容一边等待剩余部分加载,而不是等待很久之后才一齐加载出来。
表格之内套嵌太多表格也不利于页面加载,因浏览器是先加载完大表格之后再加载内嵌的小表格,因此内嵌表格会最终降低整页加载速度。
网页减肥
代码设置不妥不仅延长网页加载时间,也严重影响蜘蛛程序对网页内容的抓取。通过对网页代码进行清减(俗称"网页减肥"),去掉臃肿杂乱的代码,减小网页文件大小,能够加快网页加载速度,让蜘蛛快速索引到重要内容。正常情况下一个页面的文件大小在15K左右,最好不要超过50K。网页减肥重点涉及以下几个要点:
CSS样式
网页制作应通过CSS(层叠样式表单)来统一定制字体风格,以使代码标准化,避免大量的字体和格式化标签如< h1 >< /h1 >、< font size=×× color=×× >< /font >充斥页面。通过css可以控制任何HTML标签的风格。例如<td>, <p>, <body>, <table>, <tr>, <th>等。只要在HTML的<head>区内的<style type="text/css">和</style>之间指定对应标签的风格如字体,颜色,大小即可,例如:
<style type="text/css">
<!--
h2 { font-family: "宋体"; font-size: 12pt; color: #333366; background-color: #FFCCCC; font-weight: bold }
h1 { font-family: "Arial"; font-size: 12pt; color: #993300 } -->
</style>
仅通过以上设置,就把文字的字体、字号、颜色、背景色等统一起来,不用对每段文字单独进行格式定义,从而减少大量重复性标签。注意把所有css文件单独存放在命名为css的外部文件中。通过设置CSS样式,也可以提升导航文本的美观度,达到与图片导航同样优美观的效果,这点尤其提醒网页设计师注意,没有必要将导航条用图片呈现。
Javascript:
正常情况下,网页尽量以<HTML>作为代码的开始端。但采用Javascript技术的网页往往在页面一开始就堆积大量JAVA代码,以至META及关键字迟迟不能出现,被推至页面底部,对搜索引擎很不友好。有两种方法可以使之得以改善:
1、将脚本移至页面底部
大部分的JAVA代码都可以移到页面结束标签之上,而不影响网站功能。这样就能一开始突出关键词,并加快页面加载时间。
2、将JAVA脚本置入一个 .js扩展名的文件。
包含你的Javascript的.js文件通常在网站访问者的浏览器中被缓存下来,使得下次访问速度加快,也使得网站修改和维护起来更加方便。例:一段JAVA代码正常情况下显示如下:
<script language=Javascript>
<!-- 此处是你的代码,将它们拷贝到一个.js文件 //-->
</script>
忽略开始及结束标签,将中间的代码单独保存为扩展名为.js的文件,如文件名为"mycode.js"的一个文件,然后将此文件上传到服务器上与该页同样的目录下。最后将上文列举的完整的Javascript置换为简单的一行:
<script language=Javascript src=mycode.js></script>
这样,一个"mycode.js"文件就将大段冗长复杂的JAVA代码置换了。
工具推荐:
网页减肥工具:http://www.7733.com/softdown/softdoc/net_opt.htm 去除网页中多余代码,减小网页
第四部分:SEO指导下的技术支持
对搜索引擎最友好(Search Engine Friendly)的网页是静态网页,但大部分内容丰富或互动型网站都不可避免采用到相关技术语言来实现内容管理和交互功能。SEO思想指导下的技术支持,主要是对特定代码的优化和对动态网页进行静态处理的措施。
Title标签和Meta标签
以.html或.htm为扩展名的HTML文档称为静态网页。Meta称为元标志,用于网页的<head>与</head>中。Meta 标签的用处很多,目前几乎所有的搜索引擎机器人都通过自动查找Meta值来给网页分类,是籍此判断网页内容的基础。其中最重要的是description(网站描述)和keywords(网站关键词)。另外一个基本的属性是Title标签,提示搜索引擎关于本页的主题。Meta和Title的形式在html语言中体现为:
<head>
<title>title标题</title>
<meta name="keywords" content="网页描述">
<meta name="description" content="关键词">
......
</head>
尽管Meta本身不足以解决排名问题,但对Meta标签的书写仍然是搜索引擎优化的基础工作。清晰准确的Meta文字与正文内容的关键词相呼应,是排名加分的重要条件之一。
标题(Title):
网页优化可以说是从Title开始的。在搜索结果中,每个抓取内容的第一行显示的文字就是该页的Title,同样在浏览器中打开一个页面,地址栏上方显示的也是该页的Title。因此,Title可谓一个页面的核心。对Title的书写要注意以下问题:
1、title简短精炼,高度概括,含有关键词,而不是只有一个公司名。但关键词不宜过多,不要超过3个词组。企业网站的title通常以公司名+关键词为内容
2、前几个词对搜索引擎最重要,因此关键词位置尽量靠前。
3、最好将title组织成符合语法结构和阅读习惯的短句或短语,避免无意义的词组罗列式title
关键词(Keywords):
Keywords提示搜索引擎:本网站内容围绕这些词汇展开。因此keywords书写的关键是每个词都能在内容中找到相应的匹配才有利于排名。Meta中的关键词书写技巧见前文的"关键词策略"。
描述(Description):
描述部分用简短的句子告诉搜索引擎和访问者关于本网页的主要内容。用该网站的核心关键词搜索后得到的搜索结果中,描述往往显示为标题后的几行描述文字。Description一般被认为重要性在title和keywords之后。描述的书写要注意以下问题:
1、描述中出现关键词,与正文内容相关
2、同样遵循简短原则,字符数含空格在内不要超过200个字符
3、补充在title和keywords中未能充分表述的说明
其它Meta标签:
为了限制搜索引擎对内容的抓取,可以采用以下几个Robots Meta标签:
<meta name="Robots" content="all|none|index|noindex|follow|nofollow">
其中:
all:文件将被检索,且页面上的链接可以被查询;
none:文件将不被检索,且页面上的链接不可以被查询;
index:文件将被检索;
follow:页面上的链接可以被查询;
noindex:文件将不被检索,但页面上的链接可以被查询;
nofollow:文件将不被检索,页面上的链接可以被查询。
但并不是所有的搜索引擎都支持meta中的robots标签,但是所有搜索引擎都支持一个功能更强的robots.txt的文本文件来达到上述功能(关于robots.txt文件应用的介绍,E书专家平文胜曾专门撰文详细解说"robots.txt和Robots META标签")。其它常用meta标签还有:
<META name author> 网站作者
<META name classification> 网站所属目录类别
<META name copyright> 版权声明
<META name generator> 网站用什么软件做的 ……
首页、重要的内页的title和meta标签最好分别书写,针对栏目主题体现不同的内容。
动态网页优化
动态网站是指网站内容的更新和维护是通过一个带有数据库后台的软件,即内容管理系统(CMS)完成。一般采用ASP,PHP,Cold Fusion,CGI等程序动态生成页面。动态页面在网络空间中实际并不存在,它们的大部分内容通常来自与网站相连的数据库,只有接到用户的请求,在变量区中输入一个值以后才会生成。动态网页扩展名显示为.asp、.php、cfm或.cgi,而不是静态网页的.html或者.htm。其URL中通常出现"?"、"="、"%",以及"&"、"$"等符号。网站使用动态技术的好处,除了增加网站交互功能,还具有容易维护和更新的优点,因此为许多大中型网站采用。
但大多数搜索引擎的蜘蛛程序都无法解读符号"?"后的字符。这就意味着动态网页很难被搜索引擎检索到,因而被用户找到的机会也大为降低。因此,建设网站之前首先要端正思想,即能够采用静态表现的网页尽量不要用动态实现,重要的网页用静态表现。同时使用技术将动态网页转化成静态网页形式,使URL中不再包含"?""="等类似的符号。也可以通过对网站进行一些改动,间接增加动态网页的搜索引擎可见度。即坚持"动静结合,以静制动"的原则。
不同技术的解决方案:
针对不同程序开发的动态网页有着相应的解决方案。以下是作者Karen编译的部分内容:
1、CGI/ Perl
如果你在网站中使用的是CGI或者Perl,可用一个脚本拾取环境变量前的所有字符,再将URL中剩余的字符赋值给一个变量。这样,你就可以在URL中使用该变量了。 不过,对于那些内置了部分SSI(Server-Side Include:服务器端嵌入)内容的网页,主要的搜索引擎都能够提供索引支持。那些以.shtml为后缀名的网页也被解析成SSI文件,相当于通常的.html文件。但如果这些网页在其URL中使用的是cgi-bin路径,则仍有可能不被搜索引擎索引。
2、ASP
ASP(Active Server Pages: Web 服务器端动态网页开发技术)被用于基于微软的网络服务器中。使用ASP开发的网页,一般后缀名为.asp。只要避免在URL中使用符号"?",大多数搜索引擎都能够支持用ASP开发的动态网页。
3、Cold Fusion
如果你使用的是Cold Fusion,那么你就需要在你的服务器端重新对其进行配置,使其能够将一个环境变量中的符号"?"用符号"/"代替,并将替换后的数值传给URL。这样一来,最后到达浏览器端的就是一个静态的URL页。当搜索引擎对该转换后的文件进行检索时,它不会遭遇"?",因而可继续对整个动态页的索引,从而使你的动态网页对搜索引擎仍然具有可读性。
4、Apache 服务器
Apache是最流行的HTTP服务器软件之一。它有一个叫做 mod_rewrite的重写模块,即URL重写转向功能。该模块能够使你将包含环境变量的URL转换为能够为搜索引擎支持的URL类型。对于那些发布后无须多少更新的网页内容如新闻,可采用该重写转向功能。
建立静态入口:
在"静动结合,以静制动"的原则指导下,还可以通过对网站做一些修改,尽可能增加动态网页的搜索引擎可见度。如将动态网页编入静态主页或网站地图的一个链接中,以静态目录的方式呈现该动页面。或者为动态页面建立一个专门的静态入口页面(gateway/entry),链接到动态页面,然后将静态入口页面递交给搜索引擎。
对一些重要的、内容相对固定的页面制作为静态网页,如包含有丰富关键词的网站介绍、用户帮助,以及含有重要页面链接的网站地图等。网站首页尽量全部采用静态形式,并将重要动态内容以文本链接方式全部呈现,虽然增加了维护工作量,但从SEO的角度看是值得的。
也可以考虑为你的重要动态内容创建静态的镜象网站。
付费登录搜索引擎:
当然,对于整个网站都采用与数据库相连的内容管理系统(CMS)发布的动态网站而言,提高搜索引擎可见度的最直接办法就是进行付费登录,直接提交动态网页到搜索引擎目录,或做关键字广告,保证网站被搜索引擎收录。
搜索引擎对动态网站支持的改进
搜索引擎一直在提高自己对于动态页面的支持。到目前为止,GOOGLE、HOTBOT和百度等开始尝试抓取动态网站页面(甚至包括URL带 "?"的页面)。但这些搜索引擎抓取动态页面时,为了避免"搜索机器人陷阱"(spider traps,脚本错误,这种错误会让搜索机器人进行无限循环的抓取,无法退出)",都只抓取从静态页面链接过去的动态页面,而从动态页面链出去的动态页面都不再抓取,即不会对动态页面中的链接进行深入访问。
对于直接使用动态的URL地址,请注意:
· 文件URL中不要有Session Id,同时不要用ID作为参数名称(特别是对于GOOGLE);
如:《网络营销基础与实践》一书,在当当网的介绍页面URL地址是:asp?product_id=493698">http://www.dangdang.com/product_detail/product_detail.asp?product_id=493698,该页就无法被读取。
·参数越少越好,尽量不要超过2个;
·尽量不要在URL中使用参数,这样可以增加动态页面被抓取的深度和数量。
附:
Google 向网站管理员提供的信息:www.google.com/webmasters/guidelines.html
百度常见站长问题:http://www.baidu.com/search/guide.html#2
第五部分:搜索引擎优化的重点:链接策略
链接是网站的灵魂。用户通过超级链接获得丰富的网站内容,搜索引擎蜘蛛也是沿着一个网站的页面链接层层跟踪深入,完成对该网站的信息抓取。对搜索引擎尤其是Google来说,决定一个网站排名的关键,是外部有多少高质量的链接指向这个网站。这就是外部链接或反向链接,也称导入链接(Inbound links或backlinks)。而从网站引向其它网站的导出链接以及网站内部页面间的彼此链接也对排名带来或多或少的影响。
搜索引擎分类目录
搜索引擎目录(Directory)即搜索引擎的人工分类目录。今天,登录分类目录是网站建成后非常基础、重要的工作,尤其登录几大主要分类目录,其重要性不在于访问者是否通过目录链接找到你的网站,而主要在于通过这些目录你的网站获得了重要的、高质量的外部链接,这对于你的网站提高排名具有举足轻重的作用。
目前,对于中文网站来说,最重要的分类目录有以下几个:开放式目录ODP,Yahoo!,门户搜索引擎目录搜狐、网易、新浪。可以分为免费登录和付费登录两种情况。无论是免费还是付费,都须通过手工输入登录。
免费登录:
最著名最重要的登录是全球最大的开放式目录库Open Directory Project:www.dmoz.org。
ODP的宗旨是:建立网上最全面最权威的目录,以及建立一个被公众认为高质量的资源库。在这一宗旨下,全球志愿编辑员选择高质量内容的网站核准进入分类目录。
由于Google等重要搜索引擎都采用ODP的数据库,是Google每月一次深度索引的基础,因此向ODP提交网页成为每个网站完成后的首要工作。登录ODP目录是免费的,但要接受较为严格的人工审核和较长时间的等待,并且最后可能网站登录不成功,还要经历反复提交的过程。
由于DMOZ目录在网站排名中举足轻重的作用,使得越来越多良莠不齐的的网站向DMOZ提交或违规提交,而志愿加入的人工编辑队伍中出现以权谋私的现象和素质不高的情况,诸多因素使得现在登陆DMOZ非常困难,没有一个网站敢保证被DMOZ收录。因此,要确保登录成功,唯一的办法是小心谨慎地完全遵守DMOZ登录条款。以下是必须遵守的提交注意事项:
1、确保网站内容是原创而非转载、镜象或复制
如果你的网站内容只是一些会员制产品/服务信息及链接,或是大量拷贝其它站点内容,那么你的网站极有可能被DMOZ拒绝。即使对已经收录的站点,一旦发现它们是镜象、复制或非原创,DMOZ也会将其从目录中剔除。所以务必在网站中加入产品或服务的原创介绍信息。
2、不要采用虚假、和夸张的手段
被搜索机器人反感的做法,同样被目录编辑拒之门外。下文将有专门章节讲到什么是搜索引擎行为。网站说明中任何虚假、夸张的文字都会遭到拒绝。对违法性内容,也是不会收录的。
3、确保网站外观的良好性
如果网站内容出现大量拼写错误、死链接或"正在建设中"的字样,或者下载缓慢,都会阻碍编辑对你的网站的收录。此外,对于来自免费主机的网站,被DMOZ收录的机会很少。
4、确保网站中包含具体联系信息
一个DMOZ编辑称,如果他在网站中找不到实际联系地址或电话号码,他就会认为这个网站不具备可信度。因此,如果你的网站中只有一个Email地址作为联系信息,是极不利于收录成功的。
5、确保网站提交到正确的目录
选择合适的分类目录及子目录是网站提交的核心。很多网站登录失败只是由于提交选择的目录不正确所致。所以在提交网站之前,必须先浏览整个目录,最好也了解一下竞争对手的网站都放在哪个目录下。确认之后,才在该目录页面右上角点击"提交网页"。
6、记下提交日期、目录名和编辑邮箱
向ODP提交完你的网站后,记下提交的日期及目录。如果你提交的那个目录下有编辑员信息,最好把编辑的名字和邮箱也记下来。这些信息,对于你需要询问提交网站的处理状态或再次提交时,非常有用。
7、不要多次重复提交网站
因为编辑是根据网站的提交日期顺序进行处理的,一个目录下往往有很多网站在队列中等候审批。从提交成功到最后收录,最快也要2周时间,最晚的甚至要等到半年以后。因此,你需要耐心等待结果。如果网站非常庞大,且拥有很多不同内容的分支时,你可以尝试将不同内容的网页分别向DMOZ下的相应目录进行提交。
一旦DMOZ收录了你的网站,那很快就可以被Google,Lycos,Netscape,AOL, HotBot,DirectHit等一些大型搜索引擎和门户网站收录。
其它的重要免费目录包括Yahoo目录。Yahoo是最早开始做分类目录的网站,直到今天登录Yahoo目录也是网站推广的重要环节。Google把来自Yahoo目录的链接作为网站排名的重要分值。
工具推荐:
检查网站是否登录多个重要目录:www.123promotion.co.uk/directory/index.php
付费登录(Paid Inclusion):
英文Yahoo实行付费登录商业网站政策,国内的门户搜索引擎目录也对商业网站纷纷采用付费登录。付费登录商业模式包括普通登录和固定排名,一般按年付费,网站在付费之后立即登录目录,无须等待和受到其它因素的