网页字符编码、语言代码与网站SEO关系

网页字符编码、语言代码与网站SEO关系

网页的encoding和lang是最基本的两个属性,虽然他们常常被省略和忽 视,但这两个属性对于网站的用户友好性和网页SEO的作用不可小视。

网页编码:encoding | charset

对于中文站,很多人会使用GB2312编码,这没有问题,如果又做了一个英文版本,还使用gb2312编码,这个理论上是没有问题的,但是英文的用户不太 可能安装gb2312的字符集,所以没法查看这个内容,不过新加坡的用户很可能支持这个编码,就没有问题,所以如果为了国际化方便,可能用utf8比较方 便。当然,可能只有极少数人会出现这个错误。

网页编码在W3C标准中虽然可以省略,但还是建议在网页中设置:
XHTML标准文档的开始声明,特别是使用非utf8时不建议省略<?xml version="1.0" encoding="utf-8" ?>
还建议在head声明中<meta http-equiv="Content-Type" content="text/html; charset="utf-8" />

语言代码:lang | Content-Language

这个属性常常被省略,因为不影响我们看到的效果,但是对于SEO却有着作用。如一个中文的网站,在google.cn中的排名很可能会比 google.com中的排名高,这就是搜索引擎会根据用户的区域性返回区域性相对应的网站,这样的结果可能更符合用户的要求。但同是中文网站,可能是针 对中国大陆的,也可能是针对新加坡的,这就要语言国家代码来声明。如zh-cn 中文-中国大陆,zh-sg 中文-新加坡。

语言代码在网页中的声明方法如下:
XHTML标准在html中设置<html xmlns="http://www.w3c.org/1999/xhtml" xml:lang="zh-CN" lang="zh-CN">
还可以在head中设置<meta http-equiv="Content-Language" content="zh-CN" />

网页编码和语言代码的确定

网页编码选择目标用户支持的就可以,如GBK,iso-8859-1等等,或为国际化方便,选都支持的utf8。
对于语言代码为了使搜索引擎识别目标用户的国家和区域特性,要针对性的设置,如:
en 英文,这个范围比较广,根据需要可以在后面加上国家代码,如en_US 英文_美国;en-ca 英文_加拿大;en-za 英文_南非。

选择正确的网页编码,可以使不同的用户都能方便的浏览,而设置正确的语言代码,更可以告诉搜索引擎网页的目标用户,让网站在当地的搜索中排名更高。

 

搜索引擎如何识别网站本地特性

用google的时候会发现还有“中文网页、简体中文网页和中国的网页”选项,当然中文好识别,那么怎么识别“中国的网页”呢?即搜索引擎如何识别网站本地特性?

首先网站IP很重要,一个放在中国的英文站,也可以被识别为中国的网站;第二是域名,当然如果是国际性的顶级域名还是无法区分。
当然google可以在管理员工具中设置一下就可以了,google说不设置则按以上两点判断,很显然实际情况不是那么简单,不符合上面情况的网站,也能 正确识别。可能还与 第三 编码和语言有关,GB2312编码,内容应该是简体中文。但如果一个新加去坡的网站,用中英双语,服务器放在美国,识别情况会怎样呢? 还有因素就是网页的语方代码,一般情况使用就用语言+地区来标识,即en-SG,英文-新加坡 zh-SG,中文-新加坡,就分清了。


当然,应该还有其它的因素识别,如链接情况、访问的用户的所在地区等,但上面如果设置错误,这将让搜索引擎花费更久的时间来识别本地性。

 

转自: 网页字符编码、语言代码与网站SEO关系

你可能感兴趣的:(xml,搜索引擎,XHTML,浏览器,Google)