Author:Chemandy
学习资料:《SEO实战密码》——其中学习了两章:章4网站结构优化、章5页面优化。
三、总结:
1.网站结构方面
①避免链接无法被搜索引擎爬行,即防止蜘蛛陷阱。
②无需排名的链接,及垃圾链接应使用相关技术防止蜘蛛爬行,避免网站权重分流。
③URL静态化、语义化、规范化,使用统一的URL。
④建立网站地图。
⑤内部链接权重分配和流向调整。
2.页面优化方面
①页面标题,语义化、关键词组合。
②描述标签,关键词标签。
③H标签、ALT属性的权重分配。
④正文中关键词词频,文内锚链接。
⑤精简代码,提高信噪比。
一、网站结构优化
1.搜索引擎友好的网站设计
①搜索引擎能不能找到网页。
□要引擎蜘蛛能够爬到网站,要求网站要有良好的结构,符合逻辑,并且所有页面可以通过可爬行的普通HTML链接达到。
□JavaScript链接、flash链接等搜索引擎蜘蛛一般不能跟踪爬行。
□要收录页面离首页点击距离不能太远,页面需要有最基本的权重。
②找到网页后能不能抓取页面内容
□找到的URL必须是可以被抓取的。数据库动态生成、带有过多参数的URL、SessionID、整个页面是Flash、框架结构(frame)、可疑的转向、大量复制内容都会令搜索引擎敬而远之。
□可以使用robots文件或meta robots标签禁止收录。
③抓取页面后怎样提炼有用信息
□关键词在页面重要位置的合理分布、重要标签的撰写、HTML代码精简、起码的兼容性等可帮助引擎理解页面内容,提取有效信息。
2.避免蜘蛛陷阱
①Flash
□搜索引擎无法读取Flash文件中的文字内容和链接。SWFObject和sIFR等技术可以使Flash文件更易于被搜索引擎读取(但还是不建议使用Flash)。
②SessionID
□建议跟踪用户访问应该用cookies而不是SessionID。在RUL生成SeesionID,因每次不同,访问同一个页面会生成不同的URL。
③各种跳转
□除了301转向以外,搜索引擎对其他转向比较敏感(易判断为作 弊)如:302跳转、JavaScript跳转、Flash跳转、Meta Refresh跳转。
④框架结构
□所搜引擎判断不了框架结构的页面内容的含义。
⑤动态URL
□一般来说,动态URL不利于搜索引擎蜘蛛爬行,应该尽量避免。
⑥JavaScript链接
⑦要求登陆
⑧强制使用cookies
3.物理及链接结构
对搜索引擎来说更重要的链接结构,而不是物理结构。
4.清晰导航
①文字导航
□尽量使用普通文字导航,不要使用图片、javaScript、Flash做导航。
②点击距离及扁平化
□良好的导航目标之一是使所有页面与首页点击距离越近越好。
□主页导航越多,网站越扁平。但用户体验和页面链接总数都不允许主导航有太多链接。
③锚文字包含关键词
④面包屑导航(建议使用)
⑤避免页脚堆积(造成惩罚)
5.子域名和子目录
①搜索引擎通常会把子域名(或称为二级域名)当做一个基本独立的站点看待。
②单从URL看,子域名比目录天生的权重和排名能力稍微高一点。但从SEO角度看,建议使用目录而非子域名。
6.禁止收录机制
①需要使用robots文件
②Meta Robots标签
7.nofollow的使用
①链接rel属性设置为nofollow(链接不爬行),作用:减少垃圾垃圾链接,用于广告,阻止蜘蛛爬行和传递权重,控制权重流向。
8.URL静态化
9.URL设计
①URL越短越好
②避免太多参数
③目录层次尽量少
④文件及目录名具描述性
⑤URL中包含关键词
⑥字母全部小写
⑦连词符使用(尽量使用“-”,这样分词可以使引擎读取分割的单词)
⑧目录形式还是文件形式(文件形式有利于应对网站编程语言变化)
10.网址规范化
①网址规范化:一个文件,使用多个不同的URL指向,导致网址不规范。
□分散了页面权重,不利于排名。
□外部链接也可能指向不同URL分散了权重。
□搜索引擎判断的规范化网址不是站长想要的那个地址。
□如果网址规范化问题过于严重,可能影响收录。
□可能导致搜索引擎判断为负值内容过多,有作 弊嫌疑。
②解决方法
□确保使用CMS系统只产生规范化网址,无论是否有静态化。
□所有内部链接保持统一,都指向规范化网址。
□在Google管理员工具中设置首选域。
□使用301转向,把不规范的URL全部转向到规范化URL。
□使用canonical标签(相当于页面内301)
□提交给搜索引擎的XML网站地图中全部使用规范化网址。
11.复制内容
①消除复制内容
□规范化网址
□不是由于规范化造成的同站内容复制内容,解决的方法最好是选取一个版本允许收录,其他版本禁止搜索引擎抓取或收录。
□使用canonical标签。
□坚持原创。
12.绝对路径和相对路径
①绝对路径
■优点:
□有利于转载时增加站外连接和权重
□RSS输出,网站连接保留
□有助于预防和解决网址规范化问题。
■缺点
□难测试
□移动页面困难
□代码比较多
②相对路径
■优点
□容易移动
□测定简单
□节省代码
■缺点
□页面位置移动,连接需改动
□被抄袭和采集对网站没有好处
□搜索引擎解析URL时可能出错。
13.网站地图
①HTML网站地图sitemap
②XML网站地图Sitemap
□使用站长工具后台提交网站地图文件
□使用robots文件制定网站地图文件位置
14.内部链接及权重分配
前面提到网站结构优化要解决的最重要问题包括收录和页面权重分配。经典树形结构应该是比较好的链接及权重分配模式。
①重点内页
□要想使重点内页获得高权重,最简单方法是首页直接加上几个重点内页的链接,甚至可以在侧栏推荐、促销部分加上全站链接。
②非必要页面
□只在首页显示链接,其他页面干脆取消链接
□使这些页面的链接不能被跟踪或传递权重
③大二级分类
□大于二级目录权重传递比较难。考虑导航的设置。
④翻页过多
□翻页过多,后面页面难以被收录。
□增加上一级目录分类数目。
□对翻页链接进行格式变化。
⑤单一入口还是多入口
⑥相关产品链接
□商品产品链接要尽量随机,使本来不相连的页面能偶交叉链接起来,为某些通过正常分类结构无法达到的区域提供入口。
⑦锚文字分布及变化
□使用不同的文字锚链接同一个网址,增加不同导入文字。
⑧首页链接NoFollow
□当页面上出现多个链接到同一个网址时,第一次出现的链接最重要,第一个链接的锚文字也最重要。
□页面第一次(或最前几次)出现的以“首页”为锚文字的链接加上NoFollow属性禁止搜索引擎跟踪,然后在页面上其他适合放一两个关键词的地方,如页脚,以关键词为锚文字链接向首页。
⑨深层链接
□为距离首页较远、不太容易被蜘蛛爬到的页面适当建设几个外部链接。
⑩分类隔离
15.CMS系统
①页面标题客制化。
②URL静态化及客制化
③meta标签客制化:meta标签的关键词标签(keyword tag)和说明标签(description tag)。
④正文撰写
⑤分类页面说明文字
⑥标签功能
⑦消除复制内容
⑧301转向
⑨网站地图商城
⑩正确生成H标签。
16.404页面
①404错误代码
□当页面不存在时,一定要返回404代码。
□页面不存在时,也不要返回任何转向代码。这会使搜索引擎误以为页面存在,却返回重复内容。
②404错误与外链
□可以使用google网管工具查询有哪些外部网站连向了哪些不存在的页面。
二、页面优化
1.页面标题
①独特不重复
②准确相关
③字数限制(不要超过30个中文字,保险起见最好不要超过25个中文字)。
④简练通顺,不要堆砌
⑤关键词出现在最前面
⑥吸引点击
⑦组合两三个关键词
⑧公司或品牌名称
⑨连词符使用(->|都是不错的选择)
⑩不用用没有意义的句子
⑾noodp标签(可强制搜索引擎不要使用开放目录标题)
2.描述标签()
□现在主流搜索引擎排名算法都已经不适用描述标签。
□搜索引擎结果列表中的页面摘要说明来自描述标签。
■搜索结果页描述来源:
□搜索引擎自动抓取页面可见文字中的相关段落。
□当描述标签中不包含搜索的关键词时,搜索引擎经常从页面可见内容中动态抓取包含搜索词的部分显示为说明文字。
□另一个来源是重要网站目录。
3.关键词标签()
□对SEO木有影响,可忽视。
4.正文中的关键词
□词频和密度
□前50~100个词
□关键词变化形式
□关键词组临近度
□词组的拆分出现
□语义分析
□分类页面说明文字
5.H标签
□H标签相当于正文标题,是关键词优化的另一个页面元素,通常认为重要性仅次于页面Title。
□SEO中H3以下层次权重已经很低了。
6.ALT文字
□替换文字,可以提高可访问性,同时今年ALT文字SEO重要程度有所提高。
7.精简代码
□精简HTML代码,使真正的文字内容比例提高,尽量减少HTML格式代码。从某种意义上来说,格式代码对关键词来说都是噪声,精简代码就是提高信噪比。
8.内部链接及文字
□内部链接对爬行和收录有非常重要意义,内部链接对页面关键词相关性也有影响,最主要的就是在内部链接中使用的锚文字。
9.导出链接及锚文字
□导出链接到外部网站对发出链接的页面相关性也有一定影响。
10.W3C验证
□经验上看W3C对SEO木有明显影响。
11.黑体及斜体
□可用于分词
12.页面更新
□页面更新频率也是吸引搜索引擎蜘蛛返回抓取的因素之一。
13.Google沙盒效应