【SEO学习之路】大中型信息网站SEO技巧总结
无论分类信息还是B2B网站,都属于UGC(用户产生内容)信息发布平台。
这类网站有个明显的特点就是分类多、地区多,而且层级也不少。
正因为这个原因,让SEO有很大的发挥空间,也有很多容易出错的地方。
下面仅从个人经验角度做一个简单分享,内容如有纰漏,希望大家指出交流。
大中型信息类网站URL结构设计
子域名选择
对于分类信息网站,以地区划分,分类是次级组织维度;对于B2B网站来说,以分类划分,地区起筛选辅助作用。
分类信息网站往往对地区使用子域名。比如 http://bj.58.com
B2B网站往往对行业分类使用子域名。比如 http://jixie.huangye88.com
选择的根源在于产品和服务是否和地区强关联?
分类信息中很多是生活类服务。比如搬家,北京的搬家公司无法服务上海地区的用户。
而对于B2B行业则不同,地区差异不敏感,一般都是通过物流运输解决,行业差异才是问题。
如何设计子域名,要根据行业特点来选。
子域名建议使用拼音(全拼或简拼)或英文,但具体用什么,要考虑目标用户认知,最好一眼能看懂,而且看起来专业。
比如皮革英文单词是leather,中国皮革网就叫chinaleather.org,皮革人才网叫 leatherhr.com,业内人士一看就懂。
如果子域名用 pige.huangye88.com,用户也能懂,但略显得Low。
注意:子域名的好处是可以分散网站风险,但不要滥用子域名:如果子域名下内容不够丰富,强行大量使用,滥用泛域名解析,可能被搜索引擎干掉。
URL目录层级最多不超过3级
对于SEO来说,大家都知道目录层级越浅越好,一方面有利于传递权重,另一方面也便于搜索蜘蛛抓取、收录。
对于大型信息类网站来说,行业分类层级很多,地区也有省市区县(镇),再加上各个行业的不同属性参数,排列组合下来就变的十分复杂。
从URL目录层级设计上来说,要尽量恪守不超过3级目录这个原则。
如果各种子地区、属性筛选超过3级,为了页面静态化,可以使用属性ID组合URL:
http://bj.58.com/haidian/sanxing/pve_5537_501_1000/
如果分类或地区过多,使用拼音做URL时可能重复,这时可以用全、简拼做区分,依然重复可以考虑在拼音后加数字。
以前试验用过中文URL,虽然百度识别问题不大,但依然不推荐使用,容易出现BUG,用户体验也不佳(URL转码、URL截断等问题)
URL结尾
对于分类页面来说,建议使用"/"结尾
对于详情页面来说,建议使用.html或.htm结尾
“/”结尾,搜索引擎会倾向于认为这是一个目录,预期下面会有很多文件内容。
当蜘蛛爬行斜杠结尾的URL时,会认为是一个目录,默认去找下面的缺省主页。
而爬行不带斜杠结尾的URL时,会认为是一个文件,默认找这个文件,当找不到时才去找目录下的缺省主页。
所以分类目录一定要带斜杠结尾,这样可以减少蜘蛛抓取的时间损耗。
不带斜杠目录也需要做301跳转到带斜杠的页面下。
即 domain.com/abc 301跳转到 domain.com/abc/
这样让权重更集中,也不怕别人转URL时写错。
详情页面使用.html结尾即可,即使动态页面也建议通过伪静态重写页面URL。
如果使用文件形式或者其他个性扩展名,即使搜索引擎能识别抓取,因为不符合常规,用户理解起来有问题,点击时也可能有疑虑。
大中型信息网站如何解决重复信息
搜索引擎不喜欢重复信息,不但有可能不收录,还可能认为站点内容质量低,影响整站流量。
尤其对于大中型信息发布网站,内容一般是用户UGC产生,质量很难控制,重复信息也很多。
为了减少重复信息对网站SEO的负面影响,需要从产品、技术、运营三个方面来做处理。
产品角度
- 信息发布页面告知用户发原创信息有利于收录。(标题和内容引导)
- 增加属性填写框,引导用户输入属性字段。
- 对信息内容前120字做相似度判断,超过80%重复降低信息质量评分。
- 重复信息换模板发布到地区行业分类目录。
- 提供标题生成工具和伪原创工具。
标题生成器 http://biaoti.huangye88.com
技术
使用余弦相似度算法计算用户发布信息的相似度,如果相似度高于85%则自动删除。
余弦相似度算法
http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html
运营
虽然每日新增信息可能有十多万,但发信息人数是很固定的。
如何从审核每条信息变为审核发信息的人,这样工作量就会减少很多。
用户的行业和发布信息领域是相对固定的,如果用户以往发布的信息质量高、重复信息少,资料填写完善、真实。那么可以设置该用户几天内信息免审,从而进一步降低人工审核的成本。
空页面问题
对于大中型信息类网站,因为地区、分类、筛选组合过多,这样容易诞生另一个问题:空页面。
比如分类信息里选择小城市的具体分类可能是没有内容的。
如果有大量这样的空页面,对SEO就有可能造成严重的负面影响。
为了避免这种情况,需要制定一套规则,当页面信息丰富起来后再打开页面。
比如要求:
- 分类需要有至少5条信息才会打开,之前可发布到该分类,但信息没有列表入口展示。
- 当信息不够数量时,可以从其他分类调用相关、相近的信息作为页面模块。
- 不做伪静态处理,使用动态的搜索结果动页面。
目的:减少空页面数量和链接入口,避免搜索引擎认为网站内容低质、重复。
链接建设
外部链接建设
链接算法一直是SEO排名的核心依赖。
链接解决了一个问题:“互联网信息那么多,到底该信谁的?”
链接是一个相对民主的网站和页面质量投票评估方法。
比如要在众人中认出谁是“罗胖”(得到APP的罗振宇老师),就让大家投票,得票多的就是真罗胖。
具体到搜索网页,投票就是用指向某一个网页的相关超级链接和链接上使用的文字作一个表决。
但这里有一个问题,一人一票计算总数有些不公平,那些跟罗振宇熟悉的人和有影响力的说的话可信度更高,应该给更高的权重,而且其他人的话权重要低些。
对应到外链建设就是让专业权威站点、甚至同行站点为你的网站背书(加链接),这如何做到?
初期做法
- 刷脸找关系,比如黄页88网之初有易登网的外链支持。
- 自己造外链,比如当时我们使用类似“国内B2B网站大全”、“免费发布信息网排行榜”等标题来写一些带网站链接的文章,把自己网站排在最后一位(显得榜单客观),但你可以倒着写排行榜,从第10名开始写一直到第1名“阿里巴巴”。然后发布到各个博客、百度文库等地方。
- 友情链接平台和QQ群交换链接。比如早期用过go9go.cn等
- 付费链接。
还有比较好的方法就是做自己行业的垂直网站导航站。
一旦业内人士看重的关键词做上去,大量行业网站都会主动找你交换链接。
比如当黄页88成立头几年把B2B这个关键词做到百度第一页第一位时,慧聪网等老牌B2B网站就主动找过来交换友情链接。
后期做法
群众的力量是无穷的,一定要调动用户的积极性。
想要持续稳定的增加外链,就需要引导用户给你加外链。
虽然用户的网站权重一般不高,但是都是垂直专业网站,相关性很好,通过一些激励措施让用户在自己的官网和第三方商铺添加链接指向你的对应页面。
内链建设
内部链接基础原则
新的内容建议包含4~5个旧的内容链接。对旧页面的更新和排名有帮助。
让旧页面更新,除了增加新的段落外,添加几个新的内部链接,有助于旧页面的排名提升。
在内容中创建链接,添加对用户有价值的链接。
不用添加Nofollow链接。
建议每页(内部和外部)的总链接数不超过100个。(谷歌建议75-100)
为排名较好的重点页面添加更多内链。
避免错误404链接。
内容正文链接不要超过3个。
使用HTML链接,而不是Javascript脚本或Flash菜单。
根据用户的搜索行为和产品结构来规划内链结构。
使用面包屑导航。
内部链接锚文本原则
不要大量使用精准匹配锚文本链接指向目标页面,部分匹配即可。
建议使用描述性锚文本,不要使用“点击这里”。
不要链接整个段落,看着笨拙,而且用户体验也不好。锚文本使用几个字或短语即可。
内部链接结构
可以尝试“仓筒”结构:把网站的内容根据主题严格分开,主题间不互相链接,让主题更聚焦。
根据页面的层级(首页、二级、三级等)、类型、页面流量、百度收录与否等参数,对于不同页面,自动添加对应数量和级别的内链。
更多内容见:https://zhuanlan.zhihu.com/p/27130817
SEO知识融入到产品中
对于大中型信息发布平台,无论分类信息还是B2B网站,作为平台运营方肯定都知道SEO的价值,会按照SEO原则来开发网站和组织内容。
但是对于用户来说,他们不懂什么是SEO,也不知道如何做是符合SEO。
所以需要在产品中融入SEO,让用户的行为能对网站SEO起到帮助作用。
比如,黄页88用户中心的每条信息下面都有一个SEO优化链接。
页面里会建议用户把信息链接主动提交给搜索引擎、让用户使用referer词发新信息,让用户主动去发外链等等。
还有个功能让用户诊断自己的信息质量,自动给一些优化建议。
基本都是从信息更新频率、信息数量和完整性角度去引导用户,这些对网站SEO都有潜在的帮助作用。
用户发布信息填写标题时,会出现下拉词,这里使用百度下拉JS代码,这样既不耗费自己服务器资源还可以让用户输入有一定SEO价值的关键词。
HTML代码优化
标签优化
H标签:常见的用法是:主标题用H1,副标题用H2、模块名或小节标题用H3。甚至跳过H2,只用H1和H3。
Meta标签
Keywords标签写页面主关键词,一般是5个词左右,用英文逗号分隔。
Description标签写页面的简介描述,一般在110字以内。(Google的话120字以内)
特殊Meta标签
对于多数网站来说,为了让网页打开更快,用户体验更好,应该启用Webkit内核。
还有百度禁止转码和好搜智能摘要,更多详情见:https://zhuanlan.zhihu.com/p/27050591
CSS样式命名
使用可读性强的CSS命名规则。
Nofollow标签
对SEO价值不高,与当前页面的关联度不大的链接添加Nofollow标签,引导蜘蛛抓取更重要、更希望它收录的内容。。
CSS和JS优化
文件合并、减少请求数。
HTML标签中还有很多需要注意的,比如非装饰性图片,都需要添加Alt标签,便于搜索引擎识别图片内容,而且这里的文本会计算到关键词密度中。
还有一些特别的技巧,比如代码的书写顺序和实际显示顺序,借助CSS相对定位和绝对定位,让重要的内容主体尽可能的接近body标签出现。让页面中出现在头部,但不重要的的内容,在代码靠后的位置出现。
总之,核心目标是引导帮助搜索引擎蜘蛛识别你的页面主题和内容,把页面所有重要的信息信号,用合理的标签展示出来,在不作弊的前提下,对页面做降噪处理。
页面速度优化
对于网站来说,页面打开速度越快越好,可以分前、后端两部分进行优化。
前端速度优化:
- 避免 内联式/嵌入式 代码
- 样式在上,脚本在下
- 压缩合并CSS、JS
- 使用CSS Sprites
- 标签指定宽高
- 压缩优化图片
更多内容见:https://zhuanlan.zhihu.com/p/25550395
后端和硬件优化:
- 减少网站SQL慢查询数量
- 使用DNSPOD域名解析
- 使用高质量CDN服务。比如帝联、网宿、蓝汛等
DNSPOD支持线路设置,与CDN结合使用,让搜索引擎抓取直接回源站,这样可以避免缓存造成使用CDN后页面更新不及时的问题。
聚合页做法
对大中型网站的SEO工作来说,人工分类只能解决中短尾词的着陆页需求,可能做成分类列表,也可能做成专题页来抢占关键词排名。
词库搭建
工具:金花关键词工具、战神关键词工具、5118
词库清洗
数据量大时可以通过编程或awk、sed等命令行工具做处理。
还需要考虑非标准词、敏感词的处理。
更多内容见:https://zhuanlan.zhihu.com/p/26755718
总结
以上仅是自己总结提炼的部分经验,对于B2B和分类信息行业的SEO优化,其实还有很多不便公开的技巧,欢迎大家加我微信交流:vista8
下面是这半年来总结的与SEO有关的所有文章,除了是自己的思考记录,还希望对大家有帮助。
【SEO学习之路】利基主题法拓展长尾关键词 - 知乎专栏
https://zhuanlan.zhihu.com/p/27892923
【SEO学习之路】网址URL如何定义SEO效果最优? - 知乎专栏
https://zhuanlan.zhihu.com/p/27689264
SEO学习之路:内部链接的作用和结构策略 - 知乎专栏
https://zhuanlan.zhihu.com/p/27130817
SEO学习之路:SEOer必须要懂的HTML代码标签 - 知乎专栏
https://zhuanlan.zhihu.com/p/27050591
SEO学习之路:搜索结果页优化技巧,让点击和排名自然上涨 - 知乎专栏
https://zhuanlan.zhihu.com/p/26940786
SEO学习之路:能增加SEO流量的六种标题技巧 - 知乎专栏
https://zhuanlan.zhihu.com/p/26834683
【SEO学习之路】想获得几十万流量?先把聚合页和词库做好 - 知乎专栏
https://zhuanlan.zhihu.com/p/26755718
揭秘Google排名的205个因素(百度80%管用)完整版列表 - 知乎专栏
https://zhuanlan.zhihu.com/p/26610935
2017年值得尝试的SEO策略,用户体验对流量影响巨大 - 知乎专栏
https://zhuanlan.zhihu.com/p/25838521
2017年最影响SEO排名的关键因素(必须掌握) - 知乎专栏
https://zhuanlan.zhihu.com/p/25819385
一个迅速提升网站用户体验和SEO效果的方法(实证有效) - 知乎专栏
https://zhuanlan.zhihu.com/p/25550395
SEO学习之路:新网站百度不收录?老司机教你三个套路 - 知乎专栏
https://zhuanlan.zhihu.com/p/24853063
SEO学习之路:揭秘百度权重核心算法与价值 - 知乎专栏
https://zhuanlan.zhihu.com/p/24344078
实例讲解如何借助SEO思维去分析用户需求、做网站、做营销推广 - 知乎专栏
https://zhuanlan.zhihu.com/p/23008572