单页面应用SEO 和 pushstate

----------------引子-----------------

单页应用的优点

  1. 跨平台开发,更好的用户体验,让用户在web感受natvie的速度和流畅;

  2. 经典MVC开发模式,前后端各负其责。

  3. 一套Server API,多端使用(web、移动APP等)

  4. 重前端,业务逻辑全部在本地操作,数据都需要通过AJAX同步、提交;

但是。对搜索引擎不友好

单页应用实际是把视图(View)渲染从Server交给浏览器,Server只提供JSON格式数据,视图和内容都是通过本地JavaScript来组织和渲染。而搜索搜索引擎抓取的内容,需要有完整的HTML和内容,单页应用架构的站点,并不能很好的支持搜索。

如果站点在用户体验和搜索友好权衡时,如果我们做到更好的体验,也做到友好的搜索支持,既是一箭双雕。

URL中的哈希(#号)

单页应用只有一个页面,视图的变化通常是通过路由(route)来驱动,首先,我们先来谈一谈单页应用的URL中的#号,很多采用单元结构网站的URL都出现了这个符号。

#号在浏览器的URL中是一个锚点,在当前页改变#号的参数,页面会跳转到锚点所在的位置,通过JavaScript我们可以获取到#号后的参数:

location.hash // 获取URL
hashlocation.hash = "#list" //改变URL hash

改变#号后的参数,页面并不会重载,于是大多数的单页架构网站,都在URL中采用#号来作为当前视图的URL地址,例如:

example.com/#index  //首页视图
example.com/#list   //列表页视图
example.com/#list/1   //id为1的列表信息的视图

Backbone.js就是通过改变#号参数来组织视图,这里有一个demo可以很直观的体验URL的变化。

看过这个demo,你或许会发现很熟悉的符号#!,Twitter曾在URL使用这个标识。这个标识是Google提出(AJAX 抓取:网站站长和开发人员指南1):

因为复杂的单页架构页面,对Google来说抓取比较困难,于是给开发者制定一个规范:
网站提交sitemap给Google;

Google发现URL里有#!符号,例如example.com/#!/detail/1,于是Google开始抓取example.com/?_escaped_fragment_=/detail/1;

_escaped_fragment_这个参数是Google指定的命名,如果开发者希望把网站内容提交给Google,就必须通过这个参数生成静态页面。

根据上面的demo,我简单示例一下Google要抓取的页面的样子:
http://119.28.4.22/?escapedfragment_=/detail/1
如此以来,就需要Server通过生成静态的内容以便Google抓取。
以下将简单介绍,单页架构,爬虫访问根目录时如果配置Server端的路由。
判断爬虫
当Google访问119.28.4.22/#!/detail/1 时,会自动转化成http://119.28.4.22/?_escaped_fragment_=/detail/1,以Nginx为例:

if ($args ~ _escaped_fragment_) {
  rewrite ^ /api;}



/api为后台服务的接口,已nodejs为例,代理设置如下:
upstream nodejs {
   server 127.0.0.1:3000;
}

location /api {
   proxy_set_header X-Request-URI   $request_uri;
   proxy_set_header X-Real-IP       $remote_addr;
   proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
   proxy_set_header Host            $host;
   proxy_set_header Port            $server_port;
   proxy_pass http://nodejs;
   proxy_redirect off;
}

如此,我们便将Google的访问重写到/api这个接口,然后在Server的/api处理请求把静态内容输出即可。

----------------------------------------------------------------------------------------------------------

下面是另一种解决方案,pushstate

众所周知,Ajax可以实现页面的无刷新操作——优点;但是,也会造成另外的问题,无法前进与后退!曾几何时,Gmail似乎借助iframe搞定,如今,HTML5让事情变得如同过家家般简单。

当执行Ajax操作的时候,往浏览器history中塞入一个地址(使用pushState)(这是无刷新的);于是,返回的时候,通过URL或其他传参,我们就可以还原到Ajax之前的模样。

本demo所展示的就是ajax的内容载入与地址栏的前进与后退,典型应用,对于熟悉相关知识点很有帮助。

您可以狠狠地点击这里:HTML5 history API与ajax分页实例

demo结构大致如下:左边导航菜单,右侧详细内容。
demo页面大致结构

如果我们想偷懒,导航直接URL地址,点击刷新得了。但头尾内容都是一样的,刷新总显得浪费。从体验上讲,点击导航,右侧Ajax局部刷新是更优的策略。

Ajax局部刷新小菜,稍有经验都能轻松应对。现在如果提出如下需求:每次ajax刷新就如果页面刷新一样,可以后退查看之前内容,怎么破?

----------------我的策略如下:

  • 每次手动点击左侧的菜单,我将Ajax地址的查询内容(?后面的)附在demo HTML页面地址后面,使用history.pushState塞到浏览器历史中。

  • 浏览器的前进与后退,会触发window.onpopstate事件,通过绑定popstate事件,就可以根据当前URL地址中的查询内容让对应的菜单执行Ajax载入,实现Ajax的前进与后退效果。

  • 页面首次载入的时候,如果没有查询地址、或查询地址不匹配,则使用第一个菜单的Ajax地址的查询内容,并使用history.replaceState更改当前的浏览器历史,然后触发Ajax操作。

于是,你会看到:

  • 页面首次载入,虽然我们访问的URL的后缀是光秃秃的.html,但是,实际URL最后是:
    首次载入页面的URL

    因为被history.replaceState摆了一道。

  • 鼠标点击左边的任意一个菜单,会发现,右侧内容虽然是Ajax载入,但是,页面的URL地址却变了,例如,点击宝山区:
    点击宝山区URL地址变化

    因为历史记录被history.pushState插了一刀。

  • 此时,我们点击地址栏的后退按钮,就是这个:
    点击后退、查看历史记录

奇迹般的,页面无刷新的,又回到了浦东菜单:
回到了浦东,同时出现了历史前进按钮

因为window.onpopstate让菊花刀又拔了出来。

------------其它点什么

  • history.pushState
    菊花插一刀之意,用法举例:

    history.pushState({}, "页面标题", "xxx.html");
  • history.pushStatehistory.replaceState
    换把菊花刀之意,用法举例:

    history.replaceState(null, "页面标题", "xxx.html");
  • window.onpopstate
    在菊花刀拔插的时候……,用法举例:

    window.addEventListener("popstate", function() {
        var currentState = history.state;    /*
         * 该干嘛干嘛
        */ });

参考原文地址:http://www.zhangxinxu.com/wordpress/?p=3432

以及   http://isux.tencent.com/seo-for-single-page-applications.html


你可能感兴趣的:(单页面应用SEO 和 pushstate)