Java中设置session的详细解释

一、术语 session

  在我的经验里, session 这个词被滥用的程度大概仅次于 transaction ,更加有趣的是 transaction session 在某些语境下的含义是相同的。

   session ,中文经常翻译为会话,其本来的含义是指有始有终的一系列动作 / 消息,比如打电话时从拿起电话拨号到挂断电话这中间的一系列过程能称之为一个 session 。有时候我们能看到这样的话 在一个浏览器会话期间, ...” ,这里的会话一词用的就是其本义,是指从一个浏览器窗口打开到关闭这个期间 。最混乱的是 用户(客户端)在一次会话期间 这样一句话,他可能指用户的一系列动作(一般情况下是同某个具体目的相关的一系列动作,比如从登录到选购商品到结账登出这样一个网上购物的过程,有时候也被称为一个 transaction ),然而有时候也可能仅仅是指一次连接,也有可能是指含义 ,其中的差别只能靠上下文来推断

  然而当 session 一词和网络协议相关联时,他又往往隐含了 面向连接 / 保持状态 这样两个含义, 面向连接 指的是在通信双方在通信之前要先建立一个通信的渠道,比如打电话,直到对方接了电话通信才能开始,和此相对的是写信,在你把信发出去的时候你并不能确认对方的地址是否正确,通信渠道不一定能建立,但对发信人来说,通信已开始了。 保持状态 则是指通信的一方能够把一系列的消息关联起来,使得消息之间能互相依赖,比如一个服务员能够认出再次光临的老顾客并且记得上次这个顾客还欠店里一块钱。这一类的例子有 一个 TCP session” 一个 POP3 session”

  而到了 web 服务器蓬勃发展的时代, session web 研发语境下的语义又有了新的扩展,他的含义是指一类用来在客户端和服务器之间保持状态的解决方案 。有时候 session 也用来指这种解决方案的存储结构,如 xxx 保存在 session 。由于各种用于 web 研发的语言在一定程度上都提供了对这种解决方案的支持,所以在某种特定语言的语境下, session 也被用来指代该语言的解决方案,比如经常把 Java 里提供的 javax.servlet.http.HttpSession 简称为 session

  鉴于这种混乱已不可改动,本文中 session 一词的运用也会根据上下文有不同的含义,请大家注意分辨。

  在本文中,使用中文 浏览器会话期间 来表达含义 ,使用 “session 机制 来表达含义 ,使用 “session” 表达含义 ,使用具体的 “HttpSession” 来表达含义

  二、 HTTP 协议和状态保持

   HTTP 协议本身是无状态的,这和 HTTP 协议本来的目的是相符的,客户端只需要简单的向服务器请求下载某些文件,无论是客户端还是服务器都没有必要纪录彼此过去的行为,每一次请求之间都是独立的,好比一个顾客和一个自动售货机或一个普通的(非会员制)大卖场之间的关系相同。

  然而聪明(或贪心?)的人们非常快发现如果能够提供一些按需生成的动态信息会使 web 变得更加有用,就像给有线电视加上点播功能相同。这种需求一方面迫使 HTML 逐步添加了表单、脚本、 DOM 等客户端行为,另一方面在服务器端则出现了 CGI 规范以响应客户端的动态请求,作为传输载体的 HTTP 协议也添加了文件上载、 cookie 这些特性。其中 cookie 的作用就是为了解决 HTTP 协议无状态的缺陷所作出的努力。至于后来出现的 session 机制则是又一种在客户端和服务器之间保持状态的解决方案。

  让我们用几个例子来描述一 cookie session 机制之间的差别和联系 。笔者原来常去的一家咖啡店有喝 5 杯咖啡免费赠一杯咖啡的优惠,然而一次性消费 5 杯咖啡的机会微乎其微,这时就需要某种方式来纪录某位顾客的消费数量。想象一下其实也无外乎下面的几种方案:

   1 、该店的店员非常厉害,能记住每位顾客的消费数量,只要顾客一走进咖啡店,店员就知道该怎么对待了。这种做法就是协议本身支持状态。

   2 、发给顾客一张卡片,上面记录着消费的数量,一般更有个有效期限。每次消费时,如果顾客出示这张卡片,则此次消费就会和以前或以后的消费相联系起来。这种做法就是在客户端保持状态。

   3 、发给顾客一张会员卡,除了卡号之外什么信息也不纪录,每次消费时,如果顾客出示该卡片,则店员在店里的纪录本上找到这个卡号对应的纪录添加一些消费信息。这种做法就是在服务器端保持状态。

  由于 HTTP 协议是无状态的,而出于种种考虑也不希望使之成为有状态的,因此,后面两种方案就成为现实的选择。具体来说 cookie 机制采用的是在客户端保持状态的方案,而 session 机制采用的是在服务器端保持状态的方案。同时我们也看到,由于采用服务器端保持状态的方案在客户端也需要保存一个标识,所以 session 机制可能需要借助于 cookie 机制来达到保存标识的目的,但实际上他更有其他选择。

  三、理解 cookie 机制  

   cookie 机制的基本原理就如上面的例子相同简单,不过更有几个问题需要解决: 会员卡 怎么分发; 会员卡 的内容;及客户怎么使用 会员卡

  正统的 cookie 分发是通过扩展 HTTP 协议来实现的,服务器通过在 HTTP 的响应头中加上一行特别的指示以提示浏览器按照指示生成相应的 cookie 。然而纯粹的客户端脚本如 JavaScript VBScript 也能生成 cookie

  而 cookie 的使用是由浏览器按照一定的原则在后台自动发送给服务器的。浏览器检查所有存储的 cookie ,如果某个 cookie 所声明的作用范围大于等于将要请求的资源所在的位置,则把该 cookie 附在请求资源的 HTTP 请求头上发送给服务器。意思是麦当劳的会员卡只能在麦当劳的店里出示,如果某家分店还发行了自己的会员卡,那么进这家店的时候除了要出示麦当劳的会员卡,还要出示这家店的会员卡。

   cookie 的内容主要包括:名字,值,过期时间,路径和域。

  其中域能指定某一个域比如 .google.com ,相当于总店招牌,比如宝洁公司,也能指定一个域下的具体某台机器比如 www.google.com froogle.google.com ,能用飘柔来做比。

  路径就是跟在 域名 后面的 URL 路径,比如 / /foo 等等,能用某飘柔专柜做比。

  路径和域合在一起就构成了 cookie 的作用范围。

  如果不设置过期时间,则表示这个 cookie 的生命期为浏览器会话期间,只要关闭浏览器窗口, cookie 就消失了。这种生命期为浏览器会话期的 cookie 被称为会话 cookie 。会话 cookie 一般不存储在硬盘上而是保存在内存里,当然这种行为并不是规范规定的。如果设置了过期时间,浏览器就会把 cookie 保存到硬盘上,关闭后再次打开浏览器,这些 cookie 仍然有效直到超过设定的过期时间。

  存储在硬盘上的 cookie 能在不同的浏览器进程间共享,比如两个 IE 窗口。而对于保存在内存里的 cookie ,不同的浏览器有不同的处理方式。对于 IE ,在一个打开的窗口上按 Ctrl-N (或从文件菜单)打开的窗口能和原窗口共享,而使用其他方式新开的 IE 进程则不能共享已打开的窗口的内存 cookie ;对于 Mozilla Firefox0.8 ,所有的进程和标签页都能共享同样的 cookie 。一般来说是用 javascript window.open 打开的窗口会和原窗口共享内存 cookie 。浏览器对于会话 cookie 的这种只认 cookie 不认人的处理方式经常给采用 session 机制的 web 应用程式研发者造成非常大的困扰。

  下面就是个 goolge 设置 cookie 的响应头的例子

HTTP/1.1 302 Found
Location: http://www.google.com/intl/zh-CN/
Set-Cookie: PREF=ID=0565f77e132de138:NW=1:TM=1098082649:LM=1098082649:S=KaeaCFPo49RiA_d8; expires=Sun, 17-Jan-2038 19:14:07 GMT; path=/; domain=.google.com
Content-Type: text/html


  这是使用 HTTPLook 这个 HTTP Sniffer 软件来俘获的 HTTP 通讯纪录的一部分



  浏览器在再次访问 goolge 的资源时自动向外发送 cookie


  使用 Firefox 能非常容易的观察现有的 cookie 的值

  使用 HTTPLook 配合 Firefox 能非常容易的理解 cookie 的工作原理。



   IE 也能设置在接受 cookie 前询问


  这是个询问接受 cookie 的对话框。

  四、理解 session 机制

  session 机制是一种服务器端的机制,服务器使用一种类似于散列表的结构(也可能就是使用散列表)来保存信息。

  当程式需要为某个客户端的请求创建一个 session 的时候,服务器首先检查这个客户端的请求里是否已包含了一个 session 标识   -   称为 session id ,如果已包含一个 session id 则说明以前已为此客户端创建过 session ,服务器就按照 session id 把这个 session 检索出来使用(如果检索不到,可能会新建一个),如果客户端请求不包含 session id ,则为此客户端创建一个 session 并且生成一个和此 session 相关联的 session id session id 的值应该是个既不会重复,植蝗菀妆徽业焦媛梢苑略斓淖址 ??? ?ession id 将被在本次响应中返回给客户端保存。

  保存这个 session id 的方式能采用 cookie ,这样在交互过程中浏览器能自动的按照规则把这个标识发挥给服务器。一般这个 cookie 的名字都是类似于 SEEESIONID ,而。比如 weblogic 对于 web 应用程式生成的 cookie JSESSIONID=ByOK3vjFD75aPnrF7C2HmdnV6QZcEbzWoWiBYEnLerjQ99zWpBng!-145788764 ,他的名字就是 JSESSIONID

  由于 cookie 能被人为的禁止,必须有其他机制以便在 cookie 被禁止时仍然能够把 session id 传递回服务器。经常被使用的一种技术叫做 URL 重写,就是把 session id 直接附加在 URL 路径的后面,附加方式也有两种,一种是作为 URL 路径的附加信息,表现形式为 http://...../xxx;jsessionid=ByOK ... 99zWpBng!-145788764 另一种是作为查询字符串附加在 URL 后面,表现形式为 http://...../xxx?jsessionid=ByOK ... 99zWpBng!-145788764
这两种方式对于用户来说是没有差别的,只是服务器在解析的时候处理的方式不同,采用第一种方式也有利于把 session id 的信息和正常程式参数区分开来。

  为了在整个交互过程中始终保持状态,就必须在每个客户端可能请求的路径后面都包含这个 session id

  另一种技术叫做表单隐藏字段。就是服务器会自动修改表单,添加一个隐藏字段,以便在表单提交时能够把 session id 传递回服务器。

  这种技术目前已较少应用,笔者接触过的非常古老的 iPlanet6(SunONE 应用服务器的前身 ) 就使用了这种技术。实际上这种技术能简单的用对 action 应用 URL 重写来代替。

  在谈论 session 机制的时候,常常听到这样一种误解 只要关闭浏览器, session 就消失了 其实能想象一下会员卡的例子,除非顾客主动对店家提出销卡,否则店家绝对不会轻易删除顾客的资料。对 session 来说也是相同的,除非程式通知服务器删除一个 session ,否则服务器会一直保留,程式一般都是在用户做 log off 的时候发个指令去删除 session 。然而浏览器从来不会主动在关闭之前通知服务器他将要关闭,因此服务器根本不会有机会知道浏览器已关闭,之所以会有这种错觉,是大部分 session 机制都使用会话 cookie 来保存 session id ,而关闭浏览器后这个 session id 就消失了,再次连接服务器时也就无法找到原来的 session 。如果服务器设置的 cookie 被保存到硬盘上,或使用某种手段改写浏览器发出的 HTTP 请求头,把原来的 session id 发送给服务器,则再次打开浏览器仍然能够找到原来的 session

  恰恰是由于关闭浏览器不会导致 session 被删除,迫使服务器为 seesion 设置了一个失效时间,当距离客户端上一次使用 session 的时间超过这个失效时间时,服务器就能认为客户端已停止了活动,才会把 session 删除以节省存储空间。

  五、理解 javax.servlet.http.HttpSession

   HttpSession Java 平台对 session 机制的实现规范,因为他仅仅是个接口,具体到每个 web 应用服务器的提供商,除了对规范支持之外,仍然会有一些规范里没有规定的细微差异。这里我们以 BEA Weblogic Server8.1 作为例子来演示。

  首先, Weblogic Server 提供了一系列的参数来控制他的 HttpSession 的实现,包括使用 cookie 的开关选项,使用 URL 重写的开关选项, session 持久化的设置, session 失效时间的设置,及针对 cookie 的各种设置,比如设置 cookie 的名字、路径、域, cookie 的生存时间等。

  一般情况下, session 都是存储在内存里,当服务器进程被停止或重启的时候,内存里的 session 也会被清空,如果设置了 session 的持久化特性,服务器就会把 session 保存到硬盘上,当服务器进程重新启动或这些信息将能够被再次使用, Weblogic Server 支持的持久性方式包括文件、数据库、客户端 cookie 保存和复制。

  复制严格说来不算持久化保存,因为 session 实际上还是保存在内存里,不过同样的信息被复制到各个 cluster 内的服务器进程中,这样即使某个服务器进程停止工作也仍然能从其他进程中取得 session

   cookie 生存时间的设置则会影响浏览器生成的 cookie 是否是个会话 cookie 。默认是使用会话 cookie 。有兴趣的能用他来试验我们在第四节里提到的那个误解。

   cookie 的路径对于 web 应用程式来说是个非常重要的选项, Weblogic Server 对这个选项的默认处理方式使得他和其他服务器有明显的差别。后面我们会专题讨论。

关于 session 的设置参考 [5] http://e-docs.bea.com/wls/docs70/webapp/weblogic_xml.html#1036869

  六、 HttpSession 常见问题

  (在本小节中 session 的含义为 的混合)

   1 session 在何时被创建

  一个常见的误解是以为 session 在有客户端访问时就被创建,然而事实是直到某 server 端程式调用 HttpServletRequest.getSession(true) 这样的语句时才被创建,注意如果 JSP 没有显示的使用   关闭 session ,则 JSP 文件在编译成 Servlet 时将会自动加上这样一条语句 HttpSession session = HttpServletRequest.getSession(true); 这也是 JSP 中隐含的 session 对象的来历。

  由于 session 会消耗内存资源,因此,如果不打算使用 session ,应该在所有的 JSP 中关闭他。

   2 session 何时被删除

  综合前面的讨论, session 在下列情况下被删除 a. 程式调用 HttpSession.invalidate(); b. 距离上一次收到客户端发送的 session id 时间间隔超过了 session 的超时设置 ; c. 服务器进程被停止(非持久 session

   3 怎么做到在浏览器关闭时删除 session

  严格的讲,做不到这一点。能做一点努力的办法是在所有的客户端页面里使用 javascript 代码 window.oncolose 来监视浏览器的关闭动作,然后向服务器发送一个请求来删除 session 。不过对于浏览器崩溃或强行杀死进程这些非常规手段仍然无能为力。

   4 有个 HttpSessionListener 是怎么回事

  你能创建这样的 listener 去监视 session 的创建和销毁事件,使得在发生这样的事件时你能做一些相应的工作。注意是 session 的创建和销毁动作触发 listener ,而不是相反。类似的和 HttpSession 有关的 listener 更有 HttpSessionBindingListener HttpSessionActivationListener HttpSessionAttributeListener  

5
存放在 session 中的对象必须是可序列化的吗

  不是必需的。需求对象可序列化只是为了 session 能够在集群中被复制或能够持久保存或在必要时 server 能够暂时把 session 交换出内存。在 Weblogic Server session 中放置一个不可序列化的对象在控制台上会收到一个警告。我所用过的某个 iPlanet 版本如果 session 中有不可序列化的对象,在 session 销毁时会有一个 Exception ,非常奇怪。

   6 怎么才能正确的应付客户端禁止 cookie 的可能性

  对所有的 URL 使用 URL 重写,包括超链接, form action ,和重定向的 URL ,具体做法参见 [6]
http://e-docs.bea.com/wls/docs70/webapp/sessions.html#100770

   7 开两个浏览器窗口访问应用程式会使用同一个 session 还是不同的 session

  参见第三小节对 cookie 的讨论,对 session 来说是只认 id 不认人,因此不同的浏览器,不同的窗口打开方式及不同的 cookie 存储方式都会对这个问题的答案有影响。

   8 怎么防止用户打开两个浏览器窗口操作导致的 session 混乱

  这个问题和防止表单多次提交是类似的,能通过设置客户端的令牌来解决。就是在服务器每次生成一个不同的 id 返回给客户端,同时保存在 session 里,客户端提交表单时必须把这个 id 也返回服务器,程式首先比较返回的 id 和保存在 session 里的值是否一致,如果不一致则说明本次操作已被提交过了。能参看《 J2EE 核心模式》关于表示层模式的部分。需要注意的是对于使用 javascript window.open 打开的窗口,一般不设置这个 id ,或使用独立的 id ,以防主窗口无法操作,建议不要再 window.open 打开的窗口里做修改操作,这样就能不用设置。

   9 为什么在 Weblogic Server 中改动 session 的值后要重新调用一次 session.setValue
做这个动作主要是为了在集群环境中提示 Weblogic Server session 中的值发生了改动,需要向其他服务器进程复制新的 session 值。

   10 为什么 session 不见了

  排除 session 正常失效的因素之外,服务器本身的可能性应该是微乎其微的,虽然笔者在 iPlanet6SP1 加若干补丁的 Solaris 版本上倒也遇见过;浏览器插件的可能性次之,笔者也遇见过 3721 插件造成的问题;理论上防火墙或代理服务器在 cookie 处理上也有可能会出现问题。

  出现这一问题的大部分原因都是程式的错误,最常见的就是在一个应用程式中去访问另外一个应用程式。我们在下一节讨论这个问题。

  七、跨应用程式的 session 共享

  常常有这样的情况,一个大项目被分割成若干小项目研发,为了能够互不干扰,需求每个小项目作为一个独立的 web 应用程式研发,可是到了最后忽然发现某几个小项目之间需要共享一些信息,或想使用 session 来实现 SSO(single sign on) ,在 session 中保存 login 的用户信息,最自然的需求是应用程式间能够访问彼此的 session

  然而按照 Servlet 规范, session 的作用范围应该仅仅限于当前应用程式下,不同的应用程式之间是不能够互相访问对方的 session 的。各个应用服务器从实际效果上都遵守了这一规范,不过实现的细节却可能各有不同,因此解决跨应用程式 session 共享的方法也各不相同。

  首先来看一下 Tomcat 是怎么实现 web 应用程式之间 session 的隔离的,从 Tomcat 设置的 cookie 路径来看,他对不同的应用程式设置的 cookie 路径是不同的,这样不同的应用程式所用的 session id 是不同的,因此即使在同一个浏览器窗口里访问不同的应用程式,发送给服务器的 session id 也能是不同的。



  根据这个特性,我们能推测 Tomcat session 的内存结构大致如下。



  笔者以前用过的 iPlanet 也采用的是同样的方式,估计 SunONE iPlanet 之间不会有太大的差别。对于这种方式的服务器,解决的思路非常简单,实际实行起来也不难。要么让所有的应用程式共享一个 session id ,要么让应用程式能够获得其他应用程式的 session id

   iPlanet 中有一种非常简单的方法来实现共享一个 session id ,那就是把各个应用程式的 cookie 路径都设为 / (实际上应该是 /NASApp ,对于应用程式来讲他的作用相当于根)。

/NASApp


  需要注意的是,操作共享的 session 应该遵循一些编程约定,比如在 session attribute 名字的前面加上应用程式的前缀,使得 setAttribute("name", "neo") 变成 setAttribute("app1.name", "neo") ,以防止命名空间冲突,导致互相覆盖。


  在 Tomcat 中则没有这么方便的选择。在 Tomcat 版本 3 上,我们还能有一些手段来共享 session 。对于版本 4 以上的 Tomcat ,目前笔者尚未发现简单的办法。只能借助于第三方的力量,比如使用文件、数据库、 JMS 或客户端 cookie URL 参数或隐藏字段等手段。

  我们再看一下 Weblogic Server 是怎么处理 session 的。




  从截屏画面上能看到 Weblogic Server 对所有的应用程式设置的 cookie 的路径都是 / ,这是不是意味着在 Weblogic Server 中默认的就能共享 session 了呢?然而一个小实验即可证实即使不同的应用程式使用的是同一个 session ,各个应用程式仍然只能访问自己所设置的那些属性。这说明 Weblogic Server 中的 session 的内存结构可能如下



  对于这样一种结构,在 session 机制本身上来解决 session 共享的问题应该是不可能的了。除了借助于第三方的力量,比如使用文件、数据库、 JMS 或客户端 cookie URL 参数或隐藏字段等手段,更有一种较为方便的做法,就是把一个应用程式的 session 放到 ServletContext 中,这样另外一个应用程式就能从 ServletContext 中取得前一个应用程式的引用。示例代码如下,

  应用程式 A

context.setAttribute("appA", session);

  应用程式 B

contextA = context.getContext("/appA");
HttpSession sessionA = (HttpSession)contextA.getAttribute("appA");

  值得注意的是这种用法不可移植,因为根据 ServletContext JavaDoc ,应用服务器能处于安全的原因对于 context.getContext("/appA"); 返回空值,以上做法在 Weblogic Server 8.1 中通过。

  那么 Weblogic Server 为什么要把所有的应用程式的 cookie 路径都设为 / 呢?原来是为了 SSO ,凡是共享这个 session 的应用程

你可能感兴趣的:(java)