nginx 负载均衡,必定要用到分布式集群方案,只要涉及分布式,session共享必定是一个大问题,不仅仅是nginx的问题。我们用nginx做负载均衡,同一个请求不一定会被分配到哪个服务器中,那么我们下一个请求可能又被分到了其他的服务器,这种情境下,就会造成session丢失问题,要出大问题了。这种情况在登陆问题中比较常见,例如:我们第一个请求(由A服务器响应)可以进入到登陆界面,此时A生成的验证码存在于A 的 session中,那么我们输完登陆信息和验证码之后提交,此次请求被分到B服务器来处理,这样B肯定获取不到A中session的信息,拿不到对应的验证码,当然出现的错误就是验证码不正确了。那么怎样解决分布式中session复制(共享)问题呢?从网上差了些资料,整理如下:
session是存放在服务器端的,cookie是存放在客户端的,我们可以把用户访问页面产生的session放到cookie里面,就是以cookie为中转站。你访问web服务器A,产生了session然后把它放到cookie里面,当你的请求被分配到B服务器时,服务器B先判断服务器有没有这个session,如果没有,再去看看客户端的cookie里面有没有这个session,如果也没有,说明session真的不存,如果cookie里面有,就把cookie里面的sessoin同步到服务器B,这样就可以实现session的同步了。
说明:这种方法实现起来简单,方便,也不会加大数据库的负担,但是如果客户端把cookie禁掉了的话,那么session就无从同步了,这样会给网站带来损失;cookie的安全性不高,虽然它已经加了密,但是还是可以伪造的。
memcache可以做分布式,php配置文件中设置存储方式为memcache,这样php自己会建立一个session集群,将session数据存储在memcache中。
说明:以这种方式来同步session,不会加大数据库的负担,并且安全性比用cookie大大的提高,把session放到内存里面,比从文件中读取要快很多。但是memcache把内存分成很多种规格的存储块,有块就有大小,这种方式也就决定了,memcache不能完全利用内存,会产生内存碎片,如果存储块不足,还会产生内存溢出。
redis通常用于项目的缓存,我们可以将session缓存到redis中,达到session复制的目的。目前此种方案是 nginx + redis + tomcat 实现的,如下:
(1)将所需jar包加入到tomcat的lib目录下(tomcat-redis-session-manager相应的jar包,主要有三个)。
(2)配置tomcat目录下的conf/context.xml,加入以下内容:
"com.radiadesign.catalina.session.RedisSessionHandlerValve" />
"com.radiadesign.catalina.session.RedisSessionManager"
host="192.168.0.222" #redis地址
port="6379" #redis端口
database="0"
maxInactiveInterval="60"/> #session失效时间
用数据库来同步session,会加大数据库的IO,增加数据库的负担。而且数据库读写速度较慢,不利于session的适时同步,不推荐。
Nginx负载均衡的策略:
nginx 的 upstream目前支持 4 种方式的分配
1)、轮询(默认)
每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器down掉,能自动剔除。
2)、weight
指定轮询几率,weight和访问比率成正比,用于后端服务器性能不均的情况。
3)、ip_hash
每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器,可以解决session的问题。
4)、fair(第三方)
按后端服务器的响应时间来分配请求,响应时间短的优先分配。
5)、url_hash(第三方)
nginx中的ip_hash技术能够将某个ip的请求定向到同一台后端,这样一来这个ip下的某个客户端和某个后端就能建立起稳固的session,ip_hash是在upstream配置中定义的:
upstream nginx.example.com
{
ip_hash;
server 192.168.1.111:80;
server 192.168.1.114:80;
}
server
{
listen 80;
location /
{
proxy_pass
http://nginx.example.com;
}
}
ip_hash是容易理解的,但是因为仅仅能用ip这个因子来分配后端,因此ip_hash是有缺陷的,不能在一些情况下使用:
(1) nginx不是最前端的服务器。
ip_hash要求nginx一定是最前端的服务器,否则nginx得不到正确ip,就不能根据ip作hash。譬如使用的是squid为最前端,那么nginx取ip时只能得到squid的服务器ip地址,用这个地址来作分流是肯定错乱的。
(2) nginx的后端还有其它方式的负载均衡。
假如nginx后端又有其它负载均衡,将请求又通过另外的方式分流了,那么某个客户端的请求肯定不能定位到同一台session应用服务器上。这么算起来,nginx后端只能直接指向应用服务器,或者再搭一个squid,然后指向应用服务器。最好的办法是用 location作一次分流,将需要session的部分请求通过ip_hash分流,剩下的走其它后端去。
为了解决ip_hash的一些问题,可以使用upstream_hash这个第三方模块,这个模块多数情况下是用作url_hash的,但是并不妨碍将它用来做session共享:
假如前端是squid,他会将ip加入x_forwarded_for这个http_header里,用upstream_hash可以用这个头做因子,将请求定向到指定的后端:
可见这篇文档:http://www.sudone.com/nginx/nginx_url_hash.html
在文档中是使用 $ request_uri 做因子,稍微改一下 :
hash $http_x_forwarded_for”;
这样就改成了利用x_forwarded_for这个头作因子,在nginx新版本中可支持读取cookie值,所以也可以改成:
hash $cookie_jsessionid;
假如在php中配置的session为无cookie方式,配合nginx自己的一个userid_module模块就可以用nginx自发一个cookie,可参见userid模块的英文文档:
http://wiki.nginx.org/NginxHttpUserIdModule
另可用姚伟斌编写的模块upstream_jvm_route:http://code.google.com/p/nginx-upstream-jvm-route/
转自:http://blog.csdn.net/xluren/article/details/16951247