1、简单地说,集群就是指一组(若干个)相互独立的计算机,利用高速通信网络组成的一个较大的计算机服务系统,每个集群节点(即集群中的每台计算机)都是运行各自服务的独立服务器。这些服务器之间可以彼此通信,协同向用户提供应用程序,系统资源和数据,并以单一系统的模式加以管理。当用户客户机请求集群系统时,集群给用户的感觉就是一个单一独立的服务器,而实际上用户请求的是一组集群服务器。
2、打开谷歌,百度的页面,看起来好简单,也许你觉得用几分钟就可以制作出相似的网页,而实际上,这个页面的背后是由成千上万台服务器集群协同工作的结果。而这么多的服务器维护和管理,以及相互协调工作也许就是同学们未来的工作职责了。
3、若要用一句话描述集群,即一堆服务器合作做同一件事,这些机器可能需要整个技术团队架构,设计和统一协调管理,这些机器可以分布在一个机房,也可以分布在全国全球各个地区的多个机房。
一些国家重要的计算密集型应用(如天气预报,核试验模拟等),需要计算机有很强的运算处理能力。以全世界现有的技术,即使是大型机,其计算能力也是有限的,很难单独完成此任务。因为计算时间可能会相当长,也许几天,甚至几年或更久。因此,对于这类复杂的计算业务,便使用了计算机集群技术,集中几十上百台,甚至成千上万台计算机进行计算。
假如你配一个LNMP环境,每次只需要服务10个并发请求,那么单台服务器一定会比多个服务器集群要快。只有当并发或总请求数量超过单台服务器的承受能力时,服务器集群才会体现出优势。
当服务负载,压力增长时,针对集群系统进行较简单的扩展即可满足需求,且不会降低服务质量。
通常情况下,硬件设备若想扩展性能,不得不增加新的CPU和存储器设备,如果加不上去了,就不得不够买更高性能的服务器,就拿我们现在的服务器来讲,可以增加的设备总是有限的。如果采用集群技术,则只需要将新的单个服务器加入现有集群架构中即可,从访问的客户角度来看,系统服务无论是连续性还是性能上都几乎没有变化,系统在不知不觉中完成了升级,加大了访问能力,轻松地实现了扩展。集群系统中的节点数目可以增长到几千乃至上万个,其伸缩性远超过单台超级计算机。
多个独立计算机组成的松耦合集群系统构成一个虚拟服务器。用户或客户端程序访问集群系统时,就像访问一台高性能,高可用的服务器一样,集群中一部分服务器的上线,下线不会中断整个系统服务,这对用户也是透明的。
整个系统可能在物理上很大,但其实容易管理,就像管理一个单一映像系统一样。在理想状况下,软硬件模块的插入能做到即插即用。
在集群系统上,容易开发及修改各类应用程序。
计算机集群架构按功能和结构可以分成以下几类:
提示:
负载均衡集群和高可用性集群是互联网行业常用的集群架构模式,也是我们要学习的重点。
负载均衡集群为企业提供了更为实用,性价比更高的系统架构解决方案。负载均衡集群可以把很多客户集中的访问请求负载压力尽可能平均地分摊在计算机集群中处理。客户访问请求负载通常包括应用程序处理负载和网络流量负载。这样的系统非常适合使用同一组应用程序为大量用户提供服务的模式,每个节点都可以承担一定的访问请求负载压力,并且可以实现访问请求在各节点之间动态分配,以实现负载均衡。负载均衡集群运行时,一般是通过一个或多个前端负载均衡器将客户访问请求分发到后端的一组服务器上,从而达到整个系统的高性能和高可用性。一般高可用性集群和负载均衡集群会使用类似的技术,或同时具有高可用性与负载均衡的特点。
负载均衡集群的作用为:
负载均衡集群典型的开源软件包括LVS,Nginx,Haproxy等。如下图所示:
提示:
不同的业务会有若干秒的切换时间,DB业务明显长于Web业务切换时间。
一般是指在集群中任意一个节点失效的情况下,该节点上的所有任务会自动转移到其他正常的节点上。此过程并不影响整个集群的运行。
高可用性集群的作用为:
高可用性集群常用的开源软件包括Keepalived,Heartbeat等,其架构图如下图所示:
高性能计算集群也称并行计算。通常,高性能计算集群涉及为集群开发的并行应用程序,以解决复杂的科学问题(天气预报,石油勘探,核反应模拟等)。高性能计算集群对外就好像一个超级计算机,这种超级计算机内部由数十至上万个独立服务器组成,并且在公共消息传递层上进行通信以运行并行应用程序。在生产环境中实际就是把任务切成蛋糕,然后下发到集群节点计算,计算后返回结果,然后继续领新任务计算,如此往复。
由于很少用到,在此略。
特别提示:
在互联网网站运维中,比较常用的就是负载均衡集群和高可用性集群。
互联网企业常用的开源集群软件有:Nginx,LVS,Haproxy,Keepalived,heartbeat。
互联网企业常用的商业集群硬件有:F5,Netscaler,Radware,A10等,工作模式相当于Haproxy的工作模式。
淘宝,赶集网,新浪等公司曾使用过Netscaler负载均衡产品。集群硬件Netscaler的产品图如下图所示:
下面是基本选择建议,更多的建议等学完负载均衡内容后再细分讲解。
相比较而言,商业的负载均衡产品成本高,性能好,更稳定,缺点是不能二次开发,开源的负载均衡软件对运维人员的能力要求较高,如果运维及开发能力强,那么开源的负载均衡软件是不错的选择,目前的互联网行业更倾向于使用开源的负载均衡软件。
负载均衡集群提供了一种廉价,有效,透明的方法,来扩展网络设备和服务器的负载,带宽和吞吐量,同时加强了网络数据处理能力,提高了网络的灵活性和可用性。
搭建负载均衡服务的需求如下:
(1)把单台计算机无法承受的大规模并发访问或数据流量分担到多台节点设备上,分别进行处理,减少用户等待响应的时间,提升用户体验。
(2)单个重负载的运算分担到多台节点设备上做并行处理,每个节点设备处理结束后,将结果汇总,返回给用户,系统处理能力得到大幅度提高。
(3)7*24小时的服务保证,任意一个或多个有限后面节点设备宕机,不能影响业务。
在负载均衡集群中,同组集群的所有计算机节点都应该提供相同的服务。集群负载均衡器会截获所有对该服务的入站请求。然后将这些请求尽可能地平均地分配在所有集群节点上。
本节先带同学们一起操作实战,让同学们对Nginx负载均衡有一个初步的概念,然后再继续深入讲解Nginx负载均衡的核心知识应用。
上图是快速实践Nginx负载均衡的逻辑架构图。
在上图中,所有用户的请求统一发送到Nginx负载均衡器,然后由负载均衡器根据调度算法来请求Web01和Web02。
1.硬件准备:
准备4台VM虚拟机(有物理服务器更佳),两台做负载均衡,两台做RS,如下表:
2.软件准备:
系统:CentOS6.5 x86_64
软件:nginx-1.10.2.tar.gz
修改hostname方便查看:
hostname lb01
hostname lb02
hostname web01
hostname web02
安装apache(不建议)(只是用来记录操作)
在 web01 与 web02 上安装 apache :
# 安装apache
[root@web01 ~]# yum install httpd -y
[root@web01 init.d]# service httpd start
[root@web02 ~]# yum install httpd -y
[root@web02 init.d]# service httpd start
# 查看是否启动
[root@web02 ~]# lsof -i :80
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
httpd 11393 root 4u IPv6 168729 0t0 TCP *:http (LISTEN)
httpd 11394 apache 4u IPv6 168729 0t0 TCP *:http (LISTEN)
httpd 11395 apache 4u IPv6 168729 0t0 TCP *:http (LISTEN)
httpd 11396 apache 4u IPv6 168729 0t0 TCP *:http (LISTEN)
httpd 11397 apache 4u IPv6 168729 0t0 TCP *:http (LISTEN)
httpd 11409 apache 4u IPv6 168729 0t0 TCP *:http (LISTEN)
httpd 11410 apache 4u IPv6 168729 0t0 TCP *:http (LISTEN)
httpd 11411 apache 4u IPv6 168729 0t0 TCP *:http (LISTEN)
httpd 11412 apache 4u IPv6 168729 0t0 TCP *:http (LISTEN)
httpd 11413 apache 4u IPv6 168729 0t0 TCP *:http (LISTEN)
httpd 11414 apache 4u IPv6 168729 0t0 TCP *:http (LISTEN)
# 修改index.html页内容
[root@web01 /]# echo 192.168.103.123 >/var/www/html/index.html
[root@web02 /]# echo 192.168.103.124 >/var/www/html/index.html
下面将在以上4台服务器上安装Nginx,这里只给出安装的命令部分。
1.安装上传下载组件:
# 安装上传下载组件
[root@lb01 /]# yum install lrzsz -y
[root@lb02 /]# yum install lrzsz -y
[root@web01 /]# yum install lrzsz -y
[root@web02 /]# yum install lrzsz -y
2.安装pcre与gcc环境依赖:
# 安装pcre与gcc环境依赖
# lb01
[root@lb01 tools]# yum -y install openssl openssl-devel pcre pcre-devel
[root@lb01 tools]# rpm -qa openssl openssl-devel pcre pcre-devel
[root@lb01 tools]# yum install gcc -y
# lb02
[root@lb02 tools]# yum -y install openssl openssl-devel pcre pcre-devel
[root@lb02 tools]# rpm -qa openssl openssl-devel pcre pcre-devel
[root@lb02 tools]# yum install gcc -y
# web01
[root@web01 /]# yum -y install openssl openssl-devel pcre pcre-devel
[root@web01 /]# rpm -qa openssl openssl-devel pcre pcre-devel
[root@web01 /]# yum install gcc -y
# web02
[root@web02 /]# yum -y install openssl openssl-devel pcre pcre-devel
[root@web02 /]# rpm -qa openssl openssl-devel pcre pcre-devel
[root@web02 /]# yum install gcc -y
3.安装Nginx:
# 上传nginx文件
[root@lb01 ~]# mkdir -p /home/oldboy/tools
[root@lb01 ~]# cd /home/oldboy/tools
[root@lb01 tools]# rz -y
[root@lb01 tools]# tar xf nginx-1.6.2.tar.gz
[root@lb01 tools]# cd nginx-1.6.2/
# 创建nginx用户
[root@lb01 nginx-1.6.2]# useradd -M -s /sbin/nologin nginx
# 安装编译
[root@lb01 nginx-1.6.2]# ./configure --user=nginx --group=nginx --prefix=/usr/local/nginx --with-http_stub_status_module --with-http_ssl_module && make && make install
# 建立ln链接
[root@lb01 nginx-1.6.2]# ln -s /usr/local/nginx/sbin/* /usr/local/sbin/
# 启动nginx
[root@lb01 nginx-1.6.2]# nginx
# 停止nginx
# [root@lb01 nginx-1.6.2]# nginx -s stop
# 查看
# [root@lb01 nginx-1.6.2]# lsof -i :80
# 上传nginx文件
[root@lb02 ~]# mkdir -p /home/oldboy/tools
[root@lb02 ~]# cd /home/oldboy/tools
[root@lb02 tools]# rz -y
[root@lb02 tools]# tar xf nginx-1.6.2.tar.gz
[root@lb02 tools]# cd nginx-1.6.2/
# 创建nginx用户
[root@lb02 nginx-1.6.2]# useradd -M -s /sbin/nologin nginx
# 安装编译
[root@lb02 nginx-1.6.2]# ./configure --user=nginx --group=nginx --prefix=/usr/local/nginx --with-http_stub_status_module --with-http_ssl_module && make && make install
# 建立ln链接
[root@lb02 nginx-1.6.2]# ln -s /usr/local/nginx/sbin/* /usr/local/sbin/
# 启动nginx
[root@lb02 nginx-1.6.2]# nginx
# 停止nginx
# [root@lb02 nginx-1.6.2]# nginx -s stop
# 查看
# [root@lb02 nginx-1.6.2]# lsof -i :80
本小节将在两台NginxWeb服务器的节点上操作(web01与web02):配置并查看Web服务器的配置结果。
// web01
# 添加本地主机名
[root@web01 /]# cd usr/local/nginx/conf/
[root@web01 conf]# vim /etc/hosts
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.103.123 www.yunjisuan.com
192.168.103.123 bbs.yunjisuan.com
// web02
# 添加本地主机名
[root@web02 /]# cd usr/local/nginx/conf/
[root@web02 conf]# vim /etc/hosts
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.103.124 www.yunjisuan.com
192.168.103.124 bbs.yunjisuan.com
// web01
# 添加本地主机名
# 安装telnet
[root@web01 /]# yum install telnet nmap dos2unix -y
// web02
# 安装telnet
[root@web02 /]# yum install telnet nmap dos2unix -y
// web01
# 配置nginx
[root@web01 nginx-1.6.2]# cd /usr/local/nginx/conf/
# 删除nginx.conf.default中的#|^$,并写入nginx.conf
[root@web01 conf]# egrep -v "#|^$" nginx.conf.default
[root@web01 conf]# egrep -v "#|^$" nginx.conf.default >nginx.conf
// web02
# 安装telnet
[root@web02 nginx-1.6.2]# cd /usr/local/nginx/conf/
# 删除nginx.conf.default中的#|^$,并写入nginx.conf
[root@web02 conf]# egrep -v "#|^$" nginx.conf.default
[root@web02 conf]# egrep -v "#|^$" nginx.conf.default >nginx.conf
// web01
[root@web01 conf]# vim nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
server {
listen 80;
server_name bbs.yunjisuan.com;
location / {
root html/bbs;
index index.html index.htm;
}
}
server {
listen 80;
server_name www.yunjisuan.com;
location / {
root html/www;
index index.html index.htm;
}
}
}
// web02
[root@web02 conf]# vim nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
server {
listen 80;
server_name bbs.yunjisuan.com;
location / {
root html/bbs;
index index.html index.htm;
}
}
server {
listen 80;
server_name www.yunjisuan.com;
location / {
root html/www;
index index.html index.htm;
}
}
}
这里故意将www虚拟主机放在下面,便于用后面的参数配置测试效果。
// web01
[root@web01 conf]# nginx -t
nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok
nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful
// web02
[root@web02 conf]# nginx -t
nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok
nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful
// web01
[root@web01 conf]# nginx -s reload
[root@web01 conf]# netstat -antup | grep nginx
tcp 0 0 0.0.0.0:80 0.0.0.0:* LISTEN 17429/nginx: master
// web02
[root@web02 conf]# nginx -s reload
[root@web02 conf]# netstat -antup | grep nginx
tcp 0 0 0.0.0.0:80 0.0.0.0:* LISTEN 17429/nginx: master
// web01
[root@web01 /]# mkdir /usr/local/nginx/html/{www,bbs}
[root@web01 /]# echo "`hostname -I `www" >> /usr/local/nginx/html/www/index.html
[root@web01 /]# cat /usr/local/nginx/html/www/index.html
192.168.103.123 192.168.122.1 www
[root@web01 /]# echo "`hostname -I `bbs" >> /usr/local/nginx/html/bbs/index.html
[root@web01 /]# cat /usr/local/nginx/html/bbs/index.html
192.168.103.123 192.168.122.1 bbs
// web02
[root@web01 /]# mkdir /usr/local/nginx/html/{www,bbs}
[root@web01 /]# echo "`hostname -I `www" >> /usr/local/nginx/html/www/index.html
[root@web01 /]# cat /usr/local/nginx/html/www/index.html
192.168.103.124 192.168.122.1 www
[root@web01 /]# echo "`hostname -I `bbs" >> /usr/local/nginx/html/bbs/index.html
[root@web01 /]# cat /usr/local/nginx/html/bbs/index.html
192.168.103.124 192.168.122.1 bbs
// web01
[root@web01 /]# curl www.yunjisuan.com
192.168.103.123 192.168.122.1 www
[root@web01 /]# curl bbs.yunjisuan.com
192.168.103.123 192.168.122.1 bbs
// web02
[root@web02 /]# curl www.yunjisuan.com
192.168.103.124 192.168.122.1 www
[root@web02 /]# curl bbs.yunjisuan.com
192.168.103.124 192.168.122.1 bbs
配置文档:http://nginx.org/en/docs/http/ngx_http_upstream_module.html
upstream backend {
server backend1.example.com weight=5;
server backend2.example.com:8080;
server unix:/tmp/backend3;
server backup1.example.com:8080 backup;
server backup2.example.com:8080 backup;
}
server {
location / {
proxy_pass http://backend;
}
}
1.添加本地主机名(可选):
添加本地域名
[root@lb01 conf]# vim /etc/hosts
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.103.121 www.yunjisuan.com
2.安装 telnet (可选):
# 安装telnet
[root@lb01 conf]# yum install telnet nmap dos2unix -y
3.配置nginx:
# 配置nginx
[root@lb01 nginx-1.6.2]# cd /usr/local/nginx/conf/
# 删除nginx.conf.default中的#|^$,并写入nginx.conf
[root@lb01 conf]# egrep -v "#|^$" nginx.conf.default
[root@lb01 conf]# egrep -v "#|^$" nginx.conf.default >nginx.conf
4.创建配置信息(notepad++中):
upstream webpools {
server 192.168.103.123 weight=5;
server 192.168.103.124 weight=5;
server 192.168.103.125 weight=5 backup;
}
server {
location / {
proxy_pass http://webpools;
}
}
5.修改 nginx.conf:
[root@lb01 conf]# vim nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
upstream webpools {
server 192.168.103.123:80 weight=5;
server 192.168.103.124:80 weight=5;
server 192.168.103.125:80 weight=5 backup;
}
server {
listen 80;
server_name www.yunjisuan.com;
location / {
root html;
index index.html index.htm;
proxy_pass http://webpools;
}
}
}
注意:upstream名称不能包含下划线,否则会报如下错误:
6.检查语法错误:
[root@lb01 conf]# nginx -t
nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok
nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful
7.重新加载nginx:
[root@lb01 conf]# nginx -s reload
8.测试:
[root@lb01 /]# curl www.yunjisuan.com
192.168.103.123 192.168.122.1 bbs
[root@lb01 /]# curl www.yunjisuan.com
192.168.103.124 192.168.122.1 bbs
[root@lb01 /]# curl www.yunjisuan.com
192.168.103.123 192.168.122.1 bbs
[root@lb01 /]# curl www.yunjisuan.com
192.168.103.124 192.168.122.1 bbs
Nginx主配置文件nginx.conf是一个纯文本类型的文件(其他配置文件大多也是如此),它位于Nginx安装目录下的conf目录,整个配置文件是以区块的形式组织的。一般,每个区块以一个大括号“{}”来表示,区块可以分为几个层次,整个配置文件中Main区位于最上层,在Main区下面可以有Events区,HTTP区等层级,在HTTP区中又包含有一个或多个Server区,每个Server区中又可有一个或多个location区,整个Nginx配置文件nginx.conf的主体框架为:
[root@chensiqi conf]# egrep -v "#|^$" nginx.conf #去掉包含#号和空行的内容
worker_processes 1; #worker进程的数量
error_log logs/error.log; #错误日志(默认没开)
pid logs/nginx.pid; #进程号(默认没开)
events { #事件区块开始
worker_connections 1024; #每个worker进程支持的最大连接数
} #事件区块结束
http { #http区块开始
include mime.types; #Nginx支持的媒体类型库文件包含
default_type application/octet-stream; #默认的媒体类型
sendfile on; #开启高效传输模式
keepalive_timeout 65; #连接超时。
server { #网站配置区域(第一个server第一个虚拟主机站点)
listen 80; #提供服务的端口,默认80
server_name www.chensiqi.org; #提供服务的域名主机名
location / { #第一个Location区块开始
root html; #站点的根目录(相对于nginx安装路径)
index index.html index.htm; #默认的首页文件,多个用空格分开
}
error_page 500 502 503 504 /50x.html; #出现对应的http状态码时,使用50x.html回应客户
location = /50x.html { #Location区块开始,访问50x.html
root html; #指定对应的站点目录为html
}
}
server { #网站配置区域(第二个server第二个虚拟主机站点)
listen 80; #提供服务的端口,默认80
server_name bbs.chensiqi.org; #提供服务的域名主机名
location / { #服务区块
root html; #相对路径(nginx安装路径)
index index.html index.htm;
}
location = /50x.html { #发生错误访问的页面
root html;
}
}
}
整个nginx配置文件的核心框架如下:
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
server {
listen 80;
server_name localhost;
location / {
root html;
index index.html index.htm;
}
}
}
[root@localhost conf]# cat fastcgi.conf
fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
fastcgi_param QUERY_STRING $query_string;
fastcgi_param REQUEST_METHOD $request_method;
fastcgi_param CONTENT_TYPE $content_type;
fastcgi_param CONTENT_LENGTH $content_length;
fastcgi_param SCRIPT_NAME $fastcgi_script_name;
fastcgi_param REQUEST_URI $request_uri;
fastcgi_param DOCUMENT_URI $document_uri;
fastcgi_param DOCUMENT_ROOT $document_root;
fastcgi_param SERVER_PROTOCOL $server_protocol;
fastcgi_param REQUEST_SCHEME $scheme;
fastcgi_param HTTPS $https if_not_empty;
fastcgi_param GATEWAY_INTERFACE CGI/1.1;
fastcgi_param SERVER_SOFTWARE nginx/$nginx_version;
fastcgi_param REMOTE_ADDR $remote_addr;
fastcgi_param REMOTE_PORT $remote_port;
fastcgi_param SERVER_ADDR $server_addr;
fastcgi_param SERVER_PORT $server_port;
fastcgi_param SERVER_NAME $server_name;
# PHP only, required if PHP was built with --enable-force-cgi-redirect
fastcgi_param REDIRECT_STATUS 200;
fastcgi_params 默认配置文件的内容如下:
[root@localhost conf]# cat fastcgi_params
fastcgi_param QUERY_STRING $query_string;
fastcgi_param REQUEST_METHOD $request_method;
fastcgi_param CONTENT_TYPE $content_type;
fastcgi_param CONTENT_LENGTH $content_length;
fastcgi_param SCRIPT_NAME $fastcgi_script_name;
fastcgi_param REQUEST_URI $request_uri;
fastcgi_param DOCUMENT_URI $document_uri;
fastcgi_param DOCUMENT_ROOT $document_root;
fastcgi_param SERVER_PROTOCOL $server_protocol;
fastcgi_param REQUEST_SCHEME $scheme;
fastcgi_param HTTPS $https if_not_empty;
fastcgi_param GATEWAY_INTERFACE CGI/1.1;
fastcgi_param SERVER_SOFTWARE nginx/$nginx_version;
fastcgi_param REMOTE_ADDR $remote_addr;
fastcgi_param REMOTE_PORT $remote_port;
fastcgi_param SERVER_ADDR $server_addr;
fastcgi_param SERVER_PORT $server_port;
fastcgi_param SERVER_NAME $server_name;
# PHP only, required if PHP was built with --enable-force-cgi-redirect
fastcgi_param REDIRECT_STATUS 200;
上述未做注释的目录或文件是比较少用的,有关动态扩展配置后文讲到PHP服务时再来讲解。
error_log file level;
常见的日志级别【debug|info|notice|warn|error|crit|alert|emerg】
生产场景一般是warn|error|crit这三个级别之一,注意不要配置info等较低级别,会带来巨大磁盘I/O消耗。
error_log的默认值为:
# default:error_log logs/error.log error;
worker_processes 1;
error_log logs/error.log; #非常简单,一般增加此行即可
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
include extra/www.conf;
include extra/mail.conf;
include extra/status.conf;
}
默认情况下Nginx会把所有的访问日志生成到一个指定的访问日志文件access.log里,但这样一来,时间长了就会导致日志个头很大,不利于日志的分析和处理,因此,有必要对Nginx日志,按天或按小时进行切割,使其分成不同的文件保存。
[root@localhost nginx]# cat /server/scripts/cut_nginx_log.sh
#!/bin/bash
#日志切割脚本可挂定时任务,每天00点整执行
Dateformat=`date +%Y%m%d`
Basedir="/usr/local/nginx"
Nginxlogdir="$Basedir/logs"
Logname="access"
[ -d $Nginxlogdir ] && cd $Nginxlogdir || exit 1
[ -f ${Logname}.log ] || exit 1
/bin/mv ${Logname}.log ${Dateformat}_${Logname}.log
$Basedir/sbin/nginx -s reload
[root@localhost nginx]# cat >>/var/spool/cron/root << KOF
#cut nginx access log by Mr.chen
00 00 * * * /bin/bash /server/scripts/cut_nginx_log.sh >/dev/null 2>&1
语法为:
location [ = | ~ | ~* | ^~ ] uri {
...
}
上图是对location语法的说明。上述语法中的URI部分是关键,这个URI可以是普通的字符串地址路径,或者是正则表达式,匹配成功则执行后面大括号里的相关命令。正则表达式的前面还可以有“~”或“~*”等特殊字符。
匹配这两种特殊字符“~”或“~*”的区别为:“~”用于区分大小写(大小写敏感)的匹配;“~*”用于不区分大小写的匹配。还可以用逻辑操作符“!”对上面的匹配取反,即“!~”和“!~*”。此外,“^~”的作用是先进行字符串的前缀匹配(必须以后边的字符串开头),如果能匹配到,就不再进行其他location的正则匹配了。
location匹配示例:
[root@localhost nginx]# cat /usr/local/nginx/conf/extra/www.conf
server {
listen 80;
server_name www.yunjisuan.com;
root /var/www/html/wwwcom;
location / {
return 401;
}
location = / {
return 402;
}
location = /images/ {
return 501;
}
location /documents/ {
return 403;
}
location ^~ /images/ {
return 404;
}
location ~* \.(gif|jpg|jpeg)$ {
return 500;
}
}
匹配结果:
[root@localhost nginx]# curl -s -o /dev/null -w "%{http_code}\n" www.yunjisuan.com
402 #匹配了=的情况
[root@localhost nginx]# curl -s -o /dev/null -w "%{http_code}\n" www.yunjisuan.com/
402 #匹配了=的情况
[root@localhost nginx]# curl -s -o /dev/null -w "%{http_code}\n" www.yunjisuan.com/xxxx
401 #匹配不到默认匹配 /的情况
[root@localhost nginx]# curl -s -o /dev/null -w "%{http_code}\n" www.yunjisuan.com/documents/
403 #匹配字符串
[root@localhost nginx]# curl -s -o /dev/null -w "%{http_code}\n" www.yunjisuan.com/images/
501 #优先匹配=的情况
[root@localhost nginx]# curl -s -o /dev/null -w "%{http_code}\n" www.yunjisuan.com/images/1.jpg
404 #匹配
[root@localhost nginx]# curl -s -o /dev/null -w "%{http_code}\n" www.yunjisuan.com/documents/images/1.jpg
500 #匹配~*的情况
和Apache等Web服务软件一样,Nginx rewrite的主要功能也是实现URL地址重写。Nginx的rewrite规则需要PCRE软件的支持,即通过Perl兼容正则表达式语法进行规则匹配。默认参数编译时,Nginx就会安装支持rewrite的模块,但是,也必须要有PCRE软件的支持。
- rewrite指令语法
rewrite是实现URL重写的关键指令,根据regex(正则表达式)部分的内容,重定向到replacement部分,结尾是flag标记。下面是一个简单的URL rewrite跳转例子:
rewrite ^/(.*) http://www.baidu.com/$1 permanent;
在上述指令中,rewrite为固定关键字,表示开启一条rewrite匹配规则,regex部分是^(.*),这是一个正则表达式,表示匹配所有,匹配成功后跳转到http://www.baidu.com/$1 。这里的$1是取前面regex部分括号里的内容,结尾的permanent;是永久301重定向标记,即跳转到后面的http://www.baidu.com/$1 地址上。
以往我们是通过别名方式实现yunjisuan.com和www.yunjisuan.com访问同一个地址的,事实上,除了这个方式外,还可以使用nginx rewrite 301 跳转的方式来实现。实现的配置如下:
[root@localhost nginx]# cat conf/extra/www.conf
#www virtualhost by Mr.chen
server {
listen 80;
server_name www.yunjisuan.com;
root /var/www/html/wwwcom;
location / {
index index.html index.htm;
}
# location = / {
# return 402;
# }
location = /images/ {
return 501;
}
location /documents/ {
return 403;
}
location ^~ /images/ {
return 404;
}
location ~* \.(gif|jpg|jpeg)$ {
return 500;
}
}
server{
listen 80;
server_name yunjisuan.com;
rewrite ^/(.*) http://www.yunjisuan.com/$1 permanent;
#当用户访问yunjisuan.com及下面的任意内容时,都会通过这条rewrite跳转到www.yunjisuan.com对应的地址
}
upstream模块的语法相当简单,这里直接上范例给同学们讲。
范例1:基本的upstream配置案例
upstream www_server_pools {
# upstream是关键字必须有,后面的www_server_pools为一个Upstream集群组的名字,可以自己起名,调用时就用这个名字
server 192.168.103.123:80 weight=5;
server 192.168.103.124:80 weight=10;
server 192.168.103.125:80 weight=15;
#server关键字是固定的,后面可以接域名(门户会用)或IP。如果不指定端口,默认是80端口。weight代表权重,数值越大被分配的请求越多,结尾有分号,别忘了
}
范例2:较完整的upstream配置案例
upstream blog_server_pool {
server 192.168.103.123; #这行标签和下行是等价的
server 192.168.103.124:80 weight=1 max_fails=1 fail_timeout=10s; #这行标签和上一行是等价的,此行多余的部分就是默认配置,不写也可以。
server 192.168.103.125:80 weight=1 max_fails=2 fail_timeout=20s backup;
# server最后面可以加很多参数,具体参数作用看下文的表格
}
范例3:使用域名及socket的upstream配置案例
upstream backend {
server backend1.example.com weight=5;
server backend2.example.com:8080; #域名加端口。转发到后端的指定端口上
server unix:/tmp/backend3; #指定socket文件
#提示:server后面如果接域名,需要内网有DNS服务器或者在负载均衡器的hosts文件做域名解析。
server 192.168.103.123;
server 192.168.103.124:8080;
server backup1.example.com:8080 backup;
#备份服务器,等上面指定的服务器都不可访问的时候会启动,backup的用法和Haproxy中用法一样
server backup2.example.com:8080 backup;
}
如果是两台Web服务器做高可用,常规方案就需要keepalived配合,那么这里使用Nginx的backup参数通过负载均衡功能就可以实现Web服务器集群了,对于企业应用来说,能做集群就不做高可用。
upstream模块的内容应放于nginx.conf配置的http{}标签内,其默认调度节点算法是wrr(weighted round-robin,即权重轮询)。
下图为upstream模块内部server标签部分参数说明:
提示:
以上参数与专业的Haproxy参数很类似,但不如Haproxy的参数易懂。
来看个示例,如下:
upstream backend {
server backend1.example.com weight=5; #如果就是单个Server,没必要设置权重
server 127.0.0.1:8080 max_fail=5 fail_timeout=10s;
#当检测次数等于5的时候,5次连续检测失败后,间隔10s再重新检测。
server unix:/tmp/backend3;
server backup1.example.com:8080 backup; #热备机器设置
}
需要特别说明的是,如果是Nginx代理Cache服务,可能需要使用hash算法,此时若宕机,可通过设置down参数确保客户端用户按照当前的hash算法访问,这一点很重要。示例配置如下:
upstream backend {
ip_hash;
server backend1.example.com;
server backend2.example.com;
server backend3.example.com down;
server backend4.example.com;
}
注意:ip_hash不能与backup共同使用。
下面是Haproxy负载均衡器server标签的配置示例。
#开启对后端服务器的健康检测,通过GET /test/index.php来判断后端服务器的健康情况
server php_server_1 192.168.103.123:80 cookie 1 check inter 2000 rise 3 fall 3 weight 2
server php_server_2 192.168.103.124:80 cookie 2 check inter 2000 rise 3 fall 3 weight 1
server php_server_bak 192.168.103.125:80 cookie 3 check inter 1500 rise 3 fall 3 backup
上述命令的说明如下:
调度算法一般分为两类:
下面介绍一下常见的调度算法。
1.rr轮询(默认调度算法,静态调度算法):
按客户端请求顺序把客户端的请求逐一分配到不同的后端节点服务器,这相当于LVS中的rr算法,如果后端节点服务器宕机(默认情况下Nginx只检测80端口),宕机的服务器会被自动从节点服务器池中剔除,以使客户端的用户访问不受影响。新的请求会分配给正常的服务器。
2.wrr(权重轮询,静态调度算法):
在rr轮询算法的基础上加上权重,即为权重轮询算法,当使用该算法时,权重和用户访问成正比,权重值越大,被转发的请求也就越多。可以根据服务器的配置和性能指定权重值大小,有效解决新旧服务器性能不均带来的请求分配问题。
3.ip_hash(静态调度算法)(会话保持):
每个请求按客户端IP的hash结果分配,当新的请求到达时,先将其客户端IP通过哈希算法哈希出一个值,在随后的客户端请求中,客户IP的哈希值只要相同,就会被分配至同一台服务器,该调度算法可以解决动态网页的session共享问题,但有时会导致请求分配不均,即无法保证1:1的负载均衡,因为在国内大多数公司都是NAT上网模式,多个客户端会对应一个外部IP,所以,这些客户端都会被分配到同一节点服务器,从而导致请求分配不均。LVS负载均衡的-p参数,Keepalived配置里的persistence_timeout 50参数都类似这个Nginx里的ip_hash参数,其功能都可以解决动态网页的session共享问题。
我们来看一个示例,如下:
upstream yunjisuan_lb{
ip_hash;
server 192.168.0.223:80;
server 192.168.0.224:8080;
}
upstream backend{
ip_hash;
server backend1.example.com;
server backend2.example.com;
server backend3.example.com down;
server backend4.example.com;
}
注意:
当负载调度算法为ip_hash时,后端服务器在负载均衡调度中的状态不能有weight和backup,即使有也不会生效。
示例如下:
upstream yunjisuan_lb{
server 192.168.103.123;
server 192.168.103.124;
fair;
}
upstream yunjisuan_lb {
server squid1:3128;
server squid2:3128;
hash $request_uri;
hash_method crc32;
}
http {
upstream test {
consistent_hash $request_uri;
server 127.0.0.1:9001 id=1001 weight=3;
server 127.0.0.1:9002 id=1002 weight=10;
server 127.0.0.1:9003 id=1003 weight=20;
}
}
虽然Nginx本身不支持一致性hash算法,但Nginx得分支Tengine支持。
详细可参考http://tengine.taobao.org/document_cn/http_upstream_consistent_hash_cn.html
proxy_pass指令属于 ngx_http_proxy_module 模块,此模块可以将请求转发到另一台服务器,在实际的反向代理工作中,会通过location功能匹配指定的URI,然后把接收到的符合匹配URI的请求通过proxy_pass抛给定义好的upstream节点池。该指令官方地址1见:http://nginx.org/en/docs/http/ngx_http_proxy_module.html#proxy_pass
下面proxy_pass的使用案例:
1.将匹配URI为name的请求抛给
http://127.0.0.1/remote/.
location /name/ {
proxy_pass http://127.0.0.1/remote/;
}
2.将匹配URI为some/path的请求抛给http://127.0.0.1
location /some/path/ {
proxy_pass http://127.0.0.1;
}
3.将匹配URI为name的请求应用指定的rewrite规则,然后抛给http://127.0.0.1
location /name/ {
rewrite /name/( [^/]+ ) /username=$1 break;
proxy_pass http://127.0.0.1;
}
Nginx的代理功能是通过http proxy模块来实现的。默认在安装Nginx时已经安装了http proxy模块,因此可直接使用http proxy模块。下面详细解释模块1中每个选项代表的含义,见下表:
// lb01
[root@lb01 /]# cat /usr/local/nginx/conf/nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
upstream webpools {
#默认调度算法wrr,即权重轮询算法
#虽然定义的www服务器池但是这个服务器池也可以作为BBS等业务的服务器池。因为节点服务器的虚拟主机都是根据访问的主机头字段区分的。
#如果就是单个Server,没必要设置权重
server 192.168.103.123:80 weight=5 max_fails=1 fail_timeout=60s; #当检测次数等于1的时候,1次连续检测失败后,间隔60s再重新检测。
server 192.168.103.124:80 weight=5;
server 192.168.103.124:80 weight=5 backup; #热备机器设置
}
server {
listen 80;
server_name www.yunjisuan.com;
location / {
root html;
index index.html index.htm;
proxy_pass http://webpools; #通过proxy_pass功能把用过户的请求交给上面反向代理upstream定义的webpools服务器池处理。
}
}
}
现在配置hosts解析到代理服务器lb01上,重新加载服务,访问测试:
[root@lb01 /]# tail -2 /etc/hosts
192.168.103.121 www.yunjisuan.com
192.168.103.121 bbs.yunjisuan.com
[root@lb01 /]# /usr/local/nginx/sbin/nginx -s reload
[root@lb01 /]# tail -2 /etc/hosts
192.168.103.121 www.yunjisuan.com
192.168.103.121 bbs.yunjisuan.com
[root@lb01 /]# /usr/local/nginx/sbin/nginx -s reload
[root@lb01 /]# curl www.yunjisuan.com
192.168.103.123 192.168.122.1 bbs
[root@lb01 /]# curl www.yunjisuan.com
192.168.103.124 192.168.122.1 bbs
从测试结果可以看出,已经实现了反向代理,负载均衡功能,但是有一个特殊问题,出来的结果并不是带有www的字符串,而是bbs的字符串,根据访问结果,我们推测是访问了Web节点下bbs的虚拟主机,明明代理的是www虚拟主机,为什么结果是访问了后端的bbs虚拟主机了呢?问题又该如何解决?请同学们继续往下看。
上一节代理的结果不对,究其原因是当用户访问域名时确实是携带了www.yunjisuan.com主机头请求Nginx反向代理服务器,但是反向代理向下面节点重新发起请求时,默认并没有在请求头里告诉节点服务器要找哪台虚拟主机,所以,Web节点服务器接收到请求后发现没有主机头信息,因此,就把节点服务器的第一个虚拟主机发给了反向代理了(节点上第一个虚拟主机放置的是故意这样放置的bbs)。解决这个问题的方法,就是当反向代理向后重新发起请求时,要携带主机头信息,以明确告诉节点服务器要找哪个虚拟主机。具体的配置很简单,就是在Nginx代理www服务虚拟主机配置里增加如下一行配置即可:
proxy_set_header host $host;
在代理向后端服务器发送的http请求头中加入host字段信息后,若后端服务器配置有多个虚拟主机,它就可以识别代理的是哪个虚拟主机。这是节点服务器多虚拟主机时的关键配置。
整个Nginx代理配置为:
// lb01
[root@lb01 /]# vim /usr/local/nginx/conf/nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
upstream webpools {
#如果就是单个Server,没必要设置权重
server 192.168.103.123:80 weight=5 max_fails=1 fail_timeout=60s; #当检测次数等于1的时候,1次连续检测失败后,间隔60s再重新检测。
server 192.168.103.124:80 weight=5;
server 192.168.103.124:80 weight=5 backup; #热备机器设置
}
server {
listen 80;
server_name www.yunjisuan.com;
location / {
root html;
index index.html index.htm;
proxy_pass http://webpools;
proxy_set_header host $host; #在代理向后端服务器发送的http请求头中加入host字段信息,用于当后端服务器配置有多个虚拟主机时,可以识别代理的是哪个虚拟主机。这是节点服务器多虚拟主机时的关键配置。
}
}
}
此时,再重新加载Nginx服务,并用curl测试检查,结果如下:
[root@lb01 /]# curl www.yunjisuan.com
192.168.103.123 192.168.122.1 www
[root@lb01 /]# curl www.yunjisuan.com
192.168.103.124 192.168.122.1 www
[root@lb01 /]# curl bbs.yunjisuan.com
192.168.103.123 192.168.122.1 bbs
[root@lb01 /]# curl bbs.yunjisuan.com
192.168.103.124 192.168.122.1 bbs
可以看到这次访问的结果和访问的域名就完全对应上了,这样代理多虚拟主机的节点服务器就不会出问题了。
修改 nginx.config 记录日志:
// web01
[root@web01 conf]# vim /usr/local/nginx/conf/nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
log_format main '$remote_addr-$remote_user[$time_local]"$request"' '$status $body_bytes_sent "$http_referer"' '"$http_user_agent""$http_x_forwarded_for"';
server {
listen 80;
server_name bbs.yunjisuan.com;
location / {
root html/bbs;
index index.html index.htm;
}
access_log logs/access_bbs.log main;
}
server {
listen 80;
server_name www.yunjisuan.com;
location / {
root html/www;
index index.html index.htm;
}
access_log logs/access_www.log main;
}
}
// web02
[root@web02 conf]# vim /usr/local/nginx/conf/nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
log_format main '$remote_addr-$remote_user[$time_local]"$request"' '$status $body_bytes_sent "$http_referer"' '"$http_user_agent""$http_x_forwarded_for"';
server {
listen 80;
server_name bbs.yunjisuan.com;
location / {
root html/bbs;
index index.html index.htm;
}
access_log logs/access_bbs.log main;
}
server {
listen 80;
server_name www.yunjisuan.com;
location / {
root html/www;
index index.html index.htm;
}
access_log logs/access_www.log main;
}
}
完成了反向代理WWW服务后,自然很开心,但是,不久后你用其他客户端作为客户端测试时,就会发现一个问题,节点服务器对应的WWW虚拟主机的访问日志的第一个字段记录的并不是客户端的IP,而是反向代理服务器的IP,最后一个字段也是“-”!
例如:使用任意windows客户端计算机( 192.168.103.204 ),访问已经解析好代理IP的www.yunjisuan.com后,去节点服务器www服务日志查看,就会发现如下日志:
[root@web02 logs]# tail -2 /usr/local/nginx/logs/access_www.log
192.168.103.121--[29/Aug/2019:17:29:23 +0800]"GET / HTTP/1.0"200 34 "-""curl/7.29.0""-"
192.168.103.121--[29/Aug/2019:17:29:33 +0800]"GET / HTTP/1.0"200 34 "-""curl/7.29.0""-"
Web01节点服务器对应的WWW虚拟主机的访问日志的第一个字段记录的并不是客户端的IP而是反向代理服务器本身的IP(192.168.103.121),最后一个字段也是一个“-”,那么如何解决这个问题?其实很简单,同样是增加如下一行参数:
proxy_set_header X-Forwarded-For $remote_addr;
#这是反向代理时,节点服务器获取用户真实IP的必要功能配置
解决上述问题的整个Nginx代理配置为:
//lb01
[root@lb01 /]# vim /usr/local/nginx/conf/nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
upstream webpools {
#如果就是单个Server,没必要设置权重
server 192.168.103.123:80 weight=5 max_fails=1 fail_timeout=60s; #当检测次数等于1的时候,1次连续检测失败后,间隔60s再重新检测。
server 192.168.103.124:80 weight=5;
server 192.168.103.124:80 weight=5 backup; #热备机器设置
}
server {
listen 80;
server_name www.yunjisuan.com;
location / {
root html;
index index.html index.htm;
proxy_pass http://webpools;
proxy_set_header host $host; #在代理向后端服务器发送的http请求头中加入host字段信息,用于当后端服务器配置有多个虚拟主机时,可以识别代理的是哪个虚拟主机。这是节点服务器多虚拟主机时的关键配置。
proxy_set_header X-Forwarded-For $remote_addr; #在代理向后端服务器发送的http请求头中加入X-Forwarded-For字段信息,用于后端服务器程序,日志等接收记录真实用户的IP,而不是代理服务器的IP
}
}
}
重新加载Nginx反向代理服务:
[root@lb01 /]# /usr/local/nginx/sbin/nginx -s reload
特别注意,虽然反向代理已经配好了,但是节点服务器需要的访问日志如果要记录用户的真实IP,还必须进行日志格式配置,这样才能把代理传过来的X-Forwarded-For头信息记录下来,具体配置为:
// web01
[root@web01 /]# vim usr/local/nginx/conf/nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
log_format main '$remote_addr-$remote_user[$time_local]"$request"' '$status $body_bytes_sent "$http_referer"' '"$http_user_agent""$http_x_forwarded_for"';
#就是这里的“$http_x_forwarded_for”参数,如果希望在第一行显示,可以替换掉第一行的$remote_addr变量。
server {
listen 80;
server_name bbs.yunjisuan.com;
location / {
root html/bbs;
index index.html index.htm;
}
access_log logs/access_bbs.log main;
}
server {
listen 80;
server_name www.yunjisuan.com;
location / {
root html/www;
index index.html index.htm;
}
access_log logs/access_www.log main;
}
}
// web02
[root@web02 /]# vim usr/local/nginx/conf/nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
log_format main '$remote_addr-$remote_user[$time_local]"$request"' '$status $body_bytes_sent "$http_referer"' '"$http_user_agent""$http_x_forwarded_for"';
#就是这里的“$http_x_forwarded_for”参数,如果希望在第一行显示,可以替换掉第一行的$remote_addr变量。
server {
listen 80;
server_name bbs.yunjisuan.com;
location / {
root html/bbs;
index index.html index.htm;
}
access_log logs/access_bbs.log main;
}
server {
listen 80;
server_name www.yunjisuan.com;
location / {
root html/www;
index index.html index.htm;
}
access_log logs/access_www.log main;
}
}
完成Web01,Web02节点服务器的日志配置后,就可以检查了,注意,不要用curl从反向代理上检查,最好换一个客户端检查,这样才能看到效果。这里使用Windows客户端计算机(IP为192.168.103.204)访问已经解析好代理IP的www.yunjisuan.com,如下图所示:
// web01
[root@web01 /]# tail -2 /usr/local/nginx/logs/access_bbs.log
192.168.103.121--[29/Aug/2019:18:02:38 +0800]"GET / HTTP/1.0"200 34 "-""Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36""192.168.103.204"
192.168.103.121--[29/Aug/2019:18:02:42 +0800]"GET / HTTP/1.0"200 34 "-""Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36""192.168.103.204"
// web02
[root@web02 /]# tail -2 /usr/local/nginx/logs/access_bbs.log
192.168.103.121--[29/Aug/2019:18:02:41 +0800]"GET / HTTP/1.0"200 34 "-""Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36""192.168.103.204"
192.168.103.121--[29/Aug/2019:18:02:44 +0800]"GET / HTTP/1.0"200 34 "-""Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36""192.168.103.204"
其中,日志里的192.168.103.121为反向代理的IP,对应Nginx日志格式里的 r e m o t e a d d r 变 量 , 而 日 志 结 尾 的 192.168.103.204 对 应 的 时 日 志 格 式 里 的 “ remote_addr变量,而日志结尾的192.168.103.204对应的时日志格式里的“ remoteaddr变量,而日志结尾的192.168.103.204对应的时日志格式里的“http_x_forwarded_for”变量,即接收了前面反向代理配置中“proxy_set_header X-Forwarded-For $remote_addr;”参数X-Forwarded-For的IP了。
关于X-Forwarded-For的详细说明,可见http://en.wikipedia.org/wiki/X-Forwwawrded-For。下图是反向代理相关重要基础参数的总结,供同学们参考。
除了具有多虚拟主机代理以及节点服务器记录真实用户IP的功能外,Nginx软件还提供了相当多的作为反向代理和后端节点服务器对话的相关控制参数,具体见前面在讲解proxy模块时提供的图表。
相信同学们对这些参数有了一定了解了,由于参数众多,最好把这些参数放到一个配置文件里,然后用include方式包含到虚拟主机配置里,效果如下:
//lb01
# 创建配置文件
[root@lb01 /]# vim /usr/local/nginx/conf/proxy.conf
proxy_set_header host $host;
proxy_set_header x-forwarded-for $remote_addr;
proxy_connect_timeout 60;
proxy_send_timeout 60;
proxy_read_timeout 60;
proxy_buffer_size 4k;
proxy_buffers 4 32k;
proxy_busy_buffers_size 64k;
proxy_temp_file_write_size 64k;
#修改配置
[root@lb01 /]# vim /usr/local/nginx/conf/nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
upstream webpools {
#如果就是单个Server,没必要设置权重
server 192.168.103.123:80 weight=5 max_fails=1 fail_timeout=60s; #当检测次数等于1的时候,1次连续检测失败后,间隔60s再重新检测。
server 192.168.103.124:80 weight=5;
server 192.168.103.124:80 weight=5 backup; #热备机器设置
}
server {
listen 80;
server_name www.yunjisuan.com;
location / {
root html;
index index.html index.htm;
proxy_pass http://webpools;
include proxy.conf;
}
}
}
# 重新加载
[root@lb01 /]# nginx -s reload
更多Nginx反向代理参数说明:
http://nginx.org/en/docs/http/ngx_http_proxy_module.html
通过Nginx实现动静分离,即通过Nginx反向代理配置规则实现让动态资源和静态资源及其他业务分别由不同的服务器解析,以解决网站性能,安全,用户体验等重要问题。
下图为企业常见的动静分离集群架构图,此架构图适合网站前端只使用同一个域名提供服务的场景,例如,用户访问的域名是www.yunjisuan.com,然后,当用户请求www.yunjisuan.com/upload/xx地址时候,代理会分配请求到上传服务器池处理数据;当用户请求www.yunjisuan.com/static/xx地址的时候,代理会分配请求到静态服务器池请求数据;当用户请求www.yunjisuan.com/xx地址的时候,即不包含上述指定的目录地址路径时,代理会分配请求到默认的动态服务器池请求数据(注意:上面的xx表示任意路径)。
先进行企业案例需求梳理:
了解了需求后,就可以进行upstream模块服务器池的配置了。
//lb01
#static_pools为静态服务器池,有一个服务器,地址为192.168.103.123,端口为80.
upstream staticpools {
server 192.168.103.123:80 weght=1;
}
#upload_pools为上传服务器池,有一个服务器地址为192.168.103.124,端口为80.
upstream uploadpools {
server 192.168.103.124:80 weight=1;
}
#default_pools为默认的服务器池,即动态服务器池,有一个服务器,地址为192.168.103.125,端口为80.
upstream defaultpools {
server 192.168.103.125:80 weight=1;
}
#提示:需要增加一台测试Web节点Web03(ip:192.168.103.125),配置与Web01,Web02一样。
下面利用location或if语句把不同的URI(路径)请求,分给不同的服务器池处理,具体配置如下。
方案1:以location方案实现
//lb01
#将符合static的请求交给静态服务器池static_pools,配置如下:
location /static/ {
proxy_pass http://staticpools;
include proxy.conf;
}
#将符合upload的请求交给上传服务器池upload_pools,配置如下:
location /upload/ {
proxy_pass http://uploadpools;
include proxy.conf;
}
#不符合上述规则的请求,默认全部交给动态服务器池default_pools,配置如下:
location / {
proxy_pass http://defaultpools;
include proxy.conf;
}
方案2:以if语句实现。
[root@lb01 /]# vim /usr/local/nginx/conf/nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
server {
listen 80;
server_name www.yunjisuan.com;
location / {
if ($request_uri ~* "^/static/(.*)$")
{
proxy_pass http://staticpools/$1;
}
if ($request_uri ~* "^/upload/(.*)$")
{
proxy_pass http://uploadpools/$1;
}
proxy_pass http://defaultpools;
include proxy.conf;
}
}
}
重新加载配置生效,如下:
[root@lb01 /]# /usr/local/nginx/sbin/nginx -t
nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok
nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful
[root@lb01 /]# /usr/local/nginx/sbin/nginx -s reload
暂时不要立刻测试成果,为了实现上述代理的测试,还需要在Web01和Web02上做节点的测试配置,才能更好地展示测试效果。
以Web01作为static静态服务,地址端口为:192.168.103.123:80,需要事先配置一个用于测试静态的地址页面,并测试访问,确定它会返回正确结果。操作步骤如下:
// web01
[root@web01 /]# mkdir -p /usr/local/nginx/html/www/static
[root@web01 /]# echo "static_pools www" >> /usr/local/nginx/html/www/static/index.html
[root@web01 /]# mkdir -p /usr/local/nginx/html/bbs/static
[root@web01 /]# echo "static_pools bbs" >> /usr/local/nginx/html/bbs/static/index.html
[root@web01 /]# curl http://www.yunjisuan.com/static/index.html #这里的www.yunjisuan.com是解析过的Web01的本地IP
static_pools www
[root@web01 /]# curl http://bbs.yunjisuan.com/static/index.html #这里的bbs.yunjisuan.com是解析过的Web01的本地IP
static_pools bbs
#提示:测试的静态地址为http://www.yunjisuan.com/static/index.html,注意,是带static路径的地址。
以Web02作为upload上传服务,地址端口为:192.168.103.124:80,需要事先配置一个用于测试上传服务的地址页面,并测试访问,确定它会返回正确结果。操作步骤如下:
// web02
[root@web02 ~]# mkdir -p /usr/local/nginx/html/www/upload/
[root@web02 ~]# echo "upload_pools www" >> /usr/local/nginx/html/www/upload/index.html
[root@web02 ~]# mkdir -p /usr/local/nginx/html/bbs/upload
[root@web02 ~]# echo "upload_pools bbs" >> /usr/local/nginx/html/bbs/upload/index.html
[root@web02 ~]# curl http://www.yunjisuan.com/upload/index.html #这里的www.yunjisuan.com是解析过的Web02的本地IP
upload_pools www
[root@web02 ~]# curl http://bbs.yunjisuan.com/upload/index.html #这里的bbs.yunjisuan.com是解析过的Web02的本地IP
upload_pools bbs
#提示:测试的上传地址为http://www.yunjisuan.com/upload/index.html,注意,是带upload路径的地址。
在Web03作为动态服务节点,地址端口为192.168.103.125:80,同样需要事先配置一个默认的地址页面,并测试访问,确定它会返回正确结果。操作步骤如下:
[root@web03 /]# cd /usr/local/nginx/html/www
[root@web03 www]# echo "default_pools" > index.html
[root@web03 www]# curl http://www.yunjisuan.com
default_pools
以上准备了上台Web节点服务器,分别加入到了upstream定义的不同服务器池,代表三组不同的业务集群组,从本机通过hosts解析各自的域名,然后测试访问,其地址与实际访问的内容输出请对照下表:
使用客户端计算机访问测试时,最好选用集群以外的机器,这里先在浏览器客户端的hosts文件里把www.yunjisuan.com解析到Nginx反向代理服务器的IP,然后访问上述URL,看代理是不是把请求正确地转发到了指定的服务器上。如果可以得到与上表对应的内容,表示配置的Nginx代理分发的完全正确,因为如果分发请求到错误的机器上就没有对应的URL页面内容,输出会是404错误。
[root@lb01 /]# curl http://www.yunjisuan.com/static/index.html
static_pools www
[root@lb01 /]# curl http://www.yunjisuan.com/upload/index.html
upload_pools www
[root@lb01 /]# curl http://www.yunjisuan.com
default_pools
实际配置如下:
// lb01
[root@lb01 /]# vim /usr/local/nginx/conf/nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
# static_pools为静态服务器池,有一个服务器,地址为192.168.103.123,端口为80.
upstream staticpools {
server 192.168.103.123:80 ;
}
# upload_pools为上传服务器池,有一个服务器地址为192.168.103.124,端口为80.
upstream uploadpools {
server 192.168.103.124:80 ;
}
# default_pools为默认的服务器池,即动态服务器池,有一个服务器,地址为192.168.103.125,端口为80.
upstream defaultpools {
server 192.168.103.125:80 ;
}
server {
listen 80;
server_name www.yunjisuan.com;
location /static/ {
proxy_pass http://staticpools;
include proxy.conf;
}
location /upload/ {
proxy_pass http://uploadpools;
include proxy.conf;
}
location / {
proxy_pass http://defaultpools;
include proxy.conf;
}
}
}
在企业中,为了让不同的客户端设备用户访问有更好的体验,需要在后端架设不同服务器来满足不同的客户端访问,例如:移动客户端访问网站,就需要部署单独的移动服务器及程序,体验才能更好,而且移动端还分苹果,安卓,Ipad等,在传统的情况下,一般用下面的办法解决这个问题。
在常规4层负载均衡架构下,可以使用不同的域名来实现这个需求,例如,人为分配好让移动端用户访问wap.yunjisuan.com,PC客户端用户访问www.yunjisuan.com,通过不同域名来引导用户到指定的后端服务器,该解决方案的架构图如下:
此解决方案的最大问题就是不同客户端的用户要记住对应的域名!而绝大多数用户只会记住www.yunjisuan.com,不会记住wap.yunjisuan.com,这样一来就会导致用户体验不是很好。有没有办法让所有客户端用户只访问一个统一的www.yunjisuan.com这个地址,还能让不同客户端设备都能有更好的访问体验呢?当然有!那就是下面的第7层负载均衡解决方案。
在第7层负载均衡架构下,就可以不需要人为拆分域名了,对外只需要用一个域名,例如www.yunjisuan.com,通过获取用户请求中的设备信息(利用$http_user_agent获取),根据这些信息转给后端合适的服务器处理,这个方案最大好处就是不需要让用户记忆多个域名了,用户只需要记住主网站地址www.yunjisuan.com,剩下的由网站服务器处理,这样的思路大大地提升了用户访问体验,这是当前企业网站非常常用的解决方案。
下面我们就来讲解此方案,下图描述了上述解决方案相应的架构逻辑图:
这里还是使用static_pools,upload_pools作为本次实验的后端服务器池。下面先根据计算机客户端浏览器的不同设置对应的匹配规则。(由于没有合适的实验验证环境,这里仅作需求实现的细节讲解)
//lb01
location / {
if ($http_user_agent ~* "MSIE")
# 如果请求的浏览器为微软IE浏览器(MSIE),则让请求由static_pools池处理
{
proxy_pass http://staticpools;
}
if ($http_user_agent ~* "Chrome")
# 如果请求的浏览器为谷歌浏览器(Chrome),则让请求由upload_pools池处理
{
proxy_pass http://uploadpools;
}
# 其他客户端,由default_pools处理
proxy_pass http://defaultpools;
include proxy.conf;
}
除了针对浏览器外,上述“$http_user_agent”变量也可针对移动端,比如安卓,苹果,Ipad设备进行匹配,去请求指定的服务器,具体细节配置如下:
//lb01
location / {
if ($http_user_agent ~* "android")
{
proxy_pass http://android_pools; #这里是android服务器池
}
if ($http_user_agent ~* "iphone")
{
proxy_pass http://iphone_pools; #这里是iphone服务器池
}
proxy_pass http://pc_pools; #这里是默认的pc服务器池
include extra/proxy.conf;
}
192.168.0.110--[28/Jul/2017:02:12:10 -0400]"GET / HTTP/1.1"200 18 "-""Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 10.0; WOW64; Trident/7.0; .NET4.0C; .NET4.0E; .NET CLR 2.0.50727; .NET CLR 3.0.30729; .NET CLR 3.5.30729)""-"
#PCwindows访问日志
192.168.0.106--[28/Jul/2017:02:12:22 -0400]"GET / HTTP/1.1"200 18 "-""Mozilla/5.0 (iPhone; CPU iPhone OS 10_3_3 like Mac OS X) AppleWebKit/603.3.8 (KHTML, like Gecko) Version/10.0 Mobile/14G60 Safari/602.1""-"
#苹果iphone6手机设备访问的日志。
除了根据URI路径及user_agent转发外,还可以实现根据文件扩展名进行转发(这里仅以细节配置作为讲解内容,如需测试请同学们自行实验)
#先看看location方法的匹配规则,如下:
location ~ .*\.(gif|jpg|jpeg|png|bmp|swf|css|js)$ {
proxy_pass http://static_pools;
include proxy.conf;
}
#下面是if语句方法的匹配规则:
if ($request_uri ~* ".*\.(php|php5)$")
{
proxy_pass http://php_server_pools;
}
if ($request_uri ~* ".*\.(jsp|jsp*|do|do*)$")
{
proxy_pass http://java_server_pools;
}
可根据扩展名实现资源的动静分离访问,如图片,视频等请求静态服务器池,PHP,JSP等请求动态服务器池。
location ~ .*\.(gif|jpg|jpeg|png|bmp|swf|css|js)$ {
proxy_pass http://static_pools;
include proxy.conf;
}
location ~ .*\.(php|php3|php5)$ {
proxy_pass http://dynamic_pools;
include proxy.conf
}
在开发无法通过程序实现动静分离的时候,运维可以根据资源实体进行动静分离,而不依赖于开发,具体实现策略是先把后端的服务器分成不同的组。注意,每组服务器的程序都是相同的,因为开发没有把程序拆开,分组后,在前端代理服务器上通过讲解过的路径,扩展名进行规则匹配,从而实现请求的动静分离。
淘宝技术团队开发了一个Tengine(Nginx的分支)模块Nginx_upstream_check_module,用于提供主动式后端服务器健康检查。通过它可以检测后端realserver的健康状态,如果后端realserver不可用,则所有的请求就不会转发到该节点上。
Tengine原生支持这个模块,而Nginx则需要通过打补丁的方式将该模块添加到Nginx中。补丁下载地址:https://github.com/yaoweibin/nginx_upstream_check_module。下面介绍如何使用这个模块。
#系统已经安装了nginx-1.10.2软件
[root@lb01 ~]# /usr/local/nginx/sbin/nginx -V
nginx version: nginx/1.10.2
#下载补丁包
[root@lb01 ~]# wget https://codeload.github.com/786744873/nginx_upstream_check_module/zip/master
[root@lb01 ~]# unzip master
[root@lb01 ~]# ls
anaconda-ks.cfg install.log install.log.syslog master nginx-1.10.2.tar.gz nginx_upstream_check_module-master
[root@lb01 nginx-1.10.2]# mv ~/nginx_upstream_check_module-master /usr/src/
#因为是对源程序打补丁,所以还需要Nginx源程序
[root@lb01 ~]# cd /usr/src/nginx-1.10.2/
[root@lb01 nginx-1.10.2]# patch -p0 < /usr/src/nginx_upstream_check_module-master/check_1.9.2+.patch
patching file src/http/modules/ngx_http_upstream_hash_module.c
patching file src/http/modules/ngx_http_upstream_ip_hash_module.c
patching file src/http/modules/ngx_http_upstream_least_conn_module.c
patching file src/http/ngx_http_upstream_round_robin.c
patching file src/http/ngx_http_upstream_round_robin.h
#备份源安装程序
[root@lb01 nginx-1.10.2]# cd /usr/local/
[root@lb01 local]# ls
bin etc games include lib lib64 libexec nginx sbin share src
[root@lb01 local]# mv nginx{,.ori}
[root@lb01 local]# ls
bin etc games include lib lib64 libexec nginx.ori sbin share src
[root@lb01 local]# cd /usr/src/nginx-1.10.2/
#重新进行编译,编译的参数要和以前一致,最后加上 --add-module=/usr/src/nginx_upstream_check_module-master/
[root@lb01 nginx-1.10.2]# ./configure --prefix=/usr/local/nginx --user=nginx --group=nginx --with-http_ssl_module --with-http_stub_status_module --add-module=/usr/src/nginx_upstream_check_module-master/
[root@lb01 local]# /usr/local/nginx/sbin/nginx -V
nginx version: nginx/1.10.2
built by gcc 4.4.7 20120313 (Red Hat 4.4.7-4) (GCC)
built with OpenSSL 1.0.1e-fips 11 Feb 2013
TLS SNI support enabled
configure arguments: --prefix=/usr/local/nginx --user=nginx --group=nginx --with-http_ssl_module --with-http_stub_status_module --add-module=/usr/src/nginx_upstream_check_module-master/
#拷贝源配置文件到当前Nginx的安装目录下
[root@lb01 local]# pwd
/usr/local
[root@lb01 local]# cp nginx.ori/conf/nginx.conf nginx/conf/
cp: overwrite `nginx/conf/nginx.conf'? y
[root@lb01 local]# cp nginx.ori/conf/proxy.conf nginx/conf/
[root@lb01 local]# /usr/local/nginx/sbin/nginx -t
nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok
nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful
如下:
[root@lb01 local]# vim nginx/conf/nginx.conf
worker_processes 1;
events {
worker_connections 1024;
}
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
# static_pools为静态服务器池,有一个服务器,地址为192.168.103.123,端口为80.
upstream staticpools {
server 192.168.103.123:80 ;
check interval=3000 rise=2 fall=5 timeout=1000 type=http; #对static服务器池开启健康监测
}
# upload_pools为上传服务器池,有一个服务器地址为192.168.103.124,端口为80.
upstream uploadpools {
server 192.168.103.124:80 ;
check interval=3000 rise=2 fall=5 timeout=1000 type=http; #对static服务器池开启健康监测
}
# default_pools为默认的服务器池,即动态服务器池,有一个服务器,地址为192.168.103.125,端口为80.
upstream defaultpools {
server 192.168.103.125:80 ;
check interval=3000 rise=2 fall=5 timeout=1000 type=http; #对static服务器池开启健康监测
}
server {
listen 80;
server_name www.yunjisuan.com;
location / {
if ($http_user_agent ~* "MSIE")
#如果请求的浏览器为微软IE浏览器(MSIE),则让请求由static_pools池处理
{
proxy_pass http://staticpools;
}
if ($http_user_agent ~* "Chrome")
#如果请求的浏览器为谷歌浏览器(Chrome),则让请求由upload_pools池处理
{
proxy_pass http://uploadpools;
}
proxy_pass http://defaultpools;
include proxy.conf;
}
location /status {
check_status; #启动健康检查模块
access_log off; #关闭此location的访问日志记录
}
}
}
注意此处必须重启Nginx,不能重新加载
[root@lb01 local]# killall nginx
[root@lb01 local]# /usr/local/nginx/sbin/nginx
[root@lb01 local]# netstat -antup | grep nginx
tcp 0 0 0.0.0.0:80 0.0.0.0:* LISTEN 20908/nginx: master
check interval=3000 rise=2 fall=5 timeout=1000 type=http;
上面配置的意思时,对static_pools这个负载均衡条目中的所有节点,每隔3秒检测一次,请求2次正常则标记realserver状态为up,如果检测5次都失败,则标记realserver的状态为down,超时时间为1秒,检查的协议是HTTP。
详细用法见官网:http://tengine.taobao.org/document_cn/http_upstream_check_cn.html
访问页面时,显示如下图所示:
关闭任意一个RS节点后(3个Web服务器任选一个关闭nginx服务):
当Nginx接收后端服务器返回proxy_next_upstream参数定义的状态码时,会将这个请求转发给正常工作的后端服务器,例如500,502,503,504,此参数可以提升用户的访问体验,具体配置如下:
server {
listen 80;
server_name www.yunjisuan.com;
location / {
proxy_pass http://static_pools;
proxy_next_upstream error timeout invalid_header http_500 http_502 http_503 http_504;
include proxy.conf;
}
}
server {
listen 9202;
server_name localhost;
location / {
proxy_redirect off;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_pass http://192.168.0.37:9200;
}
}
转自 https://www.cnblogs.com/wyt007/p/11425197.html