一:什么是nginx
Nginx是一款高性能的http服务器/反向代理服务器及电子邮件(IMAP/POP3)代理服务器。由俄罗斯的程序设计师Igor Sysoev所开发,官方测试nginx能够支支撑5万并发链接,并且cpu、内存等资源消耗却非常低,运行非常稳定。
二:应用场景1、静态资源服务器。访问一些静态网页,jsp,css,图片等
2、虚拟主机。可以实现在一台服务器虚拟出多个网站。例如个人网站使用的虚拟主机。
3、反向代理,负载均衡。当网站的访问量达到一定程度后,单台服务器不能满足用户的请求时,需要用多台服务器集群可以使用nginx做反向代理。并且多台服务器可以平均分担负载,不会因为某台服务器负载高宕机而某台服务器闲置的情况。
三:安装(安装环境为centos7)
1:下载安装包
wget http://nginx.org/download/nginx-1.10.2.tar.gz
2:在安装nginx之前有一些依赖,所以要先安装依赖(批量下载)
yum -y install gcc zlib zlib-devel pcre-devel openssl openssl-devel
安装这些依赖的作用:
2.1、nginx是用c写的,所以需要安装gcc的环境。yum install gcc-c++
2.2、第三方的开发包。
n PCRE
PCRE(Perl Compatible Regular Expressions)是一个Perl库,包括perl 兼容的正则表达式库。nginx的http模块使用pcre来解析正则表达式,所以需要在linux上安装pcre库。
yum install -y pcre pcre-devel
注:pcre-devel是使用pcre开发的一个二次开发库。nginx也需要此库。
n zlib
zlib库提供了很多种压缩和解压缩的方式,nginx使用zlib对http包的内容进行gzip,所以需要在linux上安装zlib库。
yum install -y zlib zlib-devel
n openssl
OpenSSL 是一个强大的安全套接字层密码库,囊括主要的密码算法、常用的密钥和证书封装管理功能及SSL协议,并提供丰富的应用程序供测试或其它目的使用。
nginx不仅支持http协议,还支持https(即在ssl协议上传输http),所以需要在linux安装openssl库。
yum install -y openssl openssl-devel
3:解压你的nginx安装包tar -zxvf nginx-1.10.2.tar.gz
4:进入到解压后的nginx目录
cd nginx-1.10.2
5:开始编译
./configure
6:make7:make install
8:安装完成后,通过whereis nginx这个命令,可以知道安装到哪个位置,得知在/usr/local/nginx下
三:nginx操作
1:进入到安装目录的sbin目录下
cd /usr/local/nginx/sbin
2:启动nginx
./nginx
查看是否启动
ps -ef | grep nginx
查看可以知道master和work两个进程
3:停止nginx
./nginx -s stop
推荐使用
./nginx -s quit
4:重启nginx;有时候我们配置文件改了,就可以直接使用重启命令,重新读取配置文件
./nginx -s reload
在网页上直接输入你的ip访问nginx,nginx的默认端口是80;同时记得关闭你的防火墙
四:配置详解
打开你的conf目录下的nginx.conf配置文件
vim conf/nginx.conf
nginx.conf配置文件,基本就分为以下几块:
main events { .... } http { .... upstream myproject { ..... } server { .... location { .... } } server { .... location { .... } } .... }
nginx配置文件主要分为六个区域:
下面依次来看下具体内容
下面时一个main区域,他是一个全局的设置:
user nobody nobody; worker_processes 2; error_log /usr/local/var/log/nginx/error.log notice; pid /usr/local/var/run/nginx/nginx.pid; worker_rlimit_nofile 1024;
user 来指定Nginx Worker进程运行用户以及用户组,默认由nobody账号运行。
worker_processes来指定了Nginx要开启的子进程数。每个Nginx进程平均耗费10M~12M内存。根据经验,一般指定1个进程就足够了,如果是多核CPU,建议指定和CPU的数量一样的进程数即可。我这里写2,那么就会开启2个子进程,总共3个进程。
error_log用来定义全局错误日志文件。日志输出级别有debug、info、notice、warn、error、crit可供选择,其中,debug输出日志最为最详细,而crit输出日志最少。
pid用来指定进程id的存储文件位置。
worker_rlimit_nofile用于指定一个nginx进程可以打开的最多文件描述符数目,这里是65535,需要使用命令“ulimit -n 65535”来设置。
events模块来用指定nginx的工作模式和工作模式及连接数上限,一般是这样:
events { use epoll; #Linux平台 worker_connections 1024; }
use用来指定Nginx的工作模式。Nginx支持的工作模式有select、poll、kqueue、epoll、rtsig和/dev/poll。其中select和poll都是标准的工作模式,kqueue和epoll是高效的工作模式,不同的是epoll用在Linux平台上,而kqueue用在BSD系统中,对于Linux系统,epoll工作模式是首选。
worker_connections用于定义Nginx每个进程的最大连接数,即接收前端的最大请求数,默认是1024。最大客户端连接数由worker_processes和worker_connections决定,即Max_clients=worker_processes*worker_connections,在作为反向代理时,Max_clients变为:Max_clients = worker_processes * worker_connections/4。 进程的最大连接数受Linux系统进程的最大打开文件数限制,在执行操作系统命令“ulimit -n 65536”后worker_connections的设置才能生效。
http模块可以说是最核心的模块了,它负责HTTP服务器相关属性的配置,它里面的server和upstream子模块,至关重要,等到反向代理和负载均衡以及虚拟目录等会仔细说。
http{ include mime.types; default_type application/octet-stream; log_format main '$remote_addr - $remote_user [$time_local] "$request" ' '$status $body_bytes_sent "$http_referer" ' '"$http_user_agent" "$http_x_forwarded_for"'; access_log /usr/local/var/log/nginx/access.log main; sendfile on; tcp_nopush on; tcp_nodelay on; keepalive_timeout 10; #gzip on; upstream myproject { ..... } server { .... } }
下面详细介绍下这段代码中每个配置选项的含义。
include 来用设定文件的mime类型,类型在配置文件目录下的mime.type文件定义,来告诉nginx来识别文件类型。
default_type设定了默认的类型为二进制流,也就是当文件类型未定义时使用这种方式,例如在没有配置asp 的locate 环境时,Nginx是不予解析的,此时,用浏览器访问asp文件就会出现下载了。
log_format用于设置日志的格式,和记录哪些参数,这里设置为main,刚好用于access_log来纪录这种类型。
main的类型日志如下:也可以增删部分参数。
127.0.0.1 - - [21/Apr/2015:18:09:54 +0800] "GET /index.php HTTP/1.1" 200 87151 "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.76 Safari/537.36"
access_log
用来纪录每次的访问日志的文件地址,后面的main是日志的格式样式,对应于log_format的main。
sendfile参数用于开启高效文件传输模式。将tcp_nopush和tcp_nodelay两个指令设置为on用于防止网络阻塞。
keepalive_timeout设置客户端连接保持活动的超时时间。在超过这个时间之后,服务器会关闭该连接。
sever 模块是http的子模块,它用来定一个虚拟主机,我们先讲最基本的配置,这些在后面再讲。
我们看一下一个简单的server 是如何做的?
server { listen 8080; server_name localhost 192.168.12.10 www.yangyi.com; # 全局定义,如果都是这一个目录,这样定义最简单。 root /Users/yangyi/www; index index.php index.html index.htm; charset utf-8; access_log usr/local/var/log/host.access.log main; aerror_log usr/local/var/log/host.error.log error; .... }
server标志定义虚拟主机开始。
listen用于指定虚拟主机的服务端口。
server_name用来指定IP地址或者域名,多个域名之间用空格分开。
root 表示在这整个server虚拟主机内,全部的root web根目录。注意要和locate {}下面定义的区分开来。
index 全局定义访问的默认首页地址。注意要和locate {}下面定义的区分开来。
charset用于设置网页的默认编码格式。
access_log用来指定此虚拟主机的访问日志存放路径,最后的main用于指定访问日志的输出格式。
location模块是nginx中用的最多的,也是最重要的模块了,什么负载均衡啊、反向代理啊、虚拟域名啊都与它相关。慢慢来讲:
location 根据它字面意思就知道是来定位的,定位URL,解析URL,所以,它也提供了强大的正则匹配功能,也支持条件判断匹配,用户可以通过location指令实现Nginx对动、静态网页进行过滤处理。像我们的php环境搭建就是用到了它。
我们先来看这个,设定默认首页和虚拟机目录。
location / { root /Users/yangyi/www; index index.php index.html index.htm; }
location /表示匹配访问根目录。
root指令用于指定访问根目录时,虚拟主机的web目录,这个目录可以是相对路径(相对路径是相对于nginx的安装目录)。也可以是绝对路径。
#反向代理配置 location /itcast/ { proxy_pass http://127.0.0.1:12345; proxy_set_header X-real-ip $remote_addr; proxy_set_header Host $http_host; } #采用uwsgi方式 location /python/ { include uwsgi_params; uwsgi_pass 127.0.0.1:33333; } #访问nginx本机目录的文件 location / { root /home/itcast/xwp/itcast/; index index.html index.htm; } location /static/ { alias /var/static/; }
upstream 模块负债负载均衡模块,通过一个简单的调度算法来实现客户端IP到后端服务器的负载均衡。我先学习怎么用,具体的使用实例以后再说。
upstream test.com{ ip_hash; server 192.168.123.1:80; server 192.168.123.2:80 down; server 192.168.123.3:8080 max_fails=3 fail_timeout=20s; server 192.168.123.4:8080; }
在上面的例子中,通过upstream指令指定了一个负载均衡器的名称test.com。这个名称可以任意指定,在后面需要的地方直接调用即可。
里面是ip_hash这是其中的一种负载均衡调度算法。
Nginx的负载均衡模块目前支持4种调度算法:
在HTTP Upstream模块中,可以通过server指令指定后端服务器的IP地址和端口,同时还可以设定每个后端服务器在负载均衡调度中的状态。常用的状态有:
down,表示当前的server暂时不参与负载均衡。
backup,预留的备份机器。当其他所有的非backup机器出现故障或者忙的时候,才会请求backup机器,因此这台机器的压力最轻。
max_fails,允许请求失败的次数,默认为1。当超过最大次数时,返回proxy_next_upstream 模块定义的错误。
fail_timeout,在经历了max_fails次失败后,暂停服务的时间。max_fails可以和fail_timeout一起使用。
注意 当负载调度算法为ip_hash时,后端服务器在负载均衡调度中的状态不能是weight和backup。
备注: nginx的worker_rlimit_nofile达到上限时,再有客户端链接报502错误. 用了log_format指令设置了日志格式之后,需要用access_log指令指定日志文件的存放路径.
正向代理,也就是传说中的代理,他的工作原理就像一个跳板,简单的说,我是一个用户,我访问不了某网站,但是我能访问一个代理服务器,这个代理服务器呢,他能访问那个我不能访问的网站,于是我先连上代理服务器,告诉他我需要那个无法访问网站的内容,代理服务器去取回来,然后返回给我。 从网站的角度,只在代理服务器来取内容的时候有一次记录,有时候并不知道是用户的请求,也隐藏了用户的资料,这取决于代理告不告诉网站。结论就是,正向代理 是一个位于客户端和原始服务器(origin server)之间的服务器,为了从原始服务器取得内容,客户端向代理发送一个请求并指定目标(原始服务器),然后代理向原始服务器转交请求并将获得的内容返回给客户端。客户端必须要进行一些特别的设置才能使用正向代理。
反向代理(Reverse Proxy)方式是指以代理服务器来接受internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就表现为一个反向代理服务器。
从用途上来讲:
正向代理的典型用途是为在防火墙内的局域网客户端提供访问Internet的途径。 正向代理还可以使用缓冲特性减少网络使用率。反向代理的典型用途是将防火墙后面的服务器提供给Internet用户访问。 反向代理还可以为后端的多台服务器提供负载平衡,或为后端较慢的服务器提供缓冲服务。 另外,反向代理还可以启用高级URL策略和管理技术,从而使处于不同web服务器系统的web页面同时存在于同一个URL空间下。
proxy_pass
proxy_pass URL; 配置块 location if 此配置将当前请求代理到URL参数指定的服务器上,URL可以是主机名或者IP地址加PORT的形式 proxy_pass http://localhost:8000; 也可以结合负载均衡实用<负载均衡会说明这种情况> 也可以吧HTTP转换成HTTPS proxy_pass http://192.168.0.1; 默认情况反向代理不转发请求中的Host头部,如果需呀设置抓发头部 则 proxy_set_header Host $host;
proxy_method
proxy_method method_name; 配置块 http server location 此配置项表示转发时的协议方法名: proxy_method POST; 那么客户端发来的GET请求在转发时方法改为POST;
proxy_hide_header
proxy_hide_header header1; 配置块 http server location; Nginx会将上游服务器的响应转发给客户端,但默认不转发HTTP头部字段(Date Server X-Pad X-Accel-* ) 使用proxy_hide_header可以指定任意头部不能被转发 proxy_hide_header Cache-Control; proxy_hide_header MicrosoftOfficeWebServer;
proxy_pass_header
proxy_pass_header header1; 配置块 http server location 功能与 proxy_hide_header相反,是设置哪些头部允许转发. proxy_pass_header X-Accel-Redirect;
proxy_pass_request_body
proxy_pass_request_body off|on; 默认 on 配置块 http server location; 确定上游服务器是否向上游服务器转发HTTP包体
proxy_pass_request_header
proxy_pass_request_header on | off; 默认on 配置块 http server location 确定是否转发HTTP头部
proxy_redirect
proxy_redirect [default | off |redirect |replacement] 默认default 配置块 http server location 当上游服务响应时重定向或刷新(HTTP 301 302),proxy_redirect可以重设HTTP头部的location或refresh字段 proxy_redirect http://locahost:8000/two/ http://frontend/one/; 上游响应302,location是URI是http://locahost:8000/two/some/uri/ 那是实际转发给客户端的是 http://frontend/one/some/uri/; 可以使用前面提到的ngx_http_core_module模块提供的变量 proxy_redirect http://locahost:8000/two/ http://$host:server_port/; 可以省略replacement参数的主机名部分,这时候用虚拟主机名填充 proxy_redirect http://locahost:8000/two/ /one/; 使用off参数的时候,将使location和refresh的字段维持不变 proxy_redirect off; 如果使用的 proxy_redirect default; 下面两种配置是等效的 location /{ proxy_pass http://upstream:port/two/; proxy_redirect default; } location /{ proxy_pass http://upstream:port/two/; proxy_redirect http://upstream:port/two/ /one/; }
proxy_next_upstream
proxy_next_upstream [error |timeout |invalid_header |http_500 |http_502~504 |http_404 | off] 默认 proxy_next_upstream error timeout; 配置块 http server location 此配置表示上游一台服务器转发请求出现错误时,继续换一套服务器处理这个请求 其参数用来说明在那些情况下继续选择下一台上游服务器转发请求. error 向上游发起连接 发送请求 读取响应时出错 timeout 发送请求或读取响应时出错 invalid_header 上游服务器发送的响应时不合法 http_500 上游响应500 http_502 上游响应502 http_503 上游响应503 http_504 上游响应504 http_404 上游响应404 off 关闭proxy_next_upstream功能 只要一出错就选择另外一台上游再次出发 Nginx反向代理模块中还提供很多配置,如设置连接的超时时间,临时文件如何存储,如何缓存上游服务器响应等功能.
可以通过阅读 ngx_http_proxy_module了解更多详细情况
#sudo vim /usr/local/nginx/conf/nginx.conf server { listen 80; server_name localhost; location / { #保证代理机器能访问到 下面的机器并装有nginx 在主机号为100的机器上有响应网页 proxy_pass http://192.168.1.100; root html; index index.html index.htm; } } sudo /usr/local/nginx/sbin/nginx -s reload
加一些判断条件 获取到 对方请求的主机 防止别人代理到自己的主机上
负载均衡是由多台服务器以对称的方式组成一个服务器集合,每台服务器都具有等价的地位,都可以单独对外提供服务而无须其他服务器的辅助。通过某种负载分担技术,将外部发送来的请求按照事先设定分配算法分配到对称结构中的某一台服务器上,而接收到请求的服务器独立地回应客户的请求。
均衡负载能够平均分配客户请求到服务器列阵,籍此提供快速获取重要数据,解决大量并发访问服务问题。
upstream块
upstream name {...} 配置块 http upstream块定义一个上游服务器的集群,便于反向代理中的proxy_pass使用 upstream mynet{ server www.wopai1.com; server www.wopai2.com; server www.wopai3.com; } server { location /{ proxy_pass http://mynet; } }
server
server name [paramenters] 配置块upstream server配置项指定了一台上游服务器的名字,可以是域名 IP地址端口 UNIX句柄 weight= number;设置向这台服务器转发的权重,默认为1 max_fails=number;该选项域fail_timeout配合使用 指在fail_timeout时间段内如果转发上游失败超过number次就认为当前的fail_timeout时间内 这台服务器不可用,max_fails默认为1 如果设置为0 表示不检查失败次数 fail_timeout=time; fail_timeout表示该时间内转发多少次失败后就认为上游不可用.默认10s down 表示上游服务器永久下线,只能在ip_hash配置时才有效 backup 在ip_hash配置时无效.只有所有非备份机都失败,才向上游备份服务器转发请求. upstream mynet{ server www.wopai1.com weight=5; server www.wopai2.com:8081 max_fails=3 fail_timeout=300s; server www.wopai2.com down; }
ip_hash
配置块 upstream 希望来自某一个用户的请求始终落在固定的一台服务器上进行处理. 根据客户端的IP散列计算出一个key,将key按照upstream集群中的上游服务器进行取模,求得的值对应的主机接收转发请求. ip_hash不可以与weight同时使用 如果upstream配置中有一台服务器暂时不可用,不能直接删除该配置,而应该使用down标识. upstream mynet{ ip_hash; server www.wowpai1.top; server www.wowpai2.top; server www.wowpai3.top down; }
例子,服务器负载均衡基本配置,nginx中可以进行负载均衡的相关设置:
upstream my.net{ #my.net是自定义的命名 在server结构中引用即可 #代理服务器为 两台机器192.168.22.136 192.168.22.147做负载均衡操作 #两台机器上 可以跑apache负载功能更为强大的网页相关任务 #max_fails 表示尝试出错最大次数 即可认为该服务器 在fail_timeout时间内不可用 # server servername:port servername可以写主机名 或者点分式IP server 192.168.22.136:80 max_fails=1 fail_timeout=300s; server 192.168.22.147:80 max_fails=1 fail_timeout=300s; } server { listen 80; server_name localhost; location / { #upstream 块名 proxy_pass http://my.net; root html; index index.html index.htm; }
动手开始配置才能慢慢上手nginx配置和使用。