(1)nginx在启动时,会解析配置文件,得到需要监听的端口与ip地址;然后在nginx的master进程里面,先初始化好这个监控的socket,再进行listen;然后再fork出多个子进程出来, 子进程会竞争accept新的连接。
(2)此时,客户端就可以向nginx发起连接了。当客户端与nginx进行三次握手,与nginx建立好一个连接后;
(3)此时,某一个子进程会accept成功,然后Nginx创建对连接的封装,即ngx_connection_t结构体。接着,根据事件调用相应的事件处理模块,如http模块与客户端进行数据的交换。
(4)最后,nginx或客户端来主动关掉连接,到此,一个连接就完成了。
(1)例如Apache服务器的工作原理,创建多个进程或线程,而每个进程或线程都会为其分配cpu和内存,但是并发过大会榨干服务器资源。由于web server的工作性质决定了每个request的大部份生命都是在网络传输中,实际上花费在server机器上的时间片不多。这是几个进程就解决高并发的秘密所在。即webserver刚好属于网络io密集型应用,不算是计算密集型。
(2)所以Nginx,采用单线程异步非阻塞处理请求,运用epoll模型,提供了一个队列,排队解决,不会为每个请求分配cpu和内存资源,节省了大量资源,同时也减少了大量的CPU的上下文切换。所以才使得Nginx支持更高的并发。
(3)Nginx会有一个master主进程,一个master对应多个worker工作进程,每个worker工作进程可以处理多个请求,每进来一个request,会有一个worker进程去处理。但不是全程的处理,处理到可能发生阻塞的地方,比如向后端服务器转发request,并等待请求返回。那么,这个处理的worker继续处理其他请求,而一旦后端服务器返回了,就会触发这个事件,worker才会来接手,这个request才会接着往下走。
1、 解压:
1)解压tar包: tar zxf nginx-1.15.7.tar.gz
2)隐藏nginx版本,防止被攻击:vim nginx-1.15.7/src/core/nginx.h
nginx-1.15.9目录里的内容
1)auto目录:里面有4个子目录,cc是编译使用的,os是判断操作系统类型的,其他都是辅助configure编译的,也就是操作系统有什么特性供nginx使用
2)CHANGES:各版本的改变,bug修复等信息;CHANGES.ru:nginx作者是俄罗斯人,这是俄罗斯版本
3)conf: 为了方便运维配置,conf目录里有示例文件,安装好后会拷贝到安装目录
4)configure
5)contrib:提供nginx语法检测字体
cp -r contrib/vim/* ~/.vim ##家目录下如果没有.vim目录,手动新建
6)html:默认发布目录,50x.html是报500错误时的页面
7) src:源码目录
修改文件 /nginx-1.15.9/src/core/nginx.h
#define NGINX_VER "nginx/" NGINX_VERSION
改为:
#define NGINX_VER "nginx/"
3) 在Nginx源码/auto/cc/gcc文件中: vim auto/cc/gcc
# debug
#CFLAGS="$CFLAGS -g" ##本行注释掉,关闭debug日志模式,
2、编译安装nginx
1)安装gcc编译器和openssl-devel: yum install gcc openssl-devel -y
2)在 /root/nginx/nginx-1.15.9 目录下编译:
./configure \
###自定义配置:
--prefix=/usr/local/nginx \
--pid-path=/var/run/nginx/nginx.pid \
--lock-path=/var/lock/nginx.lock \
--error-log-path=/var/log/nginx/error.log \
--http-log-path=/var/log/nginx/access.log \
--with-http_gzip_static_module \
--http-client-body-temp-path=/var/temp/nginx/client \
--http-proxy-temp-path=/var/temp/nginx/proxy \
--http-fastcgi-temp-path=/var/temp/nginx/fastcgi \
--http-uwsgi-temp-path=/var/temp/nginx/uwsgi \
--http-scgi-temp-path=/var/temp/nginx/scgi
--prefix=PATH
## 指定nginx的安装目录。默认 /usr/local/nginx
--with-http_realip_module
##通过这个模块允许我们改变客户端请求头中客户端IP地址值(例如X-Real-IP 或 X-Forwarded-For)
##意义在于能够使得后台服务器记录原始客户端的IP地址
--with-http_ssl_module
##使用https协议模块。默认情况下,该模块没有被构建。前提是openssl与openssl-devel已安装
--without-http_rewrite_module
##perl正则表达式使用在location指令和ngx_http_rewrite_module模块中。
发现报错:
原因:缺少依赖性:gd-devel-2.0.35-26.el7.x86_64.rpm(缺什么装什么)
3) 安装:yum install gd-devel-2.0.35-26.el7.x86_64.rpm,再次编译。
4)make && make install 安装
3、启动脚本做软链接: ln -s /usr/local/nginx/sbin/nginx /usr/local/sbin/
nginx -t ##检测配置文件语法
nginx ##启动nginx
4、修改配置
1)查看nginx的默认配置文件:vim //usr/local/nginx/conf/nginx.conf
2)修改用户,让nginx以nginx用户和用户组启动。
3)检测配置文件语法 :nginx -t 修改了nginx用户和组后检测会报错,需要手动创建nginx用户
4)添加nginx用户:useradd nginx
,此时就不报错了。
useradd -s /sbin/nologin -M -d /usr/local/nginx/ nginx
创建用户nginx: [error] invalid PID number "" in "/usr/local/nginx/logs/nginx.pid"
#解决:删除/usr/local/nginx/logs/nginx.pid,再重新启动
5)此时 ps aux,可看到两个nginx进程,一个是root用户开启的master进程,一个是由nginx用户开启的worker进程
5、升级nginx的配置,调优
开启的work进程数是由cpu的总核心数决定的(有几核就有几个work进程)
1) 修改虚拟机cpu核心数(虚拟机关机)
2)查看逻辑CPU的个数:cat /proc/cpuinfo | grep “processor” | wc -l 发现是4核的
3)修改nginx开启的work进程数:vim //usr/local/nginx/conf/nginx.conf,并且重置nginx nginx -s reload
user nginx nginx;
worker_processes 4;
worker_cpu_affinity 0001 0010 0100 1000;
4)修改并发连接数:vim //usr/local/nginx/conf/nginx.conf,并且重置nginx nginx -s reload
worker_connections 65535 :
单个后台worker process进程的 最大并发链接数 ,同时也受linux系统进程的最大打开文件数的限制,需要修改’ulimit -n 65536’设置后,方可生效。epoll
是多路复用IO(I/O Multiplexing)中的一种方式 ,但是仅用于linux2.6以上内核,可以大大提高nginx的性能 ,Nginx正是由此IO模型支持高并发。Nginx支持select,poll,epoll,kqueue,resig,/dev/poll.kqueue对应BSD系统的高效IO模型,epoll对应Linux系统的高效模型。I/O多路复用
:如果一个I/O流进来,我们就开启一个进程处理这个I/O流。那么假设现在有一百万个I/O流进来,那我们就需要开启一百万个进程一一对应处理这些I/O流(——这就是传统意义下的多进程并发处理)。思考一下,一百万个进程,你的CPU占有率会多高,这个实现方式及其的不合理。所以人们提出了I/O多路复用这个模型,一个线程,通过记录I/O流的状态来同时管理多个I/O,可以提高服务器的吞吐能力ps aux 查看进程,cat /proc/2212/limits
如果不是我们期望的65535,
ulimit -a #查看系统的最大打开文件数
ulimit -n 65535 #更改系统配置,立即生效
nginx配置文件主要分为六个区域:
main(全局设置)
、events(nginx工作模式)
、http(http设置)
、sever(主机设置)
、location(URL匹配)
、upstream(负载均衡服务器设置)
。
下面时一个main区域,他是一个全局的设置:
user nobody nobody;
worker_processes 1;
error_log /usr/local/var/log/nginx/error.log notice;
pid /usr/local/var/run/nginx/nginx.pid;
worker_rlimit_nofile 1024;
user
来指定Nginx Worker进程运行用户以及用户组,默认由nobody账号运行。但我们一般更改为用户nginx运行,需要在nginx主机创建用户nginx。
worker_processes
来指定了Nginx要开启的子进程数。每个Nginx进程平均耗费10M~12M内存。根据经验,一般指定1个进程就足够了,如果是多核CPU,建议指定和CPU的数量一样的进程数即可。
error_log
用来定义全局错误日志文件。日志输出级别有debug、info、notice、warn、error、crit可供选择,其中,debug输出日志最为最详细,而crit输出日志最少。
pid
用来指定进程id的存储文件位置。
worker_rlimit_nofile
用于指定一个nginx进程可以打开的最多文件描述符数目,这里是65535,需要使用命令“ulimit -n 65535
”来设置。
events模块来用指定nginx的工作模式和工作模式及连接数上限,一般是这样:
events {
use kqueue; #mac平台
worker_connections 1024;
}
use
用来指定Nginx的工作模式。Nginx支持的工作模式有select、poll、kqueue、epoll、rtsig和/dev/poll。其中select和poll都是标准的工作模式,kqueue和epoll是高效的工作模式,不同的是epoll用在Linux平台上,而kqueue用在BSD系统中,因为Mac基于BSD,所以Mac也得用这个模式,对于Linux系统,epoll工作模式是首选。
worker_connections
用于定义Nginx每个进程的最大连接数,即接收前端的最大请求数,默认是1024。最大客户端连接数由worker_processes和worker_connections决定,即Max_clients=worker_processes*worker_connections,在作为反向代理时,Max_clients变为:Max_clients = worker_processes * worker_connections/4。
进程的最大连接数受Linux系统进程的最大打开文件数限制,在执行操作系统命令“ulimit -n 65536”后worker_connections的设置才能生效。
http模块是最核心的模块了,它负责HTTP服务器相关属性的配置,它里面的server和upstream子模块,至关重要,等到反向代理和负载均衡以及虚拟目录等会仔细说。
http{
include mime.types;
default_type application/octet-stream;
log_format main '$remote_addr - $remote_user [$time_local] "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
access_log /usr/local/var/log/nginx/access.log main;
sendfile on;
tcp_nopush on;
tcp_nodelay on;
keepalive_timeout 10;
#gzip on;
upstream myproject {
.....
}
server {
....
}
}
include
用来设定文件的mime类型,类型在配置文件目录下的mime.type文件定义,来告诉nginx来识别文件类型。
default_type
设定了默认的类型为二进制流,也就是当文件类型未定义时使用这种方式,例如在没有配置asp 的locate 环境时,Nginx是不予解析的,此时,用浏览器访问asp文件就会出现下载了。
log_format
用于设置日志的格式,和记录哪些参数,这里设置为main,刚好用于access_log来记录这种类型。
main
的类型日志如下:也可以增删部分参数。
127.0.0.1 - - [21/Apr/2015:18:09:54 +0800] "GET /index.php HTTP/1.1" 200 87151 "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.76 Safari/537.36"
access_log
用来纪录每次的访问日志的文件地址,后面的main是日志的格式样式,对应于log_format的main。
sendfile
参数用于开启高效文件传输模式。将tcp_nopush和tcp_nodelay两个指令设置为on用于防止网络阻塞。
keepalive_timeout
设置客户端连接保持活动的超时时间。在超过这个时间之后,服务器会关闭该连接。
sever 模块是http的子模块,它用来定一个虚拟主机。
server {
listen 8080;
server_name localhost 192.168.12.10 www.yangyi.com;
# 全局定义,如果都是这一个目录,这样定义最简单。
root /Users/yangyi/www;
index index.php index.html index.htm;
charset utf-8;
access_log usr/local/var/log/host.access.log main;
aerror_log usr/local/var/log/host.error.log error;
....
}
server
标志定义虚拟主机开始。
listen
用于指定虚拟主机的服务端口。
server_name
用来指定IP地址或者域名,多个域名之间用空格分开。
root
表示在这整个server虚拟主机内,全部的root web根目录。注意要和locate {}下面定义的区分开来。
index
全局定义访问的默认首页地址。注意要和locate {}下面定义的区分开来。
charset
用于设置网页的默认编码格式。
access_log
用来指定此虚拟主机的访问日志存放路径,最后的main用于指定访问日志的输出格式。
location模块是nginx中用的最多的,也是最重要的模块了,负载均衡、反向代理、虚拟域名都与它相关。
location 根据它字面意思就知道是来定位的,定位URL,解析URL,所以,它也提供了强大的正则匹配功能,也支持条件判断匹配,用户可以通过location指令实现Nginx对动、静态网页进行过滤处理。像我们的php环境搭建就是用到了它。
我们先来设定默认首页和虚拟机目录。
location / {
root /Users/yangyi/www;
index index.php index.html index.htm;
}
location /
表示匹配访问根目录。
root
指令用于指定访问根目录时,虚拟主机的web目录,这个目录可以是相对路径(相对路径是相对于nginx的安装目录)。也可以是绝对路径。
index
用于设定我们只输入域名后访问的默认首页地址,有个先后顺序:index.php index.html index.htm,如果没有开启目录浏览权限,又找不到这些默认首页,就会报403错误。
location
还有一种方式就是正则匹配,开启正则匹配这样:location ~
。后面加个~。下面就是:
location ~ \.php$ {
root /Users/yangyi/www;
fastcgi_pass 127.0.0.1:9000;
fastcgi_index index.php;
include fastcgi.conf;
}
\.php$
熟悉正则的我们直到,这是匹配.php
结尾的URL,用来解析php文件。里面的root
也是一样,用来表示虚拟主机的根目录。
fast_pass
链接的是php-fpm
的地址。
upstream 模块负责负载均衡模块,通过一个简单的调度算法来实现客户端IP到后端服务器的负载均衡。
upstream iyangyi.com{
ip_hash;
server 192.168.12.1:80;
server 192.168.12.2:80 down;
server 192.168.12.3:8080 max_fails=3 fail_timeout=20s;
server 192.168.12.4:8080;
}
在上面的例子中,通过upstream
指令指定了一个负载均衡器的名称iyangyi.com
。这个名称可以任意指定,在后面需要的地方直接调用即可。
里面是ip_hash
这是其中的一种负载均衡调度算法,下面会着重介绍。紧接着就是各种服务器了。用server关键字表识,后面接ip。
Nginx的负载均衡模块目前支持4种调度算法:
在HTTP Upstream模块中,可以通过server指令指定后端服务器的IP地址和端口,同时还可以**设定每个后端服务器在负载均衡调度中的状态**。常用的状态有:
注意 :当负载调度算法为ip_hash
时,后端服务器在负载均衡调度中的状态不能是weight和backup。