nginx-高性能WEB服务器
1 简介
基础篇:
Nginx介绍
Nginx编译安装
Nginx整合PHP
Nginx信号控制
应用篇:
Nginx虚拟主机配置
Nginx日志切割
Nginx 与gzip设置
实战篇:
Nginx与浏览器缓存配置
Nginx与Rewrite规则
Nginx与memcached
优化篇:
Nginx连接数优化
Nginx反向代理
Nginx集群与负载均衡
2 编译安装
linux># cd /usr/local/src
linux># wget http://nginx.org/download/nginx-1.14.2.tar.gz
linux># tar zxvf nginx-1.14.2.tar.gz
linux># cd nginx-1.14.2
linux># ./configure --prefix=/usr/local/nginx 【编译】
这里报错了HTTP rewrite 缺少一个PCRE library
当前目录直接
linux># yum install pcre 【安装pcre,正则表达式的库】【ubuntu不支持yum的话根据提示来】
linux># yum install pcre-devel【或这个】【系统不一样,安装方式不一样】
linux># ./configure --prefix=/usr/local/nginx 【编译again】
linux># make && make install 【安装】
3 简单命令
3.1 启动
linux># cd /usr/local/nginx
linux># ll
....conf 配置文件
... html 网页文件
...logs 日志文件
...sbin 主要二进制程序
linux># ./sbin/nginx 【启动】
nginx: [emerg] bind() to 0.0.0.0:80 failed (98: Address already in use)
....
nginx: [emerg] bind() to 0.0.0.0:80 failed (98: Address already in use)
nginx: [emerg] still could not bind()
不能绑定80端口,80端口已经被占用
(有时是自己装了apache,nginx等,还有更多情况是操作系统自带了apache并作为服务启动)
解决: 把占用80端口的软件或服务关闭即可.
kill -9 2985 【依据实际情况kill相关进程】
pkill -9 http
3.2 关闭 【nginx的信号控制与进程管理】
linux nginx># kill -INT 6425 【暴力关闭】【nginx master进程id】
linux nginx># kill -HUP 6425 【平滑的刷新nginx的配置文件,不会立即生效,会几秒后更新】
linux nginx>#
//信号
TERM,INT【Quick shutdown】
QUIT 优雅的关闭进程,即等请求结束后再关闭
HUP 改变配置文件,平滑的重读配置文件
USR1 【Reopen the log files】【注意,nginx系统中,不会因为修改文件名而修改指向】
USR2 【平滑的升级,用于升级的时候】
WITCH 【优雅的关闭旧进程(配合USR2来使用)】
linux nginx># kill -USR1 6425 【这样就写到新的日志文件中,不再指向旧的文件】
linux nginx># kill -HUP `cat logs/nginx.pid`【动态获取进程号】
linux nginx># ./sbin/nginx -s reload 【效果同 -HUP】
linux nginx># ./sbin/nginx -s stop 【停止】
linux nginx># ./sbin/nginx -s reopen 【-USR1】
linux nginx># ./sbin/nginx -t 【校验配置文件】
4 nginx虚拟主机配置
linux nginx># vim ./conf/nginx.conf
4.1 Nginx配置段
//全局区001
worker_processes 1; // 有1个工作的子进程,可以自行修改,但太大无益,因为要争夺CPU,一般设置为 CPU数*核数
//全局区002
Event {
// 一般是配置nginx连接的特性
// 如1个word能同时允许多少连接
worker_connections 1024; // 这是指 一个子进程最大允许连1024个连接
}
//全局区003 这是配置http服务器的主要段
http {
server { // 这是虚拟主机段
Location { //定位,把特殊的路径或文件再次定位 ,如image目录单独处理,如.php单独处理
}
}
server {
}
}
4.2 虚拟主机配置
例子1: 基于域名的虚拟主机
server {
listen 80; #监听端口
server_name a.com; #监听域名
location / {
root a.com; #运行根目录:相对于nginx的根目录
index index.html;
}
}
例子2: 基于端口的虚拟主机配置
server {
listen 2022;
server_name z.com;
location / {
root /var/www/html2022;
index index.html;
}
}
例子3: 基于IP的虚拟主机配置
server {
listen 8080;
server_name 192.168.1.200;
location / {
root html/ip;
index index.html;
}
}
5 nginx日志管理
我们观察nginx的server段,可以看到如下类似信息
#access_log logs/host.access.log main;
这说明:该server, 它的访问日志的文件是logs/host.access.log,使用的格式“main”格式.
除了main格式,你可以自定义其他格式.
main格式是什么?
log_format main '$remote_addr - $remote_user [$time_local] "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
main格式是我们定义好一种日志的格式,并起个名字,便于引用.
以上面的例子, main类型的日志,记录的 remote_addr、http_x_forwarded_for等选项.
5.1 日志格式,是指记录哪些选项
默认的日志格式: main,记录这么几项
远程IP--远程用户/用户时间--请求方法(如GET/POST)--请求体body长度--referer来源信息
http-user-agent用户代理/蜘蛛 ,被转发的请求的原始IP
http_x_forwarded_for:在经过代理时,代理把你的本来IP加在此头信息中,传输你的原始IP
5.2:声明一个独特的log_format并命名
log_format mylog '$remote_addr- "$request" '
'$status $body_bytes_sent "$http_referer" '
'"$http_user_agent" "$http_x_forwarded_for"';
在下面的server/location,我们就可以引用 mylog
在server段中,这样来声明:
access_log logs/access_8080.log mylog;
//声明log log位置 log格式;
Nginx允许针对不同的server做不同的Log ,(有的web服务器不支持,如lighttp)
5.3 实际应用:
shell+定时任务+nginx信号管理,完成日志按日期存储
分析思路: 凌晨00:00:01,把昨天的日志重命名,放在相应的目录下;再USR1信息号控制nginx重新生成新的日志文件
脚本具体内容:
#!/bin/bash
base_path='/usr/local/nginx/logs'
log_path=$(date -d yesterday +"%Y%m")
day=$(date -d yesterday +"%d")
mkdir -p $base_path/$log_path
mv $base_path/access.log $base_path/$log_path/access_$day.log
#echo $base_path/$log_path/access_$day.log 【查看】
kill -USR1 `cat /usr/local/nginx/logs/nginx.pid`
部分命令演示:
linux nginx># date
linux nginx># date -d yesterday
linux nginx># date -d yesterday +%Y%m%d%H%M
linux nginx># mkdir /data 【创建一个目录】
linux nginx># cd /data
linux data># vim runlog.sh
#!/bin/bash
echo $(date -d yesterday +%Y%m%d) 【可以用$ 或者 反引号` 输出命令的值】
linux data># sh runlog.sh 【执行这个脚本】
#!/bin/bash【全版】
base_path='/usr/local/nginx/logs' 【声明一个变量】
log_path=$(date -d yesterday +"%Y%m")
day=$(date -d yesterday +"%d")
mkdir -p $base_path/$log_path 【创建文件夹】
mv $base_path/access.log $base_path/$log_path/access_$day.log
#echo $base_path/$log_path/access_$day.log
kill -USR1 `cat /usr/local/nginx/logs/nginx.pid`
#!/bin/bash【简版】
LOGPATH=/usr/local/nginx/logs/host.access.log
BASEPATH=/data
bak=$BASEPATH/$(date -d yesterday +%Y%m%d%H%M).host.access.log
// echo $bak 【看一下输出】
mv $LOGPATH $bak 【移动日志到备份目录】
touch $LOGPATH 【重新创建logpath】
kill -USR1 `/usr/local/nginx/logs/nginx.pid` 【通知一下nginx】
linux data> crontab -e
*/1 * * * * sh /data/runlog.sh 【添加定时任务,让runlog.sh每分钟执行一次】
【分时日月周】
2 0 */1 * * sh /data/runlogday.sh
6 location语法
6.1 location语法
location 有”定位”的意思, 根据Uri来进行不同的定位.
在虚拟主机的配置中,是必不可少的,location可以把网站的不同部分,定位到不同的处理方式上.
比如, 碰到.php, 如何调用PHP解释器? --这时就需要location
location 的语法
location [=|~|~*|^~] patt {
}
中括号可以不写任何参数,此时称为一般匹配
也可以写参数
因此,大类型可以分为3种
location = patt {} [精准匹配]
location patt{} [一般匹配]
location ~ patt{} [正则匹配]
6.2 精准匹配和一般匹配结合使用
如何发挥作用?:
首先看有没有精准匹配,如果有,则停止匹配过程.
location = patt {
config A
}
如果 $uri == patt,匹配成功,使用configA
//精准匹配
location = / {
root /var/www/html/;
index index.htm index.html;
}
//一般匹配
location / {
root /usr/local/nginx/html;
index index.html index.htm;
}
如果访问 http://xxx.com/
定位流程是
1: 精准匹配中 ”/” ,得到index页为 index.htm
2: 再次访问 /index.htm , 此次内部转跳uri已经是”/index.htm” ,
根目录为/usr/local/nginx/html
3: 最终结果,访问了 /usr/local/nginx/html/index.htm
6.2 一般匹配和正则匹配结合使用
再来看,正则也来参与.
//一般匹配
location / {
root /usr/local/nginx/html;
index index.html index.htm;
}
//正则匹配
location ~ image {
root /var/www/image;
index index.html;
}
如果我们访问 http://xx.com/image/logo.png
此时, “/” 与”/image/logo.png” 匹配
同时,”image”正则 与”image/logo.png”也能匹配,谁发挥作用?
正则表达式的成果将会使用.
图片真正会访问 /var/www/image/image/logo.png
6.3 两个一般匹配【访问长的】
location / {
root /usr/local/nginx/html;
index index.html index.htm;
}
location /foo {
root /var/www/html;
index index.html;
}
我们访问 http://xxx.com/foo
对于uri “/foo”, 两个location的patt,都能匹配他们
即 ‘/’能从左前缀匹配 ‘/foo’, ‘/foo’也能左前缀匹配’/foo’,
此时, 真正访问 /var/www/html/index.html
原因:’/foo’匹配的更长,因此使用之.;
7 rewrite重写【在location内部使用】
7.1重写中用到的指令
if (条件) {} 设定条件,再进行重写
set #设置变量
return #返回状态码
break #跳出rewrite
rewrite #重写
7.2If 语法格式
if 空格 (条件) {
重写模式
}
7.3 条件又怎么写?【3种写法】
1: “=”来判断相等, 用于字符串比较
2: “~” 用正则来匹配(此处的正则区分大小写)
“~*” 不区分大小写的正则
3: -f -d -e来判断是否为文件,为目录,是否存在
7.4 rewrite:例子
if ($remote_addr = 192.168.1.100) {
return 403;
}
if ($http_user_agent ~ MSIE) {
rewrite ^.*$ /ie.htm;
break; #(不break会循环重定向)
}
if (!-e $document_root$fastcgi_script_name) {
rewrite ^.*$ /404.html break;
}
注, 此处还要加break;
以 xx.com/dsafsd.html这个不存在页面为例,
我们观察访问日志, 日志中显示的访问路径,依然是GET /dsafsd.html HTTP/1.1
提示: 服务器内部的rewrite和302跳转不一样.
跳转的话URL都变了,变成重新http请求404.html, 而内部rewrite, 上下文没变;
跳转的话URL都变了,变成重新http请求404.html, 而内部rewrite, 上下文没变;
就是说 fastcgi_script_name 仍然是 dsafsd.html,因此 会循环重定向.
7.5 set:
set是设置变量用的, 可以用来达到多条件判断时作标志用.
达到apache下的 rewrite_condition的效果
如下: 判断IE并重写,且不用break; 我们用set变量来达到目的
if ($http_user_agent ~* msie) {
set $isie 1;
}
if ($fastcgi_script_name = ie.html) {
set $isie 0;
}
if ($isie 1) {
rewrite ^.*$ ie.html;
}
7.6 Rewrite 正则表达式 定向后的位置 模式
Goods-3.html ---->Goods.php?goods_id=3
goods-([\d]+)\.html ---> goods.php?goods_id =$1
//例
location /ecshop {
rewrite "goods-(\d{1,7})\.html" /ecshop/goods.php?id=$1;
}
//例
location /ecshop {
index index.php;
rewrite goods-([\d]+)\.html$ /ecshop/goods.php?id=$1;
rewrite article-([\d]+)\.html$ /ecshop/article.php?id=$1;
rewrite category-(\d+)-b(\d+)\.html /ecshop/category.php?id=$1&brand=$2;
rewrite category-(\d+)-b(\d+)-min(\d+)-max(\d+)-attr([\d\.]+)\.html /ecshop/category.php?id=$1&brand=$2&price_min=$3&price_max=$4&filter_attr=$5;
rewrite category-(\d+)-b(\d+)-min(\d+)-max(\d+)-attr([\d+\.])-(\d+)-([^-]+)-([^-]+)\.html /ecshop/category.php?id=$1&brand=$2&price_min=$3&price_max=$4&filter_attr=$5&page=$6&sort=$7&order=$8;
}
//匹配第四个rewrite
//category-3-b2-min200-max1700-attr167.227.202.199.html
//category-3-b0-min0-max0-attr0-1goods_id-DESC.html
注意:用url重写时, 正则里如果有”{}”,正则要用双引号包起来
8 nginx+php的编译
8.1 编译
apache一般是把php当做自己的一个模块来启动的.
而nginx则是把http请求变量(如get,user_agent等)转发给 php进程,即php独立进程,与nginx进行通信. 称为 fastcgi运行方式.
因此,为apache所编译的php,是不能用于nginx的.
注意: 我们编译的PHP 要有如下功能:
连接mysql, gd, ttf, 以fpm(fascgi)方式运行
linux src/php># ./configure -help | grep mysql
linux src/php># ./configure --prefix=/usr/local/fastphp \
--with-mysql=mysqlnd \
--enable-mysqlnd \
--with-gd \
--enable-gd-native-ttf \
--enable-gd-jis-conv
--enable-fpm 【这里所有的都需要】
8.2 nginx中location的指向php
编译完毕后:
1:
nginx+php的配置比较简单,核心就一句话----
把请求的信息转发给9000端口的PHP进程, 让PHP进程处理 指定目录下的PHP文件.
如下例子:
location ~ \.php$ {
root html;
fastcgi_pass 127.0.0.1:9000;
fastcgi_index index.php;
fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
include fastcgi_params;
}
1: 碰到php文件,
2: 把根目录定位到 html,
3: 把请求上下文转交给9000端口PHP进程,
4: 并告诉PHP进程,当前的脚本是 $document_root$fastcgi_scriptname
(注:PHP会去找这个脚本并处理,所以脚本的位置要指对)
10 nginx gzip压缩提升网站速度【优化】
网页内容的压缩编码与传输速度优化
我们观察news.163.com的头信息
请求:
Accept-Encoding:gzip,deflate,sdch
响应:
Content-Encoding:gzip
Content-Length:36093
再把页面另存下来,观察,约10W字节,实际传输的36093字节
原因---->就在于gzip压缩上.
原理:
浏览器---请求---->声明可以接受 gzip压缩 或 deflate压缩 或compress 或 sdch压缩
从http协议的角度看--请求头,声明 accept-encoding: gzip deflate sdch (是指压缩算法,其中sdch是google倡导的一种压缩方式,目前支持的服务器尚不多)
服务器-->回应---把内容用gzip方式压缩---->发给浏览器
浏览<-----解码gzip-----接收gzip压缩内容----
推算一下节省的带宽:
假设 news.163.com PV 2亿
2*10^8 * 9*10^4 字节 ==
2*10^8 * 9 * 10^4 * 10^-9 = 12*K*G = 18T
节省的带宽是非常惊人的
//gzip 相关参数设置
gzip on;
gzip_buffers 32 4K;
zip_comp_level 6;
gzip_min_length 1000;
gzip_proxied expired no-cache no-store private auth;
gzio_type text/plain application/xml;
gzip配置的常用参数
gzip on|off; #是否开启gzip
gzip_buffers 32 4K| 16 8K #缓冲(压缩在内存中缓冲几块? 每块多大?)
gzip_comp_level [1-9] #推荐6 压缩级别(级别越高,压的越小,越浪费CPU计算资源)
gzip_disable #正则匹配UA 什么样的Uri不进行gzip
gzip_min_length 200 # 开始压缩的最小长度(再小就不要压缩了,意义不在)
gzip_http_version 1.0|1.1 # 开始压缩的http协议版本(可以不设置,目前几乎全是1.1协议)
gzip_proxied # 设置请求者代理服务器,该如何缓存内容
gzip_types text/plain application/xml # 对哪些类型的文件用压缩 如txt,xml,html ,css
gzip_vary on|off # 是否传输gzip压缩标志
注意:
图片/mp3这样的二进制文件,不必压缩
因为压缩率比较小, 比如100->80字节,而且压缩也是耗费CPU资源的.
gzip 写在http,server,location,等都行
另外:
nginx/conf/mime.types 有 txt,css等对应mime类型
11 expires缓存【优化】
11.1对于网站的图片,尤其是新闻站, 图片一旦发布, 改动的可能是非常小的.我们希望 能否在用户访问一次后, 图片缓存在用户的浏览器端,且时间比较长的缓存.
可以, 用到nginx的expires设置.
nginx中设置过期时间,非常简单,
在location或if段里,来写.
格式 expires 30s;
expires 30m;
expires 2h;
expires 30d;
location ~ image{
root html;
expires 1d;
}
// 图片交给nginx
location ~* \.(jpg|jpeg|gif|png){
root html;
expires 1d;
}
11.2 304缓存
另: 304 也是一种很好的缓存手段
原理是: 服务器响应文件内容是,同时响应etag标签(内容的签名,内容一变,他也变), 和 last_modified_since 2个标签值
浏览器下次去请求时,头信息发送这两个标签, 服务器检测文件有没有发生变化,如无,直接头信息返回 etag,last_modified_since
浏览器知道内容无改变,于是直接调用本地缓存.
这个过程,也请求了服务器,但是传递的内容极少.
对于变化周期较短的,如静态html,js,css,比较适于用这个方式
12 nginx反向代理服务器+负载均衡
12.1 nginx反向代理实现nginx+apache动静分离
用nginx做反向代理和负载均衡非常简单,
支持两个用法 1个proxy, 1个upstream,分别用来做反向代理,和负载均衡
以反向代理为例, nginx不自己处理php的相关请求,而是把php的相关请求转发给apache来处理.
---->客户端---->nginx.html---->proxy_pass---->apache php;
再依次返回给客户端
----这不就是传说的”动静分离”,动静分离不是一个严谨的说法,叫反向代理比较规范.
location ~ \.php$ {
proxy_pass http://192.168.1.200:8080
}
12.2 nginx负载均衡
反向代理后端如果有多台服务器,自然可形成负载均衡,但proxy_pass如何指向多台服务器?
把多台服务器用upstream指定绑定在一起并起个组名,然后proxy_pass指向该组
默认的均衡的算法很简单,就是针对后端服务器的顺序,逐个请求.
也有其他负载均衡算法,如一致性哈希,需要安装第3方模块
upstream imgserver {
server 192.168.1.200:81 weight=1 max_fails=2 fail_timeout=3;
server 192.168.1.200:82 weight=1 max_fails=2 fail_timeout=3;
}
server{
listen 81;
server_name localhost;
root html/image;
access_log logs/81-access.log main;
}
server{
listen 82;
server_name localhost;
root html/image;
access_log logs/82-access.log main;
}
location ~* \.(jpg|jpeg|gif|png){
proxy_pass http://imgserver;
}
//这样遇到图片的时候就传给了imageServer
反向代理导致了后端服务器的IP,为前端服务器的IP,而不是客户真正的IP,怎么办?
//添加一个header,X-Forwarded-For
location ~* \.(jpg|jpeg|gif|png){
proxy_set_header X-Forwarded-For $remote_addr;
proxy_pass http://imgserver;
}
========================================================================================================================
13 nginx连接memcached
13.1
nginx--->memcached---->无缓存----->php—--->DB
//来请求后,先去memcached中查找
location / {
set $ "$uri"
memcached_pass 127.0.0.1:11211;
error_page 404 /callback.php;
}
13.2 Nginx第三方模块编译及一致性哈希应用
nginx根据hash($uri)--->某台memcached_key
php 根据hash($uri)--->同一台memcached_key
插件:
nginx consistentHash
13.2.1 安装ngx_http_consistent_hash插件【这可能下不动,自己下载去】
linux #>cd /usr/local/src
linux #>wget https://github.com/replay/ngx_http_consistent_hash.git
linux #>unzip gx_http_consistent_hash-master
linux #>cd ngx_http_consistent_hash-master
linux #>ls
// cd到nginx的源文件下
linux #>cd /usr/local/src/nginx-1.14.2
linux #>ls src/
linux #> /usr/local/nginx/sbin/nginx -v 【查看原来的nginx是怎么编译的】
linux #> .configure --help|grep with 【查看help】
【编译,带第三方模块】
linux src/nginx-1.14.2#> ./configure --prefix=/usr/local/nginx --add-module=/usr/local/src/ngx_http_consistent_hash-master/【带插件编译】
linux src/nginx-1.14.2#> pkill -9 nginx【关掉之前的nginx,如何之前有的话】
linux src/nginx-1.14.2#> make && make install 【安装】
linux #> 重启nginx
13.2.2配置memcache集群
upstream memserver { 把用到的memcached节点,声明在一个组里
//hash_key $request_uri; // hash计算时的依据,以uri做依据来hash
consistent_hash $request_uri;
server 127.0.0.1:11211;
server 127.0.0.1:11212;
}
Location里
location / {
# root html;
set $memcached_key $uri;
memcached_pass memserver; // memserver为上面的memcache节点的名称
error_page 404 /writemem.php;
index index.php index.html index.htm;
}
还要修改一下memcached的hash算法
---->php.ini
---->memcache.hash_strategy=consistent
14 大访问量优化整体思路
---详看nginx集群笔记