目录
1. 正向代理和反向代理
1.1 正向代理
(1)什么是正向代理?
(2)正向代理的特点
(3)正向代理的用途
1.2 反向代理
(1)什么是反向代理?
(2)反向代理的特点
(3)反向代理的用途
1.3 正向代理和反向代理一起使用
2. Nginx基础
2.1 Nginx相关概念
(1)什么是Nginx?
(2)Nginx的功能有哪些?
2.2 Nginx常用功能
2.2.1 Http代理,反向代理:作为web服务器最常用的功能之一,尤其是反向代理
2.2.2 负载均衡
2.2.3 Web缓存
2.3 Nginx的配置详解
(1)默认的nginx 文件结构
(2)nginx 配置文件 nginx.conf 示例
【写在前面】
自学了Nginx的一些基础知识,参考了下方链接中的文章,推荐直接看原博,写得都非常好。
Nginx 入门学习教程 - 星云博客园 - 博客园 (cnblogs.com)
反向代理和正向代理区别 - 泛夜泰克 - 博客园 (cnblogs.com)
Nginx 配置详解 | 菜鸟教程 (runoob.com)
该文是我的学习笔记,内容和图片都来自上述文章,我仅做自学笔记。如侵,会删,谢谢。
正向代理类似一个跳板机,代理访问外部资源。
客户端非常明确要访问的服务器地址;
服务器只清楚请求来自哪个代理服务器,而不清楚来自哪个具体的客户端;
正向代理模式屏蔽或者隐藏了真实客户端信息。
访问原来无法访问的外部资源;
可以做缓存,加速访问资源;
对客户端访问授权,上网进行认证;
代理可以记录用户访问记录(上网行为管理),对外隐藏用户信息;
附图来自文首推荐的文章:
反向代理(Reverse Proxy)实际运行方式是指:以代理服务器来接收internet上的连接请求,然后
将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接的客户
端,此时代理服务器对外就表现为一个服务器。
比如:用户在淘宝客户端发出请求,经过了Nginx反向代理服务器,Nginx服务器接收到之后,按
照一定的规则分发给了后端的业务处理服务器进行处理。
即:客户端(请求的来源)是明确的,但是请求具体由哪台服务器来处理,并不明确。Nginx扮演
的就是一个反向代理角色。
主要用于服务器集群分布式部署的情况,反向代理隐藏了服务器的信息。
保证内网安全,阻止web攻击,大型网站通常将反向代理作为公网访问地址,Web服务器是内网;
负载均衡,通过反向代理服务器来优化网站的负载;
附图来自文首推荐的文章:
(1)正向代理:
是客户端代理, 它代理客户端, 服务端不知道实际发起请求的客户端。proxy和client同属一个LAN,对server透明。
(2)反向代理:
是服务端代理, 它代理服务端, 客户端不知道实际提供服务的服务端。proxy和server同属一个LAN,对client透明。
附图来自文首推荐的文章:
Nginx [engine x],是HTTP和反向代理服务器,邮件代理服务器,通用TCP/UDP代理服务器。
Nginx是一个异步框架的Web服务器,也可以用作反向代理,负载平衡器和 HTTP缓存。
即:
Nginx是一款自由的、开源的(BSD)、高性能的HTTP服务器和反向代理服务器;
同时也是一个IMAP、POP3、SMTP代理服务器;
Nginx可以作为一个HTTP服务器进行网站的发布处理,
另外Nginx可以作为反向代理进行负载均衡的实现。
一大部分Web服务器使用Nginx,通常作为负载均衡器。
HTTP服务器功能
邮件代理服务器功能
TCP/UDP代理服务器功能
负载均衡器
体系结构和可扩展性
经测试的操作系统和平台
比如:Dropbox,Netflix,Wordpress.com,FastMail.FM...
(1)Nginx在做反向代理时,性能稳定,并且能够提供配置灵活的转发功能。
(2)Nginx可根据不同的正则匹配,采取不同的转发策略,比如图片文件结尾的走文件服务器,
动态页面走web服务器。只要正则写的没问题,又有相对应的服务器解决方案,即可。
(3)Nginx可对返回结果进行错误页跳转,异常判断等。如果被分发的服务器存在异常,Nginx可
将请求重新转发给另外一台服务器,然后自动去除异常服务器。
(1)什么是负载量?
上面客户端发送的、nginx反向代理服务器接收到的请求数量,就是负载量。
(2) 什么是均衡?
请求数量按照一定的规则进行分发到不同的服务器进行处理的规则,就是一种均衡规则。
(3)什么是负载均衡?
即:将服务器接收到的请求按照规则分发的过程。
(4)负载均衡的分类:硬件负载均衡,软件负载均衡
在实际项目操作过程中,有硬件负载均衡和软件负载均衡两种
硬件负载均衡也称为硬负载,特点:造价昂贵成本较高,数据的稳定性安全性好。
考虑到成本原因,很多时候会选择使用软件负载均衡,软件负载均衡是利用现有的技术结合主机硬
件实现的一种消息队列分发机制。
(5)Nginx支持的负载均衡调度算法(方式一)
weight轮询(默认):接收到的请求按照顺序逐一分配到不同的后端服务器,即使在使用过程中,某一台后端服务器宕机,nginx会自动将该服务器剔除出队列,请求受理情况不会受到任何影响。 这种方式下,可以给不同的后端服务器设置一个权重值(weight),用于调整不同的服务器上请求的分配率;权重数据越大,被分配到请求的几率越大;该权重值,主要是针对实际工作环境中不同的后端服务器硬件配置进行调整的。
ip_hash:每个请求按照发起客户端的ip的hash结果进行匹配,这样的算法下一个固定ip地址的客户端总会访问到同一个后端服务器,这也在一定程度上解决了集群部署环境下session共享的问题。
fair:智能调整调度算法,动态的根据后端服务器的请求处理到响应的时间进行均衡分配,响应时间短处理效率高的服务器分配到请求的概率高,响应时间长处理效率低的服务器分配到的请求少;结合了前两者的优点的一种调度算法。但是需要注意的是nginx默认不支持fair算法,如果要使用这种调度算法,请安装upstream_fair模块。
url_hash:按照访问的url的hash结果分配请求,每个请求的url会指向后端固定的某个服务器,可以在nginx作为静态服务器的情况下提高缓存效率。同样要注意nginx默认不支持这种调度算法,要使用的话需要安装nginx的hash软件包。
(5)Nginx支持的负载均衡调度算法(方式二)
一种Nginx处理静态资源实现负载均衡的架构。
1)原始企业架构的特点:单节点,几乎无容灾,负载能力低,维护简单。
附图来自文首推荐的文章:
2)改善后的动静分离的模式:这种架构模式,使用Nginx 来处理所有的html,js,css 静态资源请求,这样Tomcat 压力就会减轻一些,这样操作也能实现一定程度的负载均衡。
附图来自文首推荐的文章:
Nginx可以对不同的文件做不同的缓存处理,配置灵活。
并且支持FastCGI_Cache,主要用于对FastCGI的动态程序进行缓存。
配合着第三方的ngx_cache_purge,对制定的URL缓存内容可以的进行增删管理。
... #全局块
events { #events块
...
}
http #http块
{
... #http全局块
server #server块
{
... #server全局块
location [PATTERN] #location块
{
...
}
location [PATTERN]
{
...
}
}
server
{
...
}
... #http全局块
}
解析:
########### 每个指令必须有分号结束。#################
#user administrator administrators; #配置用户或者组,默认为nobody nobody。
#worker_processes 2; #允许生成的进程数,默认为1
#pid /nginx/pid/nginx.pid; #指定nginx进程运行文件存放地址
error_log log/error.log debug; #制定日志路径,级别。这个设置可以放入全局块,http块,server块,级别以此为:debug|info|notice|warn|error|crit|alert|emerg
events {
accept_mutex on; #设置网路连接序列化,防止惊群现象发生,默认为on
multi_accept on; #设置一个进程是否同时接受多个网络连接,默认为off
#use epoll; #事件驱动模型,select|poll|kqueue|epoll|resig|/dev/poll|eventport
worker_connections 1024; #最大连接数,默认为512
}
http {
include mime.types; #文件扩展名与文件类型映射表
default_type application/octet-stream; #默认文件类型,默认为text/plain
#access_log off; #取消服务日志
log_format myFormat '$remote_addr–$remote_user [$time_local] $request $status $body_bytes_sent $http_referer $http_user_agent $http_x_forwarded_for'; #自定义格式
access_log log/access.log myFormat; #combined为日志格式的默认值
sendfile on; #允许sendfile方式传输文件,默认为off,可以在http块,server块,location块。
sendfile_max_chunk 100k; #每个进程每次调用传输数量不能大于设定的值,默认为0,即不设上限。
keepalive_timeout 65; #连接超时时间,默认为75s,可以在http,server,location块。
upstream mysvr {
server 127.0.0.1:7878;
server 192.168.10.121:3333 backup; #热备
}
error_page 404 https://www.baidu.com; #错误页
server {
keepalive_requests 120; #单连接请求上限次数。
listen 4545; #监听端口
server_name 127.0.0.1; #监听地址
location ~*^.+$ { #请求的url过滤,正则匹配,~为区分大小写,~*为不区分大小写。
#root path; #根目录
#index vv.txt; #设置默认页
proxy_pass http://mysvr; #请求转向mysvr 定义的服务器列表
deny 127.0.0.1; #拒绝的ip
allow 172.18.5.54; #允许的ip
}
}
}
上面是nginx的基本配置,需要注意的有以下几点:
1)几个常见配置项:
2)惊群现象:一个网路连接到来,多个睡眠的进程被同时叫醒,但只有一个进程能获得链接,这样会影响系统性能。
3)每个指令必须有分号结束。