反向代理简单讲就是代理后端服务器响应客户端请求的服务器。我的理解,反向代理也可以理解为工作在7层应用层的负载均衡服务器
为什么需要反向代理?
1.隐藏后端主机
2.更好的管理后端各主机的路由状况
3.灵活的分配后端服务器资源
4.根据具体服务进行转发。
最简单的例子:
location / {
proxy_pass http://localhost:8000; #将匹配此location的请求发送到http://localhost:80000处理
proxy_set_header Host $host; #自定义首部发送到后端主机
proxy_set_header X-Real-IP $remote_addr;
}
proxy_pass是nginx作为反向代理最关键的一个指令
例:
location /name/ {
proxy_pass http://127.0.0.1/remote/;
}
在这个例子中,假如用户访问路径是www.baidu.com/name/,那么实际访问路径是remote/目录
proxy_pass会将location下的URI,另外若proxy_pass后面只有IP,如:proxy_pass http://18.18.18.18,这时后面的/加与不加区别很大
在nginx中配置proxy_pass时,如果是按照^~匹配路径时,要注意proxy_pass后的url最后的/,当加上了/,相当于是绝对根路径,则nginx不会把location中匹配的路径部分代理走;如果没有/,则会把匹配的路径部分也给代理走。
location ^~ /static_js/
{
proxy_cache js_cache;
proxy_set_header Host js.test.com;
proxy_pass http://js.test.com/;
}
如上面的配置,如果请求的url是http://servername/static_js/test.html
会被代理成http://js.test.com/test.html
而如果这么配置
location ^~ /static_js/
{
proxy_cache js_cache;
proxy_set_header Host js.test.com;
proxy_pass http://js.test.com;
}
则会被代理到http://js.test.com/static_js/test.htm
当location后使用正则表达式模式匹配,if语句或limt_execept时,proxy_pass后面是不能加URI的
用来使代理服务器修改发往后端服务器的报头文件的,因为后端服务器所接收并处理的请求实际是由代理服务器发送来的,后端主机并不知道客户端的信息,在后期做日志分析时就无法查询真正的请求来源,虽然真正的客户端来源记录是代理服务器处理的,但一般为了尽量减少代理服务器的磁盘IO代理服务器是不做日志的,所以就需要此参数将真正的客户端来源IP把默认的来源IP(代理服务器IP)替换并发送至后端服务器。
例:
location / {
proxy_pass http://localhost:8000; #将匹配此location的请求发送到http://localhost:80000处理
proxy_set_header Host $host; #自定义首部发送到后端主机
proxy_set_header X-Real-IP $remote_addr;
}
X-Real-IP是自定义的守护,将它加入log文件的format中日志便会记录。
当生产环境中出现多级代理时需使用$proxy_add_x_forwarded_for,此参数做的是往后添加,而非替换
同理,反向代理也能修改发往客户端的包头文件,将真正的后端服务器IP或者代理服务器IP响应给客户端,这就需要用到专门的报头模块ngx_http_headers_module模块。如:add_header就是用来修改由代理服务器发送至客户端的指令。例:add_header X-Via $server_addr;
一般所说的缓存就是将数据临时存放在内存中,当需要用到数据或程序时,直接从内存中读取,因为内存的读写速度与磁盘IO不是一个量级,所以使用缓存能极大的提高系统使用效率。
在nginx作为代理服务器时,会同时处理大量的请求与响应,若每一次都需要用到磁盘IO会极大地影响架构的性能,所以一般会将请求频率较高的数据作为缓存并缓存至代理服务器,当客户端请求时会直接响应,不再向后端发起网络或磁盘IO。
根据请求做hash计算创建树状结目录,并建立hash表,将hash表存放在内存中,当接收到用户请求后查找hash表并根据查找结果读取数据所在目录并相应。一般只缓存GET,HEAD
proxy_cache_path #只能用在http下#
例:proxy_cache_path /data/nginx/cache levels=1:1:1 keys_zone=one:10m max_size=2g; #定义缓存目录为/data/nginx/cache,创建3级子目录,每级子目录分别有16个目录,键大小为10兆,键名为one,缓存的最大空间为2g
proxy_cache_path只能用在http中定义,在http中定义完成proxy_cache_path后,还需要在server或location中定义一下几个参数
定义缓存的键与空间大小的,也可以理解为定义缓存的名称与占用空间大小
例:proxy_cache_key NAME;
定义客户端请求的那些内容会被缓存,默认是GET HEAD
例:proxy_cache_methods GET HEAD POST;
例:proxy_cache_min_uses 2;
定义缓存的最小使用次数,即当客户端请求某一资源时达到设定次数时才会被缓存
对不同的缓存定义不同的有效时间
例:proxy_cache_valid 200 302 10m;
proxy_cache_valid 404 1m;
定义时候允许使用过期的缓存,这里的过期是指后端服务器更新资源后,缓存的内容不再是最新的了。
例:.prox_cache_use_stale error | timeout | invalid_header | updating | http_500 | http_502 | http_503 | http_504 | http_403 | http_404 | http_429 | off ...;
在实际环境中,常常会遇到连接异常中断的情况,所以需要定义响应超时的时间。
定义代理向后端服务建立连接(TCP三次握手)的超时时间,默认是60秒,最长为75秒
例:proxy_connect_timeout 10;
定义代理与后端服务建立连接后,后端读取响应给代理的超时时间
向后端发送请求的超时时间
由于nginx是一个处理静态内容的工具,但当用户请求为动态内容时,就需要使用fastcgi协议将动态内容交由php来处理并响应给代理再响应客户端。
fcgi传输处理请求的能力不如httpd,常常会用到lnamp架构。当用户请求静态资源时就在本地处理并响应,当客户端请求的是动态资源时由nginx作为代理转发至后端AP服务器,之间用http协议进行传输,这样能提高性能。
总结:1.如何实现代理,如何实现映射
2.如何建立缓存实现加速
3.连接超时时长的定义
转载于:https://blog.51cto.com/13322786/2161346