1、四层,七层代理的配置方法
2、负载均衡的算法
nginx负载均衡:反向代理来实现
反向代理有两种转发方式:1、四层代理 2、七层代理
七层是最常见的反向代理方式,只能配置在nginx配置文件的http模块,而且配置方法名称:upstream模块 不能写在server模块,也不能写在location模块中,在htp模块中是一个独立的配置。
工作原理:客户端→http请求→七层代理(代理服务器上)→代理服务器转发http请求到内部的一组服务器上(web集群)→客户端不知道请求的是代理服务器还是内部服务器,而且通过代理服务器响应了内部服务器的ip,实际上访问的是代理服务器,请求到代理服务器,代理服务器转发给web服务器,web服务器响应。
四层代理是基于tcp/ip协议层的代理转发方式,可以实现基于ip地址和端口进行负载均衡转发,四层代理无法获取http请求的URL信息,只能对tcp/udp数据包进行转发。流量转发
在nginx中为stream,stream是不能配置在http模块中,配置在全局中,是属于一个独立的模块,不属于其他任何模块。
面试题一:七层代理和四层代理的区别
1、七层代理走的是http请求,可以对请求进行深入的解析和处理,流量控制,内容过滤。
四层代理走的是tcp/udp请求的数据包,转发的是流量。
2、四层代理不能对流量进行控制,也没办法对内容进行过滤,
3、四层代理通常适用于需要处理大量连接请求的场景
七层代理适用于对请求进行精确处理和控制的场景
面试题二:四层代理和七层代理谁的速度块
1、四层代理只是流量转发,不能对请求进行解析和控制,所以速度块。
七层代理要对请求进程处理和解析,所以速度慢。
2、四层代理走的是内核,内核转发的是流量,所以速度快。
七层代理走的是用户态,访问控制,流量处理,所以速度慢。
谷歌看到的请求地址是代理服务器的地址
proxy_pass:配置代理服务器访问的地址,只能写在location模块中
反向代理:客户端访问代理服务器,代理服务器转发请求或者流量到后端服务器
后端的web服务器会有多台(集群),用户并不知道最终访问的是哪一台服务器
反向代理的特点:负载均衡,高可用,可扩展,提高可维护性
upstream:基于https实现负载均衡,就是反向代理
总结:1、http请求的负载均衡方式
2、没有缓存,返回码没有304
3、负载均衡算法
1、默认算法,轮询(rr):请求轮流分配给后端服务器
轮询算法适用于web服务器处理能力相近的情况,不写入任何方法就是默认的轮询算法
2、加权轮询:建立在轮询算法的基础之上,通过给不同的web服务器权重,让处理能力更强的服务器可以分配到更多的请求。
虽然配置了权重值,但是轮询的结果未必准确。
例:
server 192.168.88.20 weight=2;
server 192.168.88.30 weight=3;
30服务器的权重大,会分配到更多的请求
3、ip_hash:根据IP地址计算出一个hash值,使用ip_hash算法,同一个客户端的请求会被分配到同一个后端服务器。保证会话的稳定性。后端服务器的数量发生变化,hash会被重新计算,请求的服务器也会发生变化。
4、最少连接数:least_conn; 轮询,请求发送到当前连接数最少的后端web服务器。
适用于后端服务器处理任务耗时不同的情况,避免了所有请求集中在处理能力更强的后端服务器上。会和加权轮询配合使用。
5、url_hash:根据uri地址计算hash值,使用url_hash,相同请求的uri会分配到同一个后端web服务器。
总结:1、并发量小,默认算法就可以满足使用条件。
2、后端web服务器的处理能力有差异,使用加权轮询和最小连接数配合使用。
3、高并发,会使用ip_hash或url_hash,第一次请求之后会有本地缓存,而且因为hash算法的原因,请求的后台web服务器不会发生变化,可以提高访问速度,访问的是缓存,减轻了后台服务器的请求压力。
4、ip_hash:后端web服务器数量发生变化,请求的服务器也会发生变化
url_hash:请求的地址发生变化,请求的服务器也可能发生变化
面试题三:怎么做反向代理(实际上问的是负载均衡)
反向代理就是负载均衡,要做负载均衡要看使用场景的并发量,访问人数有多少,根据这个指标来确定负载均衡的算法。
并发量小:默认的轮询算法或加权轮询配合最小连接数使用即可
高并发:ip_hash或url_hash来实现,访问一次之后就不会再切换到后端web服务器
下一次访问就是缓存,速度快,后台web服务器请求的压力也会变小。
stream和upstream都可以做反向代理
upstream
轮询算法
192.168.88.30作为代理服务器
修改30服务器
ky30相当于调用的函数,用proxy_pass来调用ky30
修改40服务器和50服务器
到浏览器查看
实验二:加权轮询
在浏览器清除一下缓存,刷新几次发现轮询的结果不一定准确
实验三:ip_hash
在浏览器新开一个页面,清除缓存,通过30代理服务器访问
刷新几次发现一开始的状态码为200,后面的状态码都为304读取的是缓存
因为使用ip_hash算法,同一个客户端的请求会被分配到同一个后端服务器。保证会话的稳定性。
实验四:最少连接数
请求40服务器时状态码为200
请求50时,状态码为304
实验五:url_hash
多刷新几次发现没有变化,访问的都是40服务器
到50服务器中
请求的是location匹配的uri
使用url_hash会把相同请求的uri会分配到同一个后端web服务器
实验六:基于域名实现负载均衡
ky30相当于一个名字可以随便去但是不能为特殊符号
因为没有这个网址,需要在本地做个映射
检查一下
到40服务器中修改域名
在本地做映射
到50服务器中
做映射
开一台新的虚拟机
回到客户机30
在请求头中要包含真实ip地址,和真实的域名才可以在浏览器中成功访问