Varnish反向代理服务器
Varnish是一个开源的轻量级Cache和反向代理软件,通常只为http提供缓存,与Squit相比,Varnish具有性能更高、速度更快、管理更方便等优点。
Varnish的特点:
- 基于内存进行缓存,重启后数据将丢失
- 利用虚拟内存方式,IO性能好
- 支持设置0-60秒的精确缓存时间
- VCL配置管理比较灵活
- 32位机器上只能支持最大缓存文件大小为2GB,需要更大的缓存文件只有安装64位操作系统
- 具有强大的管理功能
- 利用二叉堆管理缓存文件,可达到积极删除目的
Varnish与Squid比较:
相同点:
- 两者都是反向代理服务器
- 两者都是开源软件
不同点(同时也是Varnish的优点):
- Varnish稳定性高
- varnish访问速度快
- Varnish可以支持更多的并发连接
- Varnish可以通过管理端口,使用正则表达式批量清除部分缓存
Varnish的缺点:
Varnish在高并发情况下CPU、IO和内存资源开销大
Varnish进程一旦挂起、崩溃或重启,缓存数据都会从内存中释放,此刻所有请求都会发送到后端服务器上,在高并发情况下,会给后端服务器造成很大的压力
VCL即varnish Configuation Language
它用来定义Varnish的存取策略,需要注意“\”字符在这里没有特别含义,它只是配置语言,并不是编程语言。
VCL语法:
1.vcl_recv函数:
用来接收和处理请求,当请求到达并被成功接收后被调用,通过判断请求的数据来决定如何处理请求。
2.vcl_pipe函数:
在进入pipe模式时被调用,用于将请求直接传递至后端主机,在请求和返回的内容没有变化的情况下,将不变的内容返回给客户端,直到这个连接被关闭。
3.vcl_pass函数::
在进入pass模式时被调用,用于将请求直接传递至后端主机。后端主机在应答数据后将应答数据发送给客户端,但不进行任何缓存,在当前连接下每次都返回最新的内容。
4.lookup:
在缓存中查找被请求的对象,并且根据查找的结果把控制权交给函数vcl_hit或函数vcl_miss。
5.vcl_hit函数:
在执行lookup指令后,在缓存中找到请求的内容后将自动调用该函数。
6.vcl_miss函数:
在执行lookup指令后,在缓存中没有找到请求的内容时自动条用该方法。此函数可用于判断是否需要从后端服务器获取内容。
7.vcl_fetch函数:
在后端主机更新缓存并且获取内容后调用该方法,接着,通过判断获取的内容来决定是将内容放入缓存,还是直接返回给客户端。
8.vcl_deliver函数:
将在缓存中找到请求的内容发送给客户端前调用此方法。
9.vcl_timeout函数:
在缓存内容到期前调用此函数。
10.vcl_discard函数:
在缓存内容到期后或缓存空间不够时,自动调用该函数。
VCL处理流程图
Varnish处理HTTP请求的过程大致分为如下步骤:
1.Receive状态:请求处理的入口状态,根据VCL规则判断该请求应该Pass或Pipe,还是进入Lookup(本地查询);
2.Lookup状态:进入此状态后,会在hash表中查找数据,若找到,则进入Hit状态,否则进入Miss状态;
3.Pass状态:在此状态下,会进入后端请求,即进入Fetch状态;
4.Fetch状态:在Fetch状态下,对请求进行后端获取,发送请求,获得数据,并进行本地存储;
5.Deliver状态:将获取到的数据发送给客户端,然后完成本次请求。
Varnish程序环境:
配置文件:
- /etc/varnish/varnish.params(/etc/sysconfig/varnishd):配置varnish服务进程的工作特性(监听地址,端口,缓存机制等)
- /etc/varnish/default.vcl:配置各Child/Cache线程的工作特性
主程序:
- /usr/sbin/varnishd
CLI interface:
- /usr/bin/varnishadmin:通过此管理工具,完成与Manager Process的交互,进而控制varnish的工作特性
Share Memory Log交互工具:
- /usr/bin/varnishhist:日志历史
- /usr/binvarnishlog:记录详细log(请求报文首部,响应报文首部等)
- /usr/bin/varnishcsa:格式化记录日志
- /usr/bin/varnishstat:日志统计
- /usr/bin/varnishtop:日志排序分析
测试工具程序:
- /usr/bin/varnishtest
VCL配置文件重载程序: - /usr/sbin/varnish_reload_vcl:此程序会编译配置文件
Systemd Unit File:
- /usr/lib/systemd/system/varnish.service:varnish服务
- /usr/lib/systemd/system/varnishlog.service:原始记录日志(保存磁在盘上)
- /usr/lib/systemd/system/varnishncsa.service:ncsa格式日志(保存磁在盘上)
系统环境:
主机名 | 操作系统 | IP地址 | 服务名 |
---|---|---|---|
Varnish-server | centos7.4 | 192.168.96.22 | varnish 4.0.5 |
web1 | centos7.4 | 192.168.96.23 | httpd 2.4.6 |
web2 | centos7.4 | 192.168.96.25 | httpd 2.4.6 |
客户机 | windows 10 | 192.168.96.2 | 网页浏览器 |
关闭防火墙及Selinux
systemctl stop firewalld
setenforce 0
实现功能:
主要通过Varnish缓存代理服务器对应多台web服务器实现负载均衡与健康监测及日志输出的功能。
开始部署:
负载均衡与健康监测
1.安装varnish(从Centos7开始,varnish已被收入到epel仓库)
yum -y install varnish
2.新建varnish用户
useradd -M -s /sbin/nologin varnish
3.修改varnish目录属主属组
chown -R varnish.varnish /etc/varnish/
4.编辑varnishd主配置文件
vim /etc/varnish/varnish.params
#varnish监听地址及端口
VARNISH_LISTEN_ADDRESS=192.168.96.22
VARNISH_LISTEN_PORT=80
VARNISH_ADMIN_LISTEN_ADDRESS=127.0.0.1
VARNISH_ADMIN_LISTEN_PORT=3500
#线程调优
DAEMON_OPTS="-p thread_pool_min=100 -p thread_pool_max=5000 -p thread_pool_timeout=300"
5.编辑varnish配置文件
vim /etc/varnish/default.vcl
vcl 4.0;
import directors;
#定义健康监测机制
probe check {
.url="/"; #检测时请求的URL,默认为"/"
.interval=5s; #检测频率
.timeout=1s; #超时时间
.window=5; #基于最近的多少次检查来判断其健康状态
.threshold=3; #最近.window中定义的次数至有.threshold的次数是成功的
}
#定义后端服务器web1
backend web1 {
.host = "192.168.96.23";
.port = "80";
.probe=check; #健康监测
}
#定义后端服务器web2
backend web2 {
.host="192.168.96.25";
.port="80";
.probe=check; #健康监测
}
sub vcl_init {
new bar=directors.round_robin(); #轮询
bar.add_backend(web1);
bar.add_backend(web2);
}
sub vcl_recv {
set req.backend_hint=bar.backend();
}
sub vcl_backend_response {
}
#添加一个Header标识,以判断缓存是否命中
sub vcl_deliver {
if (obj.hits > 0) {
set resp.http.X-Cache = "HIT,Varnish提供服务";
} else {
set resp.http.X-Cache = "MISS,web服务器提供服务";
}
return (deliver);
}
6.启动varnish服务
systemctl start varnish
7.查询varnish端口监听
netstat tunlp | grep varnish
8.功能测试
8.1.在Varnish服务器上开启监控
varnishstat
8.2.在windows 10 中通过网页浏览器访问http://192.168.96.22,可以实现负载均衡
8.3通过fiddler抓包测试:
8.4.回到Varnish服务器查看监控页面,可以看到它的命中率(这里我仅测试了203次)
Varnish日志管理
Varnish是通过内存共享的方式提供日志的,主要提供了两种日志输出形式,分别是:
1.通过自带的Varnish指令获得Varnish详细的系统运行日志;
2.通过自带的Varnishncsa指令得到类似Apache的combined输出格式的日志;
1.创建varnish的cache及log文件夹
#创建cache/log目录
mkdir -p /data/varnish/cache
mkdir -p /data/varnish/log
#修改目录的属主、属组信息
chown -R /data/varnish/
2.创建varnishncsa管理脚本
vim /etc/init.d/varnishncsa
#!/bin/sh
if [ "$1" = "start" ];then
/usr/bin/varnishncsa -n /data/varnish/cache -w /data/varnish/log/varnish.log & 2> /dev/null
elif [ "$1" = "stop" ];then
killall varnishncsa
else
echo $0 "{start | stop}"
fi
3.修改varnishncsa脚本权限
chmod 755 /etc/init.d/varnishncsa
4.启动varnishncsa脚本
/etc/init.d/varnishncsa start
5.验证日志是否成功
Varnish服务器log目录下已经是生成日志文件
实时查看该日志文件,当有客户端访问会直接显示出记录
Linux内核参数的优化
1.以下为官方给出的内核参数优化项
vim /etc/sysctl.conf
net.ipv4.ip_local_port_range=1024 65535
net.core.rmem_max=16777216
net.core.wmem_max=16777216
net.ipv4.tcp_rmem=4096 87380 16777216
net.ipv4.tcp_wmem=4096 65535 16777216
net.ipv4.tcp_fin_timeout=30
net.core.netdev_max_backlog=30000
net.ipv4.tcp_no_metrics_save=1
net.core.somaxconn=262144
net.ipv4.tcp_syncookies=1
net.ipv4.tcp_max_orphans=262144
net.ipv4.tcp_max_syn_backlog=262144
net.ipv4.tcp_synack_retries=2
net.ipv4.tcp_syn_retries=2
2.重新加载配置
sysctl -p
系统资源优化
这里为临时修改,永久修改需放入varnish的启动脚本中
ulimit -HSn 131072
ulimit -HSc unlimited