本文分两篇,一篇nginx配置,一篇haproxy配置,此文为haproxy的配置
HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用的代 理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。
软件负载均衡一般通过两种方式来实现:基于操作系统的软负载实现和基于第三方应用的软负载实现。LVS就是基于Linux操作系统实现的一种软负载,HAProxy就是开源的并且基于第三应用实现的软负载。
HAProxy相比LVS的使用要简单很多,功能方面也很丰富。当 前,HAProxy支持两种主要的代理模式:"tcp"也即4层(大多用于邮件服务器、内部协议通信服务器等),和7层(HTTP)。在4层模式 下,HAProxy仅在客户端和服务器之间转发双向流量。7层模式下,HAProxy会分析协议,并且能通过允许、拒绝、交换、增加、修改或者删除请求 (request)或者回应(response)里指定内容来控制协议,这种操作要基于特定规则。
我现在用HAProxy主要在于它有以下优点,这里我总结下:
一、免费开源,稳定性也是非常好,这个可通过我做的一些小项目可以看出来,单Haproxy也跑得不错,稳定性可以与LVS相媲美;
二、根据官方文档,HAProxy可以跑满10Gbps-New benchmark of HAProxy at 10 Gbps using Myricom's 10GbE NICs (Myri-10G PCI-Express),这个作为软件级负载均衡,也是比较惊人的;
三、HAProxy可以作为MySQL、邮件或其它的非web的负载均衡,我们常用于它作为MySQL(读)负载均衡;
四、自带强大的监控服务器状态的页面,实际环境中我们结合Nagios进行邮件或短信报警,这个也是我非常喜欢它的原因之一;
五、HAProxy支持虚拟主机。
实验环境:
HAProxy IP:10.2.18.219 Centos6.4-64bit Web1 IP:10.2.16.254 Centos6.4-64bit Web2 IP:10.2.16.253 Centos6.4-64bit
vlan互通,两台web事先做好nginx,两台web配置一模一样
make TARGET=linux26 PREFIX=/usr/local/haproxy install
注意:haproxy-1.4.25版本的配置文件对空格有特殊要求,配置项只允许相隔一个空格,而且每个配置项必须顶头写。
HAProxy配置中分成五部分内容,当然这些组件不是必选的,可以根据需要选择部分作为配置。
global:参数是进程级的,通常和操作系统(OS)相关。这些参数一般只设置一次,如果配置无误,就不需要再次配置进行修改
defaults:配置默认参数的,这些参数可以被利用配置到frontend,backend,listen组件;
frontend:接收请求的前端虚拟节点,可以根据规则直接指定具体使用后端的backend(可动态选择)。
backend:后端服务集群的配置,是真实的服务器,一个backend对应一个或者多个实体服务器。
listen:frontend和backend的组合体。
#haproxy 默认没有配置文件,需要自己创建 cd /usr/local/haproxy mkdir conf vim conf/haproxy.conf
下面是本例中的配置:
global
#log 10.2.16.219 local0
maxconn 60000 #最大连接数
chroot /usr/local/haproxy #锁定haproxy运行用户的根目录,类似于vsftp的chroot
uid 99 #指定用户nobody来运行haproxy
gid 99 #指定组nobody来运行haproxy
daemon #使HAProxy进程进入后台运行。这是推荐的运行模式
nbproc 1 #创建1个进程进入deamon模式运行。此参数要求将运行模式设置为"daemon"
pidfile /usr/local/haproxy/logs/haproxy.pid #指定pid文件位置
# debug
defaults
log 10.2.18.219 local3 #指定日志接收ip和接收级别
mode http #默认的模式mode {tcp|http|health},tcp是4层,http是7层,health只会返回OK
option httplog #采用http日志格式
option dontlognull
retries 2 #2次连接失败就认为是服务器不可用
maxconn 60000 #默认的最大连接数
balance roundrobin #定义负载均衡算法,本例选择rr轮询,即(roundrobin)
haproxy的几种常用负载均衡算法:
roudrobin算法:即rr算法,最平衡,最公平的算法。基于权重进行轮询,可以动态调整权值。
static-rr算法:基于权重进行轮叫,为静态算法,在服务器运行时候修改不会生效。
leastconn算法:即lc算法,新连接请求被派发指后端连接较少的服务器上,可以在服务器运行较长会话时,例如sql等,使用此算法。此算法为动态,可以在运行时候调整权重。
source算法: 类似于 nginx的ip_hash,基于hash值,将某一个客户端直接指定到某一固定服务器上。这种情况,在添加或者减少后端服务器时,会有定向抖动的情况,常用于负载均衡无cookie功能的tcp的协议,静态 ,参数不能在运行时修改,除非重新启动Haproxy生效。
uri算法: 对uri的左半部分hash,例如:http://www.xxx.com/adminphp?a=3&b=4 "?"之前的左半部分"adminphp"进行Hash,对同一个uri请求总是被派发到指定的服务器,如果服务器总权重发生变化,也会造成抖动。常用于代理缓存服务器,仅用于http,默认为静态算法,不过可以用hash-type 修改此特性。
stats uri /haproxy-stats #统计页面url
contimeout 5000 #连接超时 此类时间值单位为毫秒(ms) 1s=1000ms
clitimeout 50000 #客户端超时
srvtimeout 50000 #服务器超时
#timeout check 2000 #心跳检测超时
listen web_proxy 10.2.18.219:80 #监听本机的10.2.18.219地址的80端口
mode http #http模式
option httpclose #每次请求完毕后主动关闭http通道,HA-Proxy不支持keepalive模式
#option httpchk HEAD /index.php HTTP/1.0
server web1 10.2.16.253:80 cookie app1inst1 check inter 2000 rise 2 fall 5
server web2 10.2.16.254:80 cookie app1inst2 check inter 2000 rise 2 fall 5
以上一大长行代表的意思:
#server 服务器定义
#cookie 表示server id
#check inter 2000 是检测心跳频率
#rise 2 是2次正确认为服务器可用
#fall 5 是5次失败认为服务器不可用
#weight 代表权重
:wq 至此结束,保存退出
加入日志记录功能 :
在 /etc/rsyslog.conf中增加:
local3.* /var/log/haproxy.log
重启rsyslog
touch /var/log/haproxy.log
chown nobody.nobody /var/log/haproxy.log
chmod u+x /var/log/haproxy.log
# tail -f /var/log/harpoxy.log 查看haproxy日志
启动haproxy
/usr/local/haproxy/sbin/haproxy -f /usr/local/haproxy/conf/haproxy.conf
如果启动时提示错误:
[ALERT] 139/152130 (21163) : Starting proxy web_proxy: cannot bind socket
则意为80端口被占用,关闭占用80端口的服务即可。
预先在客户端的hosts中写入
10.2.18.219 www.czy.com
启动成功后,访问:www.czy.com
此时查看两台web的访问日志,由于没有分配权重,则两台web共同分担访问,隔一次承担一次,如果检测到某台web挂掉,则另一台立即承担全部访问。
进入监控页面:http://www.czy.com/haproxy-stats
至此HA-proxy全部完成!
有关nginx配置请查看本博另一片博文 HA-Proxy+Nginx实现web负载均衡(nginx篇)