本系统采用MySQL一主多从模式设计,即1台 mysql“主”服务器(Master)+多台“从”服务器(Slave),“从”服务器之间通过Haproxy进行负载均衡,对外只提供一个访问IP,当程序需要访问多台"从"服务器时,只需要访问Haproxy,再由Haproxy将请求分发到各个数据库节点。
我们的程序可以有俩个数据源(DataSourceA,DataSourceB),一个(DataSourceA)直接连接主库,另外一个(DataSourceB)连接Haproxy,当需要写入操作时可以使用DataSourceA,读取时使用DataSourceB。
设计图如下:
看到这里大家可能会有一个疑问,这个问题就是主从数据库之间数据同步延时的问题!
因为大多数使用MySQL主从同步数据都是异步的,也就是说当主库的数据发生变化时并不能立即的更新从库,这么做的目的也是为了更好的性能,那么设想一下,当用户新增一条记录后立刻去从库查询,可能并不能查到刚刚新增的数据,这岂不是很脑裂的问题~~~。
然而实际情况并不应该是这样的,我们也不应该这样去设计程序,我们就拿一个类似于CSND博客管理的系统来说,假设一个“博客系统”只有俩部分, 一部分是博客管理后台,用户可以在后台新增,编辑,删除博客。另一部分是门户网站,负责展示所有用户的博客信息,相对于这样一个系统来说, 后台管理模块对数据库的操作压力不是很大,相反门户网站读取博客信息对数据库的压力很大,这也式一般互联网产品的特点,而且最重要的一点是系统可以接受主从同步数据带来的延迟,也就是说当用户在后台新增一条博客时,前台门户网站并不能立即查询到这条信息。一般都是再过一段时间后才会出现在首页,因为大多数系统都有缓存设置,这样正好给主从同步延迟带来时间。
接着说上面的问题,有的同学可能会有这样的疑问,就是后台用户在新增一条记录后,一般都是立即查询返回博客列表,按照上面说的岂不是查询不到~~~,我觉得这个问题可以这么解决:
1、后台用户在进行 新增,查询,编辑,删除等操作时直接连接主库,这样无论什么操作都是实时的,因为后台操作对数据库的压力不是很大,所以读写全部连接主库应该没什么问题!
2、门户网站查询博客列表时从 “从库集群中查询“,通过负载均衡技术,解决了扩展性,高可用性等问题,同时门户网站首页也不需要实时查询主库中的数据,因为网站本身一般都有缓存,也不是实时的。
上面的架构设计只是抛砖引玉,大家有什么好想法也可以相互交流~
本文重点介绍的内容有二点:
1、如何使用Haproxy给MySQL做负载均衡,提供相关的配置说明,健康检查等等。
2、当程序通过连接Haproxy代理之后,如何解决程序中连接池长连接失效的问题。
下面介绍如何安装配置Haproxy~
1、首先进行负载均衡配置。
假设两台MySQL(slave)从服务器 A:192.168.1.191:3306 B:192.168.1.192:3306。
首先在linxu上安装Haproxy,安装过程略。。。。。。
安装完毕后打开配置文件在/etc/haproxy/ haproxy.cfg,配置文件的路径可能不用,别告诉我找不到~~~!
- global
- maxconn 4096
- daemon
- chroot /var/lib/haproxy
- pidfile /var/run/haproxy.pid
- #debug
- #quiet
- user haproxy
- group haproxy
-
- defaults
- log global
- mode http
- option httplog
- option dontlognull
- log 127.0.0.1 local0
- retries 3
- option redispatch
- maxconn 2000
- #contimeout 5000
- #clitimeout 50000
- #srvtimeout 50000
- timeout http-request 10s
- timeout queue 1m
- timeout connect 10s
- timeout client 1m
- timeout server 1m
- timeout http-keep-alive 10s
- timeout check 10s
-
- listen admin_stats 0.0.0.0:8888
- mode http
- stats uri /dbs
- stats realm Global\ statistics
- stats auth admin:admin
-
- listen proxy-mysql 0.0.0.0:23306
- mode tcp
- balance roundrobin
- option tcplog
- option mysql-check user haproxy #在mysql中创建无任何权限用户haproxy,且无密码
- server MySQL1 192.168.1.191:3306 check weight 1 maxconn 2000
- server MySQL2 192.168.1.192:3306 check weight 1 maxconn 2000
- option tcpka
- listen admin_stats 0.0.0.0:8888 这个配置是监控页面,绑定到本机8888端口,账号admin,密码admin
可以通过web的方式查看所有MySQL节点的使用情况, http://你的IP:8888/dbs 即可登录监控后台。
如下图:
- listen proxy-mysql 0.0.0.0:23306
- mode tcp
- balance roundrobin
- option tcplog
- option mysql-check user haproxy #在mysql中创建无任何权限用户haproxy,且无密码
- server MySQL1 192.168.1.191:3306 check weight 1 maxconn 2000
- server MySQL2 192.168.1.192:3306 check weight 1 maxconn 2000
- option tcpka
- pre><pre name="code" class="html">proxy-mysql 0.0.0.0:23306 代理的端口。我们程序连接从库集群时就访问这个端口。
- balance roundrobin 负载均衡方式,有很多种,可以去Google。
- option mysql-check user haproxy 这里是配置健康检查的,也是haproxy自带的功能,<span style="color:#ff6666;">需要在<span style="font-family: Arial, Helvetica, sans-serif;">mysql中创建无任何权限用户haproxy,且无密码span>span>
- server MySQL1 192.168.1.191:3306 check weight 1 maxconn 2000 配置MySQL从库节点,有多少配置多少就行了。
有的同学可能不知道如何在MySQL中创建用户,这里也给你写好了。
用户名为haproxy 且无密码(重要) 否则haproxy无法检测MySQL状态。
CREATE USER 'haproxy'@'%' IDENTIFIED BY '';
如果不能设置为空,则先设置一个密码,然后在数据的user表中 把密码(authentication_string)设置为空。
然后别忘记flush privileges;刷新一下
配置完成后启动代理 service haproxy start 如果用过yum方式安装,应该就能启动了,如果是其它方式安装,可能启动方式不同,需要编写脚本启动,应该不难自己研究一下~~~
然后让我们写个demo测试一下代理是否配置成功了没!
- public static void main(String[] args) throws Exception {
-
-
- Class.forName("com.mysql.jdbc.Driver");
- Connection conn = DriverManager.getConnection("jdbc:mysql://你的IP:23306/template?useUnicode=true", "root", "sql2008");
-
- for (int i = 0; i < 100; i++) {
- PreparedStatement pr = null;
- ResultSet res = null;
- try {
- pr = conn.prepareStatement("select count(*) from sys_user");
- res = pr.executeQuery();
- if(res.next()) {
- System.out.println(new Date().toLocaleString() + "->" + res.getInt(1));
- }
- } catch (Exception e) {
- e.printStackTrace();
- res.close();
- pr.close();
- }
-
- Thread.sleep(25000);
- }
-
- conn.close();
- }
输出结果如下:可以看到代理MySQL成功了,这时你可以随机关掉一个MySQL节点的服务,程序依然能够正常的执行,说明负载均衡也成功了。
- 2015-8-28 10:09:27->7
- 2015-8-28 10:09:52->7
- 2015-8-28 10:10:17->7
- 2015-8-28 10:10:42->7
- 2015-8-28 10:11:07->7
小小的激动有没有~有没有~。于是乎我们就把程序中数据源的配置改造一下,让它连接haproxy即可。
.
是不是以为大功告成了,如果你就这样配置的话,等程序运行起来它就会给你一个大大的surprise
其实这里面是有坑的~~~~,且听我细细道来。
一般的情况下,我相信大家在直接连接MySQL的时候几乎都用到了连接池。
以我的配置为例:
- <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" destroy-method="close">
- <property name="driverClass" value="com.mysql.jdbc.Driver" />
- <property name="jdbcUrl" value="jdbc:mysql://你的IP:23306/你的数据库名称?useUnicode=true" />
- <property name="user" value="xx" />
- <property name="password" value="yy" />
- <property name="initialPoolSize" value="5" />
- <property name="minPoolSize" value="5" />
- <property name="maxPoolSize" value="30" />
- <property name="maxIdleTime" value="0" />
- <property name="idleConnectionTestPeriod" value="30" />
- <property name="acquireIncrement" value="3" />
- <property name="automaticTestTable" value="C3p0TestTable_NotDelete" />
- <property name="autoCommitOnClose" value="false" />
- lt;/bean>
其它的参数这里不解释,大家可以查询C3P0配置信息,网上很多。
这里只说一个:
- idleConnectionTestPeriod=30 这个参数是配置连接池 每隔多少时间去检查池内链接的有效性,单位秒。
- 我这里设置成30秒,那么C3P0会每隔30秒 把连接池内所有的空闲连接拿出来挨个发一个测试SQL语句,已确定这个链接的有效性。
以前我们的数据源是直接连接MySQL数据库的,在正常的情况下MySQL是不会断开这个链接的。
但是我们现在连接的是haproxy,也就是说我们程序的连接(Connection)是与haproxy建立的,这里的坑在于这个连接是会被haproxy断掉的,这样的话你连接池内的链接就变成了无效链接,在下次需要查询数据库时还需要重新创建连接,而且程序由于拿到的连接是无效链接,还有可能报错。
那么haproxy与我们程序之间的连接超时时间在哪设置呢?
- timeout client 1m #这个参数配置程序与haproxy的链接超时时间
- timeout server 1m <span style="font-family: Arial, Helvetica, sans-serif;">#这个参haproxy与mysql链接超时时间span>
这里的超时时间不是指连接过程的超时时间,而是指连接上以后,多少时间内没有心跳,操作这个时间就认为超时,然后断开连接。
写的可能有些啰嗦,我们看个例子开说明一下:
- public static void main(String[] args) throws Exception {
-
-
- Class.forName("com.mysql.jdbc.Driver");
- Connection conn = DriverManager.getConnection("jdbc:mysql://你的IP:23306/template?useUnicode=true", "root", "sql2008");
-
- for (int i = 0; i < 100; i++) {
- PreparedStatement pr = null;
- ResultSet res = null;
- try {
- pr = conn.prepareStatement("select count(*) from sys_user");
- res = pr.executeQuery();
- if(res.next()) {
- System.out.println(new Date().toLocaleString() + "->" + res.getInt(1));
- }
- } catch (Exception e) {
- e.printStackTrace();
- res.close();
- pr.close();
- }
-
- Thread.sleep(60000);
- }
-
- conn.close();
- }
我上面配置的是 timeout client 1m ,也就是说客户端连接到haproxy后 1分钟之内没有数据请求即为超时,就会断掉链接:
- <pre name="code" class="java"><pre name="code" class="java" style="font-size:18px;">第一次查询没有问题:
Thread.sleep(60000); 我把间隔设置为60秒,第二次查询与第一次查询间隔60秒就会报错,因为超时了。
- 那如果我把间隔改为 "font-family: Arial, Helvetica, sans-serif;">Thread.sleep(50000); 50秒,就不会报错。
结论就是
- idleConnectionTestPeriod 的时间一定要小于 <span style="font-size:18px; background-color: rgb(240, 240, 240);">timeout client的时间。这样C3P0会在Haproxy断掉链接之前发送一次“心跳”过去,保持链接的有效性。span>
- <span style="font-size:18px; background-color: rgb(240, 240, 240);">而且 span><span style="font-family: Arial, Helvetica, sans-serif;">timeout client与 span><span style="font-family: Arial, Helvetica, sans-serif;">timeout server 尽量保持一致,已达到最佳效果。span>
PS:如果CentOS7 启动haproxy服务失败,参考下面解决。
https://www.centos.org/forums/viewtopic.PHP?t=52361
http://stackoverflow.com/questions/34793885/haproxy-cannot-bind-socket-0-0-0-08888
setenforce 0
setsebool -P haproxy_connect_any=1