当系统数据量发展到一定程度后,往往需要进行数据库的垂直切分和水平切分,以实现负载均衡和性能提升,而数据切分后随之会带来多数据源整合等等问题。如果仅仅从应用程序的角度去解决这类问题,无疑会加重应用程度的复杂度,因此需要一个成熟的第三方解决方案。
Amoeba正是解决此类问题的一个开源方案,Amoeba位于应用程序和数据库服 务器之间,相当于提供了一个代理,使得应用程序只要连接一个Amoeba,相当于只是在操作一个单独的数据库服务器,而实际上却是在操作多个数据库服务 器,这中间的工作全部交由Amoeba去完成。
本文针对基于MySQL的水平切分的实现机制,讲解Amoeba For MySQL的简单应用。
一、背景介绍
使用数据库:MySQL
数据库节点1:127.0.0.1
数据库节点2:10.167.157.176
数据库名:yunzhu
切分的表:用户表(user_info)
切分的参数:用户ID(USERID)
切分规则:
用户ID小于等于100的数据存到数据库节点1,
用户ID大于100的数据存到数据库节点2
user_info表结构如下:
- CREATE TABLE `user_info` (
- `USERID` INT(10) NOT NULL DEFAULT '0',
- `USERNAME` VARCHAR(50) NULL DEFAULT NULL,
- PRIMARY KEY (`USERID`)
- )
数据库节点1中user_info表中的数据:
+--------+-----------+ | USERID | USERNAME | +--------+-----------+ | 73 | Chen Feng | | 88 | China | +--------+-----------+
数据库节点1中user_info表中的数据:
+--------+----------+ | USERID | USERNAME | +--------+----------+ | 108 | Jiang Su | | 200 | NanJing | +--------+----------+
Amoeba版本:
amoeba-mysql-binary-2.2.0
下载地址:
http://nchc.dl.sourceforge.net/project/amoeba/Amoeba%20for%20mysql/2.2.x/amoeba-mysql-binary-2.2.0.tar.gz
下载后直接解压即可使用
二、配置Amoeba
配置文件全部位于conf目录下
1、amoeba.xml
配置连接Amoeba程序的用户名和密码:
- <property name="user">root</property>
- <property name="password">chenfeng123</property>
2、dbServers.xml
先配置一个抽象的父节点,定义多个数据库节点的共通的信息,包括数据库节点的端口、schema、用户名和密码:
- <dbServer name="abstractServer" abstractive="true">
- <factoryConfig class="com.meidusa.amoeba.mysql.net.MysqlServerConnectionFactory">
- ......
-
-
- <property name="port">3306</property>
-
-
- <property name="schema">yunzhu</property>
-
-
- <property name="user">root</property>
-
-
- <property name="password">chenfeng</property>
- </factoryConfig>
- ......
- </dbServer>
再配置两个数据库节点,继承上面的父节点,然后配置各自的IP地址即可:
- <dbServer name="server1" parent="abstractServer">
- <factoryConfig>
-
- <property name="ipAddress">127.0.0.1</property>
- </factoryConfig>
- </dbServer>
-
- <dbServer name="server2" parent="abstractServer">
- <factoryConfig>
-
- <property name="ipAddress">10.167.157.176</property>
- </factoryConfig>
- </dbServer>
3、rule.xml
配置切分规则:
1、schema指定数据库名,name指定表名,defaultPools指定关联的数据库节点(指定哪几个节点就从哪几个节点里面查数据)
2、切分规则:
1)用户ID小于100的数据存到数据库节点1
2)用户ID大于100的数据存到数据库节点2
- <amoeba:rule xmlns:amoeba="http://amoeba.meidusa.com/">
- <tableRule name="user_info" schema="yunzhu" defaultPools="server1,server2">
- <rule name="rule1">
- <parameters>USERID</parameters>
- <expression><![CDATA[ USERID <= 100]]></expression>
- <defaultPools>server1</defaultPools>
- <readPools>server1</readPools>
- <writePools>server1</writePools>
- </rule>
- <rule name="rule2">
- <parameters>USERID</parameters>
- <expression><![CDATA[ USERID > 100 ]]></expression>
- <defaultPools>server2</defaultPools>
- <writePools>server2</writePools>
- <readPools>server2</readPools>
- </rule>
- </tableRule>
- </amoeba:rule>
三、运行及验证
1、启动Amoeba
通过bin目录下的amoeba.bat启动:
启动后控制台打印如下信息,可以看到:
- log4j:WARN log4j config load completed from file:D:\JavaTools\amoeba-mysql-binar
- y-2.2.0\bin\..\conf\log4j.xml
- 2013-01-08 09:32:27,765 INFO context.MysqlRuntimeContext - Amoeba for Mysql cur
- rent versoin=5.1.45-mysql-amoeba-proxy-2.2.0
- log4j:WARN ip access config load completed from file:D:\JavaTools\amoeba-mysql-b
- inary-2.2.0\bin\../conf/access_list.conf
- 2013-01-08 09:32:27,921 INFO net.ServerableConnectionManager - Amoeba for Mysql
- listening on 0.0.0.0/0.0.0.0:8066.
- 2013-01-08 09:32:27,921 INFO net.ServerableConnectionManager - Amoeba Monitor S
- erver listening on /127.0.0.1:40170.
2、连接Amoeba
通过mysql客户端连接Amoeba,端口指定为8066,然后还像以前操作MySQL一样进行操作:
- D:\>mysql -P8066 -uroot -pchenfeng123
- Welcome to the MySQL monitor. Commands end with ; or \g.
- Your MySQL connection id is 21616774 to server version: 5.1.45-mysql-amoeba-prox
- y-2.2.0
-
- Type 'help;' or '\h' for help. Type '\c' to clear the buffer.
-
- mysql>
3、验证数据的查询
查询yunzhu库下的user_info表的数据,如下:
- mysql> select * from yunzhu.user_info;
- +
- | USERID | USERNAME |
- +
- | 108 | Jiang Su |
- | 200 | NanJing |
- | 73 | Chen Feng |
- | 88 | China |
- +
- 4 rows in set (0.02 sec)
可以看到,现在查到了两个数据库节点中的user_info表中的所有记录。
4、验证数据的插入
这里插入两条数据,一条USERID为55,另一条USERID为155,如下:
- mysql> insert into yunzhu.user_info(USERID,USERNAME) values(55,'test55');
- Query OK, 1 row affected (0.13 sec)
-
- mysql> insert into yunzhu.user_info(USERID,USERNAME) values(155,'test155');
- Query OK, 1 row affected (0.05 sec)
查询数据库节点1:
- D:\>mysql -uroot -pchenfeng
- Welcome to the MySQL monitor. Commands end with ; or \g.
- Your MySQL connection id is 33 to server version: 5.0.18-nt
-
- Type 'help;' or '\h' for help. Type '\c' to clear the buffer.
-
- mysql> select * from yunzhu.user_info;
- +--------+-----------+
- | USERID | USERNAME |
- +--------+-----------+
- | 55 | test55 |
- | 73 | Chen Feng |
- | 88 | China |
- +--------+-----------+
- 3 rows in set (0.00 sec)
查询数据库节点2:
- D:\>mysql -uroot -pchenfeng -h10.167.157.176
- Welcome to the MySQL monitor. Commands end with ; or \g.
- Your MySQL connection id is 34 to server version: 5.0.18-nt
-
- Type 'help;' or '\h' for help. Type '\c' to clear the buffer.
-
- mysql> select * from yunzhu.user_info;
- +--------+----------+
- | USERID | USERNAME |
- +--------+----------+
- | 108 | Jiang Su |
- | 155 | test155 |
- | 200 | NanJing |
- +--------+----------+
- 3 rows in set (0.00 sec)
可以发现USERID为55的记录插入到了数据库节点1中,USERID为155的记录插入到了数据库节点2中。
因为根据rule.xml中的切分规则,USERID小于等于100的的记录存在数据库节点1中,而大于100的则存在数据库节点2中。
四、注意一些限制
这是我在实践中发现的,刚开始不知道存在这样的限制,以致于浪费了很多时间,以为配置有问题,搞了很久才发现原来是因为这些限制才导致没有出现预期的结果,所以必须要注意:
1、不管是查询和插入,每条都必须显式地指定数据库名(yunzhu),否则只会从一个数据库节点中查询数据,或者所有数据全部会插入一个数据库节点中。
2、插入数据时,必须显式地指定列名,如“insert into yunzhu.user_info(USERID,USERNAME)”,否则切分规则不会生效,所有记录都会插入到一个数据库节点中。