Mysqlproxy&Hscale
一.
分布存储的常见方式
二.
Mysqlproxy
a)
Mysqlproxy
简介
b)
Mysqlproxy
的工作流程
c)
Mysqlproxy
的
lua
脚本
d)
Mysqlproxy
处理请求机制
// @
演示
e)
Mysqlproxy
重写查询
f)
Mysqlproxy
纠正常见错误
g)
Mysqlproxy
记录
log
h)
执行
shell
脚本
i)
重写结果集
j)
读写分离
k)
负载平衡
三.
Hscale
a)
Hscale
简介
b)
Hscale
的工作原理
一.
分布存储的常见方式
a)
Mysql5.1
支持的分区表
i.
分区的优点:
1.
与单个磁盘或文件系统分区相比,可以存储更多的数据。
2.
对于那些已经失去保存意义的数据,通常可以通过删除与那些数据有关的分区,很容易地删除那些数据。相反地,在某些情况下,添加新数据的过程又可以通过为那些新数据专门增加一个新的分区,来很方便地实现。
ii.
分区算法
1.
RANGE
分区
a)
基于属于一个给定连续区间的列值,把多行分配给分区
LIST
分区
PARTITION BY RANGE (store_id) (
PARTITION p0 VALUES LESS THAN (6),
PARTITION p1 VALUES LESS THAN (11),
PARTITION p2 VALUES LESS THAN (16),
PARTITION p3 VALUES LESS THAN (21)
);
b)
2.
LISRT
分区
a)
类似于按
RANGE
分区,区别在于
LIST
分区是基于列值匹配一个离散值集合中的某个值来进行选择。
PARTITION BY LIST(store_id)
PARTITION pNorth VALUES IN (3,5,6,9,17),
PARTITION pEast VALUES IN (1,2,10,11,19,20),
PARTITION pWest VALUES IN (4,12,13,14,18),
PARTITION pCentral VALUES IN (7,8,15,16)
);
b)
3.
HASH
分区
a)
基于用户定义的表达式的返回值来进行选择的分区,该表达式使用将要插入到表中的这些行的列值进行计算。这个函数可以包含
MySQL
中有效的、产生非负整数值的任何表达式。
PARTITION BY HASH(YEAR(hired))
PARTITIONS 4;
4.
KEY
分区
a)
类似于按
HASH
分区,区别在于
KEY
分区只支持计算一列或多列,且
MySQL
服务器提供其自身的哈希函数。必须有一列或多列包含整数值。
PARTITION BY LINEAR KEY (col1)
PARTITIONS 3;
b)
5.
b)
手工分表
i.
比如
:
passport
的
user_info
与
user_info_cr
二.
Mysqlproxy
a)
Mysqlproxy
简介:
Mysqlproxy
是工作在
mysql
客户端和
server
端之间的中间件,主要可以截获,修改客户端的请求以及
server
端返回的结果。
b)
mysql
的工作流程
c)
Mysqlproxy
的
lua
脚本:
Mysqlproxy mysql proxy
可以在
LUA
文件定义一个或者几个函数,从而来控制代理与
mysql server
交互的过程以及结果,具体的函数如下
,
init(), connect_server(), read_handshake(), send_handshake(),
read_auth(), send_auth(), read_auth_result(), send_auth_result(),
read_query(), read_query_result(), send_query_result(), cleanup()
connect_server() ―
这个函数每次
client
连接的时候被调用,可以用这个函数来处理负载均衡,决定当前的请求发给那个后台的服务器,如果没有指定这个函数,那么就会采用简单的轮询机制。
read_handshake() ―
这个函数在
server
返回初始握手信息时被调用,可以调用这个函数在验证信息发给服务器前进行额外的检查。
read_auth() ― client
发送验证信息给服务器的时候会调用这个函数。
read_auth_result() ―
服务器验证信息返回后调用这个函数。
read_query() ―
每次
client
发送查询请求函数的时候被调用,可以用这个函数进行查询语句的预处理,过滤掉非预期的查询等等,这个是最常用的函数。
read_query_result() ―
查询结果返回是调用的函数,可以进行结果集处理。
应用程序可以通过
lua
脚本重写这些方法,定制自己需要的功能
Connect_server():
可以修改连接参数,实现负载平衡
通过启动命令指定连接的后台服务器:
Mysql-proxy―proxy-backend-addresses=192.168.95.136
在该函数中可以通过,设置
proxy.backend.backend_ndx=1
来指定需要连接的服务器
Read_query(packet):
该方法内可以不对请求做任何修改
可以纠正拼写错误,
slect
,
CRATE
等修改为
select
,
create
过滤请求,批量删除
根据一定的策略重写请求的
sql
语句
添加可能漏掉的语句
注意:如果需要重写
proxy
,需要将命令加入到待发送队列:
Proxy.queries.append(1,string.char(proxy.COM_PROXY),’SHOW DATABASES’)
然后
return PROXY_SEND_QUREY
表示从
query
队列中发送请求
。。。
Read_query_result(injection_packet):
可以根据自己的需要定制返回结果,应用非常灵活
如果需要返回自己构造的
resultset
,需要返回:
Proxy.PROXY_SEND_RESULT
如果需要丢弃结果,需要返回:
Proxy.PROXY_IGNORE_RESULT
附:
mysqlproxy
的主要命令:
•
--help-all
显示所有的帮助选项
•
--admin-address=host:port
管理主机及端口,默认是
4041
•
--proxy-address=host:port
代理服务器的监听地址及端口,默认
4040
•
--proxy-read-only-address=host:port
只读连接时,代理服务器的监听地址及端口。默认
4042
•
--proxy-backend-addresses=host:port
连接真实服务器的地址及监听端口,默认是
3306
,这是
mysql
代理最重要的选项,多个主机之间用空格隔开。使用
rr
算法。
•
--proxy-lua-script=file
指定
lua
脚本的名称
三.
Hscale
a)
Hscale
简介
HSCALE
是基于
MySQL Proxy
的一个插件应用,通过
MySQL Proxy
的
lua
脚
本拦截分拆对应的
SQL
语句来实现数据的分布存储,而且使用
lua
脚本可以自由定制分表策略,比起
MySQL
自己的
partition
更加灵活些。现在版
本还是
0.2
,功能有限,只能实现同库分表,但是基于
MySQL Proxy
的架构,未来要实现示分库分表也不是什么难事。
b)
Hscale
的工作流程
C
注意:
配置文件是安装目录下的
hscale,lua
设置环境变量
Export HSCALE_CONFIG_FILE=/opt/hscale/hscale.lua
Export LUA_PATH=’opt/mysqlproxy/share/mysqlproxy/?.lua;/opt/hscale/src/?.lua’
启动
hascale
Mysql-proxy �Cproxy-lua-script=/opt/hscale/src/…/main.lua
Mysql-Proxy的内部结构体以及变量
mysql-proxy的
LUA配置脚本中可以使用很多内部结构,其中最主要的是
proxy,
proxy提供了很多其他的结构体的接口,比如连接列表,后端服务器列表等等。像
incoming packet这样的来自客户的结构体只是在脚本函数上下文中存在。
属性描述:
connection:包含所有活动客户的连接(
proxy.connection )列表
. .
servers: 后台服务器的列表(
proxy.backends)
queries :某一客户要发送到服务器端的查询
PROXY_VERSION :
mysql-proxy版本,十六进制。
proxy.connection
proxy.connection 是只读对象,提供了当前活动连接的信息
proxy.connection 属性:
thread_id :连接的
threadid
backend_ndx :当前连接所对应的后端服务器编号
proxy.backends
proxy.backends部分可写的,包含了后台服务器以及服务器
meta信息的列表 ,你可以指定当前连接使用那个后台服务器。
proxy.backends 属性:
address: 当前连接的主机名
/端口组合
connected_clients :目前已连接的客户数
state:后台服务器的状态
proxy.queries
proxy.queries是一个要送往服务器的查询队列,
The queue is not populated automatically, but if you do not explicitly populate the queue then queries are passed on to the backend server verbatim. Also, if you do not populate the query queue by hand, then the read_query_result() function is not triggered.
The following methods are supported for populating the proxy.queries object.
函数描述:
append(id,packet) 添加到队尾。
prepend(id,packet) 插入队头。
len() 返回查询的队列长度
以下常量
mysql-proxy用来客户指定操作:
PROXY_SEND_QUERY 发送查询给服务器
.
PROXY_SEND_RESULT 返回客户端查询结果
PROXY_IGNORE_RESULT 丢弃结果集
包状态常量:
MYSQLD_PACKET_OK The packet is OK.
MYSQLD_PACKET_ERR The packet contains error information.
MYSQLD_PACKET_RAW The packet contains raw data.
后台状态常量:
BACKEND_STATE_UNKNOWN The current status is unknown.
BACKEND_STATE_UP The backend is known to be up (available).
BACKEND_STATE_DOWN The backend is known to be down (unavailable).
BACKEND_TYPE_UNKNOWN Backend type is unknown.
BACKEND_TYPE_RW Backend is available for read/write.
BACKEND_TYPE_RO Backend is available only for read-only use.
服务器命令常量:
Constant Description
COM_SLEEP Sleep
COM_QUIT Quit
COM_INIT_DB Initialize database
COM_QUERY Query
COM_FIELD_LIST Field List
COM_CREATE_DB Create database
COM_DROP_DB Drop database
COM_REFRESH Refresh
COM_SHUTDOWN Shutdown
COM_STATISTICS Statistics
COM_PROCESS_INFO Process List
COM_CONNECT Connect
COM_PROCESS_KILL Kill
COM_DEBUG Debug
COM_PING Ping
COM_TIME Time
COM_DELAYED_INSERT Delayed insert
COM_CHANGE_USER Change user
COM_BINLOG_DUMP Binlog dump
COM_TABLE_DUMP Table dump
COM_CONNECT_OUT Connect out
COM_REGISTER_SLAVE Register slave
COM_STMT_PREPARE Prepare server-side statement
COM_STMT_EXECUTE Execute server-side statement
COM_STMT_SEND_LONG_DATA Long data
COM_STMT_CLOSE Close server-side statement
COM_STMT_RESET Reset statement
COM_SET_OPTION Set option
COM_STMT_FETCH Fetch statement
COM_DAEMON Daemon (MySQL 5.1 only)
COM_ERROR Error
MySQL数据类型
Constant Field Type
MYSQL_TYPE_DECIMAL Decimal
MYSQL_TYPE_NEWDECIMAL Decimal (MySQL 5.0 or later)
MYSQL_TYPE_TINY Tiny
MYSQL_TYPE_SHORT Short
MYSQL_TYPE_LONG Long
MYSQL_TYPE_FLOAT Float
MYSQL_TYPE_DOUBLE Double
MYSQL_TYPE_NULL Null
MYSQL_TYPE_TIMESTAMP Timestamp
MYSQL_TYPE_LONGLONG Long long
MYSQL_TYPE_INT24 Integer
MYSQL_TYPE_DATE Date
MYSQL_TYPE_TIME Time
MYSQL_TYPE_DATETIME Datetime
MYSQL_TYPE_YEAR Year
MYSQL_TYPE_NEWDATE Date (MySQL 5.0 or later)
MYSQL_TYPE_ENUM Enumeration
MYSQL_TYPE_SET Set
MYSQL_TYPE_TINY_BLOB Tiny Blob
MYSQL_TYPE_MEDIUM_BLOB Medium Blob
MYSQL_TYPE_LONG_BLOB Long Blob
MYSQL_TYPE_BLOB Blob
MYSQL_TYPE_VAR_STRING Varstring
MYSQL_TYPE_STRING String
MYSQL_TYPE_TINY Tiny (compatible with MYSQL_TYPE_CHAR)
MYSQL_TYPE_ENUM Enumeration (compatible with MYSQL_TYPE_INTERVAL)
MYSQL_TYPE_GEOMETRY Geometry
MYSQL_TYPE_BIT Bit