第一章:引言
复制:就是复制一个服务器上的所有改变到另一个服务器
备份的功用:错误保护,建立新服务器,法律原因
监控:不监控就无法观察到有问题的查询、过热的从节点、使用不恰当的表等
第二章:mysql复制原理
1.配置master、slave、master和slave之间的连接
2.二进制日志简介
1)在复制中的作用:slave通过二进制日志获取master上的改变
2)事件:event_type、server_id、log_name、pos、end_log_pos、info
3.二进制日志结构和内容
第三章:二进制日志
二进制日志的结构
binlog事件的结构:5.0以后为版本4,设计为可扩展的,如果开发者做了重大改动,版本会变化
组成:1)通用头,2)提交头,3)事件体
注意:
1.事务在master上交错执行,但事务在二进制日志中的顺序不变,取决于事务的提交时间
2.如果服务器突然停止或死机,binlog末尾可能不是轮换事件
记录语句
1.记录DML及DDL语句
2.上下文:
指服务器执行语句时必须知道的隐式信息,如:当前数据库、RAND函数的种子、当前时间、AUTO_INCREMENT字段的插入值、调用LAST_INSERT_ID的返回值、线程ID
与语句有关的隐式信息需要满足:包含对用户定义变量的引用; 包含RAND函数的种子(需要将伪随机种子写入日志); LASTER_INSERT_ID;AUTO_INCREMENT;
二进制日志通过如下事件来存储上下文信息:User_var; Rand; Intvar;
3.LOAD DATA INFILE:
采用一套特殊的事件来用二进制日志处理文件传输
引入的新事件:Begin_load_query; Append_block; Execute_load_query;
4.二进制日志过滤器
binlog-do-db和binlog-ignore-db
5.触发器、事件和存储过程
触发器:在slave上必需(基于语句的复制)
存储过程:
注意:1)CALL语句没有被写入二进制日志,而是将存储过程的主体展开后放入二进制日志
2)对存储过程参数的引用被改写为NAME_CONST函数
3)局部声明的变量pass也换成NAME_CONST函数
4)调用存储过程的语句以Intvar事件作为前缀,且包含insert ID
Event:在slave上被自动禁止
6.特殊结构
LOAD_FILE函数:获取文件的函数,但slave上必须要有此文件,才能被正确执行。
解决方案:1)将文件上传至slave; 2)使用LOAD DATA INFILE重写; 3)在用户变量中存储文件内容;
7.非事务性的变化和错误处理
例:INSERT INTO table(column) values ('xxx');
ERROR 1062:Duplicate entry 'xxx' for key 'PRIMARY'
此语句仍会被二进制日志记录,但master会通过Query事件中的一个错误代码字段登记二进制日志。这个错误代码在SHOW BINLOG EVENT看不到,通过mysqlbinlog可查看
记录事务
默认提交的语句:
1)写文件的语句; 2)修改数据库中表的语句; 3)锁表、管理、LOAD DATA INFILE语句
事务缓存:
非事务性语句不会导致当前事务的结束
记录非事务性语句的规则:
1)如果语句被标记为事务的,它将被写入事务缓存
2)如果语句没有被标记为事务性的,而且事务缓存中无此语句,该语句被直接写入事务缓存
3)如果没有被标记为事务性的,但是事务缓存中有语句,则该语句被写入事务缓存 左边:不应用规则3产生的不良影响 右边:应用规则3的实际情况
避免非事务性语句的复制问题:确保在事务中首先被写入
二进制日志管理
系统崩溃安全:调整sync-binlog
Binlog文件轮换:
导致轮换的活动:
1)服务器停止 情景1:服务器停止后被升级
2)binlog文件达到预设的最大尺寸
3)Binlog被显式刷新 flush logs
4)事故发生
Binlog文件的第一个事件:格式描述(format description)
3个有趣项目:
1)binlog-in-use flag 标记binlog文件是否被正确关闭
2)binlog版本
3)服务器版本 协助开发者找出微小错误
二进制日志中的两种事故标记(incident):
1)stop 表明服务器已通过正常手段停止
2)incident 包含标识符来指定是哪种类型的事故,slave会因此错误停止
第四章:基于复制的数据库高可用技术
双master
两种模式:active-active(两台同时写);active-passive(一台写,另一台被动)
使用如下两个变量处理双master上同时写带来的冲突
auto_increment_offset:自增列的起始值
auto_increment_increment:自增列下一个值的增量
半同步复制
理念:允许更改操作继续执行前,确保操作至少被写入一个slave的磁盘。即slave被告知事务已经在持久存储中后,master的客户端才返回提交指令
第五章:Mysql集群的横向扩展
级联复制:添加log-slave-updates选项配置中继服务器发送slave线程事件,并使用blackhole存储引擎提高性能
第六章:高级复制
多源复制
即一个slave连接多个master。需要处理的冲突如下图: 解决方案:轮询多个master。官方暂未提供此功能,可使用python实现。
基于行的复制
binlog-format:STATEMENT; ROW; MIXED;
混合模式中会切换到基于行的复制的不安全的情况:
1)语句调用了UUID函数,用户自定义函数,CURRENT_USER,USER函数,LOAD_FILE函数
2)同一个语句更改了两张或更多包含AUTO_INCREMENT列的表
3)语句中使用了服务器变量
4)存储引擎不允许使用基于语句的复制,比如mysql cluster引擎
个人认为尽量选用ROW格式的复制,其次是MIXED,最后是最不安全的STATEMENT。
行事件的结构:
mysql闪回即是依据基于行的原理实现
参考文献:《高可用mysql的:构建健壮的数据中心》