MySQL复制入门

Ⅰ、复制类型

1.1 逻辑复制

  • 记录每次逻辑操作
  • 主从数据库可以不一致

1.2 物理逻辑复制

  • 记录每次对于数据页的操作
  • 主从数据物理严格一致
  • 基于重做日志

说明:

如果一个块(页)修改了,就把这个修改发到远端

主从两端不仅仅是数据一致,而是物理上的一致,页都是一样的

1.3 复制选型与对比

简单的主从环境,两边同样的表,space_id不用一样,只要保证数据在逻辑内容上一致,物理上不用一样。也就是说,一张表的数据一致就行,不要求这些数据对应的表空间里面内容也一致

Oracle的优势
Oracle中commit时间是平均的,MySQL却不是

MySQL中事务越大commit越慢,binlog是事务执行完commit之后才写,从而产生延时的问题,Oracle中是物理逻辑复制,块的变化实时同步到从上

MySQL的优势
做大数据,把MySQL里面的数据变化传到数据仓库平台,MySQL做起来就很方便,Oralce做起来麻烦,物理日志要去解析是解析不出来行的变化的,但是有ogg工具可以同步到hive,不过偏商业

Ⅱ、典型关系型数据库复制对比

- MySQL Oracle Data Gurad SQL Server Mirroring
类型 逻辑复制 物理逻辑复制 物理逻辑复制
优点 灵活 复制速度快 复制速度快
缺点 配置不当易出错 要求物理数据严格一致 要求物理数据严格一致

问:MySQL的innodb也有redo,那为什么不支持redo级别的复制呢?

答:因为MySQL有很多种引擎,需要有一个统一的复制层,而不是在引擎层做复制,所以在server层实现复制,每个引擎做一个复制就做不到一致性了

一般业务架构,一主两从足够,金融行业可能会做一主四从

Ⅲ、复制搭建

小常识
MySQL的事务一次commit分成三个阶段

第一阶段的prepare和第三阶段的commit都在innodb层

第二阶段的write binlog在server层

三个步骤都是group commit的,所以性能不会差

3.1 基本原理

 +-----+                      +-----+  
 |  M  |                      |  S  | 
 +--+--+                      +--^--+
    | change                     | apply
    |              +-----+   +---+--+
    |        +---->|io td|   |sql td| 
    |        |     +--+--+   +---^--+ 
    |        |        |          |
    |        |        |in_put    | out_put
 +--v-----+  |   +----v----+     |
 | binlog +--^   |relay log+-----^
 +--------+      +---------+

当commit写到二进制文件之后,如果搭建了复制,就会有一个dump thread将binlog传送到远程服务器

远端服务器上有一个IO thread来接收这些event放到relay log中,还有一个SQL thread来回放relay log中的event

5.6版本开始,可以多个线程并行回放,所以速度相对来说可能快一些

tips:
①关于binlog,详见binlog——逻辑复制的基础

②master发送给slave的是什么东西?具体怎么发送的? 答:以event为最小单位发送,千万不要说sql语句或者记录

③关于relay log

  • Relay_Log_File和Relay_Log_Pos 是中继日志(relay log)信息
  • 由于IO线程拉取数据的速度快于SQL线程回放数据的速度,所以relay log可在两者之间起到一个缓冲的作用
  • relay log的格式和binlog的格式是一样的,但是两者的内容是不一样的(不是和binlog一一对应的)
  • relay log在SQL线程回放完成后就会被删除(默认),而 binlog 不会(由expire_logs_days控制)
  • relay log 可以通过设置 relay_log_purge=0,使得relay Log不被删除(MHA中不希望被purge),需要通过外部的脚本进行删除

3.2 动手搭一个

炒鸡简单,虽然没mongodb简单,但比oracle简单太多了(redis的cluster比mongodb都简单),搞起来!!!

步骤 操作
step1 主机备份数据
step2 从机恢复数据
step3 主机授权一个复制用户权限
step4 从机change master to(filename,pos)
  • pos之前是导过来的数据,pos之后通过binlog同步,这是一个最终一致性的模型,master不断将binlog发到slave
  • binlog的恢复是手工的,MySQL的复制是准实时的

实操

本人是穷人,这里用单机多实例模拟:
主用3306端口    server-id:3306
从用3307端口    server-id:3307

重点:
主从之间的server-id千万不能一样,否则可能导致宕机

说明:我这里3306跑的是mysql5.5,3307跑的mysql5.6,所以bashrc和my.cnf中配置的东西55就是3306,56就是3307的意思

step1:
主上做备份
[root@VM_0_5_centos ~]# mysqldump --single-transaction --master-data=1 -A -S /tmp/mysql.sock55 > /tmp/fullbackup.sql

step2:
从上导入备份
[root@VM_0_5_centos ~]# mysql56 < /tmp/fullbackup.sql

step3:
主上授权复制用户权限
([email protected]) [test]> create user 'rpl'@'%' identified by '123';
Query OK, 0 rows affected (0.01 sec)
([email protected]) [test]> grant replication slave on *.* to 'rpl'@'%'; --需要replication和slave的权限,线上建议 限制成内网的网段
Query OK, 0 rows affected (0.01 sec)

打开备份文件,找到二进制文件位置点
[root@VM_0_5_centos ~]# head -n 30 /tmp/fullbackup.sql
CHANGE MASTER TO MASTER_LOG_FILE='bin.000004', MASTER_LOG_POS=107;
找到上面这句

step4:
登陆到从实例执行如下语句:
([email protected]) [test]> CHANGE MASTER TO MASTER_LOG_FILE='bin.000004', MASTER_LOG_POS=107, MASTER_HOST='127.0.0.1' ,MASTER_PORT=3306 ,MASTER_USER='rpl' ,MASTER_PASSWORD='123';
Query OK, 0 rows affected, 2 warnings (0.12 sec) -- 有warning是因为密码写在了里面

检查:
从上执行show slave status\G --此处只贴部分关键内容
([email protected]) [test]> show slave status\G
*************************** 1. row ***************************
 Slave_IO_State: 
 Master_Host: 127.0.0.1
 Master_User: rpl
 Master_Port: 3306
 Connect_Retry: 60
 Master_Log_File: bin.000004        -- change master中的filename
 Read_Master_Log_Pos: 107           -- change master中的pos
 Relay_Log_File: relay.000001
 Relay_Log_Pos: 4
 Relay_Master_Log_File: bin.000004
 Slave_IO_Running: No 
 Slave_SQL_Running: No
 
到这一步,我们的主从复制就搭建好了!但是我们看到io线程和sql线程都是no,我们需要在从机上启动复制
([email protected]) [test]>start slave;
Query OK, 0 rows affected (0.00 se
再看两个线程就都是Yes了
Slave_IO_Running和Slave_SQL_Running这两个指标都为YES,表示目前的复制的状态是正常的

3.3 细说show slave status\G

([email protected]) [test]> show slave status\G
*************************** 1. row ***************************
               Slave_IO_State: Waiting for master to send event     IO线程状态
                  Master_Host: 127.0.0.1                            主机IP
                  Master_User: rpl                                  复制用户名
                  Master_Port: 3306                                 主机端口号
                Connect_Retry: 60                                   连不上,重连次数,默认60次
              Master_Log_File: bin.000004                           当前同步到主机的logfile
          Read_Master_Log_Pos: 15451622                             当前同步到的位置点
               Relay_Log_File: cloud-relay-bin.000002               slave上的中继日志
                Relay_Log_Pos: 15451775                             中继日志的位置点
        Relay_Master_Log_File: bin.000004                           当前Relay文件对应的Master文件
             Slave_IO_Running: Yes                                  IO线程状态
            Slave_SQL_Running: Yes                                  SQL线程状态
              Replicate_Do_DB:
          Replicate_Ignore_DB:
           Replicate_Do_Table:  
       Replicate_Ignore_Table:
      Replicate_Wild_Do_Table:
  Replicate_Wild_Ignore_Table:
                   Last_Errno: 0                                    最近一次的错误号
                   Last_Error:                                      最近一次错误信息
                 Skip_Counter: 0                                    跳过错误次数
          Exec_Master_Log_Pos: 15451622                             现在回放到的位置
              Relay_Log_Space: 15451944                             当前中继日志的大小
              Until_Condition: None                                           
               Until_Log_File:
                Until_Log_Pos: 0
           Master_SSL_Allowed: No
           Master_SSL_CA_File:
           Master_SSL_CA_Path:
              Master_SSL_Cert:
            Master_SSL_Cipher:
               Master_SSL_Key:
        Seconds_Behind_Master: 0                                    sql线程落后io线程的时间
Master_SSL_Verify_Server_Cert: No
                Last_IO_Errno: 0
                Last_IO_Error:
               Last_SQL_Errno: 0
               Last_SQL_Error:
  Replicate_Ignore_Server_Ids:
             Master_Server_Id: 3306
                  Master_UUID:
             Master_Info_File: /data/mysql_test_data56/master.info
                    SQL_Delay: 0
          SQL_Remaining_Delay: NULL
      Slave_SQL_Running_State: Slave has read all relay log; waiting for the slave I/O thread to update it
           Master_Retry_Count: 86400
                  Master_Bind:
      Last_IO_Error_Timestamp:
     Last_SQL_Error_Timestamp:
               Master_SSL_Crl:
           Master_SSL_Crlpath:
           Retrieved_Gtid_Set:
            Executed_Gtid_Set:
                Auto_Position: 0

最终来看,io线程和sql线程执行的位置应该一样,但是通常sql线程会比io线程慢一点

tips:
①Seconds_Behind_Master: The number of seconds that the slave SQL thread is behind processing the master binary log

relay log中event记录的时间戳是主库上的时间戳,而SQL thread的时间戳是从库上的,只有主从时间完全一致,该指标才有意义

②重连机制

slave-net-timeout       从获取不到数据后等待时间
master-connect-retry    重连等待时间
master-retry-count      重连次数

当从库发现从主库上无法获得更多的数据了,就会等待slave-net-timeout时间,然后将IO thread置为no状态,接着开始尝试重建建立连接,每次建立失败之后等待master-connect-retry时间,一直重试master-retry-count次

Ⅳ、主从架构中常用的操作

4.1 主

查看从服务器列表
([email protected]) [test]> show slave hosts;
+-----------+------+-------+-----------+
| Server_id | Host | Port  | Master_id |
+-----------+------+-------+-----------+
|    3307   |      | 3307  |    3306   |
+-----------+------+-------+-----------+
1 row in set (0.00 sec)

看binlog到了什么位置
([email protected]) [test]> show master status;
+----------------+----------+--------------+------------------+
| File           | Position | Binlog_Do_DB | Binlog_Ignore_DB |
+----------------+----------+--------------+------------------+
| mysql-bin.003  |     73   |              |                  |
+-------------------------------------------------------------+
1 row in set (0.00 sec)

4.2 从

show slave status;

change master to

start/stop slave

4.3 报错处理

模拟报错:
从:
([email protected]) [test]> create database sb;
Query OK, 1 row affected (0.00 sec)

主:
([email protected]) [test]> create database sb;
Query OK, 1 row affected (0.00 sec)

从:
([email protected]) [test]> show slave status\G
Last_SQL_Errno: 1007
Last_SQL_Error: Error 'Can't create database 'sb'; database exists' on query. Default database: 'sb'. Query: 'create database sb'

报错冲突了!

怎么办?
从:
执行如下sql,跳过当前报错,不执行这个event
([email protected]) [test]> set global sql_slave_skip_counter=1;
Query OK, 0 row affected (0.00 sec)
重新把主从复制拉起来
start slave;
Query OK, 0 row affected (0.00 sec)

关于这个跳过当前报错后面会专门具体展开分析,暂时了解这么多即可

Ⅴ、read_only与super_read_only

如果在slave机器上对数据库进行修改或者删除,会导致主从的不一致,需要对Slave机器设置为read_only = 1 ,让slave提供只读操作。

tips:

  • read_only仅仅对没有SUPER权限的用户有效(即 mysql.user表的Super_priv字段为Y),一般给APP的权限是不需要SUPER权限的

  • MySQL 5.7中参数super_read_only可以将有SUPER权限的用户也设置为只读,且该参数设置为ON后,read_only也跟着自动设置为ON

  • 当前MySQL中,在/etc/my.cnf中将super_read_only=1配置好后重启,还是可以插入或修改数据。需要在命令行中执行set global super_read_only=1; 才能真正修改为只读,具体何时修复还没注意

你可能感兴趣的:(MySQL复制入门)