MySQL主从复制故障处理

导致MySQL主从复制结构中断或报错有很多种因素,下面给出几种常见的故障处理方法。

1.新增--slave违反唯一性约束

举例来说,违反主键约束:

Error 'Duplicate entry '26' for key 'PRIMARY''

可能导致的原因,从库中先写入数据占用主键【id=26】,主库后写入主键【id=26】,然后同步给从库,导致从库无法写入。
解决方法有多种:

  • 比如删除从库【id=26】即可解决。
  • 修改从库【id=26】的数据,从库跳过这条执行语句:
stop slave;
set global sql_slave_skip_counter=1;
start slave;

具体执行哪种操作,视情况而定。

2.删除--slave找不到记录

master成功删除一条记录或者drop一张临时表,slave上不存在该记录或临时表
报错如下:

Last_SQL_Error: Could not execute Delete_rows event on table hcy.t1; 
Can't find record in 't1', 
Error_code: 1032; handler error HA_ERR_KEY_NOT_FOUND; 
the event's master log mysql-bin.000006, end_log_pos 254

删除不存在的记录,slave可跳过该语句,执行同上。

3.更新--salve找不到记录

比对master,手工补回丢失的数据,slave跳过该语句。

4.二进制文件(binlog)缺失

误删二进制文件,或者未知原因导致主从复制中断过久,二进制文件被系统清除等。导致从库无法下载binlog。

Last_IO_Error: Got fatal error 1236 from master when reading data from binary log: 'Could not find first log file name in binary log index file'

前三点是slave SQL执行线程报错,第四点是slave IO线程报错,无法下载binlog文件。
处理办法有以下两种:

  • 忽略丢失的文件,查看master日志文件,从最后一个开始同步。
首先停止从库同步
mysql> stop slave;

查看主库日志文件和位置
mysql> show master logs;
+------------------+------------+
| Log_name         | File_size  |
+------------------+------------+
| mysql-bin.001530 | 1079859590 |
| mysql-bin.001531 | 1073742419 |
| mysql-bin.001532 | 1073743077 |
| mysql-bin.001533 | 1073743130 |
| mysql-bin.001534 | 1074996301 |
+------------------+------------+
5 rows in set (0.00 sec)

回从库,使日志文件和位置对应主库
CHANGE MASTER TO MASTER_LOG_FILE='mysql-bin.001530',MASTER_LOG_POS=1079859590 ;

最后,启动从库:
mysql> start slave;
show slave status\G;

5.中继日志损坏

解决方法:找到同步的binlog和POS点,然后重新做同步,这样就可以有新的中继日值。

mysql> show slave status\G;
*************************** 1. row ***************************
              Master_Log_File: mysql-bin.000010
          Read_Master_Log_Pos: 1191
               Relay_Log_File: vm02-relay-bin.000005
                Relay_Log_Pos: 253
        Relay_Master_Log_File: mysql-bin.000010
             Slave_IO_Running: Yes
            Slave_SQL_Running: No
              Replicate_Do_DB: 
          Replicate_Ignore_DB: 
           Replicate_Do_Table: 
       Replicate_Ignore_Table: 
      Replicate_Wild_Do_Table: 
  Replicate_Wild_Ignore_Table: 
                   Last_Errno: 1593
                   Last_Error: Error initializing relay log position: I/O error reading the header from the binary log
                 Skip_Counter: 1
          Exec_Master_Log_Pos: 821


Slave_IO_Running :接收master的binlog信息
                   Master_Log_File
                   Read_Master_Log_Pos
Slave_SQL_Running:执行写操作
                   Relay_Master_Log_File
                   Exec_Master_Log_Pos

以执行写的binlog和POS点为准。

Relay_Master_Log_File: mysql-bin.000010
Exec_Master_Log_Pos: 821

mysql> stop slave;
Query OK, 0 rows affected (0.01 sec)

mysql> CHANGE MASTER TO MASTER_LOG_FILE='mysql-bin.000010',MASTER_LOG_POS=821;
Query OK, 0 rows affected (0.01 sec)

mysql> start slave;
Query OK, 0 rows affected (0.00 sec)

6.Ibbackup

各种大招都用上了,无奈slave数据丢失过多,ibbackup(需要银子)该你登场了。
Ibbackup热备份工具,是付费的。xtrabackup是免费的,功能上一样。
Ibbackup备份期间不锁表,备份时开启一个事务(相当于做一个快照),然后会记录一个点,之后数据的更改保存在ibbackup_logfile文件里,恢复时把ibbackup_logfile 变化的数据再写入到ibdata里。
Ibbackup 只备份数据( ibdata、.ibd ),表结构.frm不备份。

7.终极大招--重建slave

你可能感兴趣的:(MySQL主从复制故障处理)