mysql故障(主从复制sql线程不运行)

故障现象:


进入slave服务器,运行:

mysql> show slave status\G
        .......
            Relay_Log_File: localhost-relay-bin.000535
            Relay_Log_Pos: 21795072
    Relay_Master_Log_File: localhost-bin.000094Slave_IO_Running: Yes
Slave_SQL_Running: No
          Replicate_Do_DB: 
      Replicate_Ignore_DB: 
      ......

解决办法一、


Slave_SQL_Running: No
1.程序可能在slave上进行了写操作
2.也可能是slave机器重起后,事务回滚造成的.

一般是事务回滚造成的:
解决办法:

mysql> stop slave;
mysql> set GLOBAL SQL_SLAVE_SKIP_COUNTER=1;
mysql> start slave;

 解决办法二、

首先停掉Slave服务:stop slave;
到主服务器上查看主机状态:
记录File和Position对应的值
进入master

mysql> show master status;+----------------------+----------+--------------+------------------+| File                | Position | Binlog_Do_DB | Binlog_Ignore_DB |+----------------------+----------+--------------+------------------+| localhost-bin.000094 | 33622483 |              |                  | +----------------------+----------+--------------+------------------+1 row in set (0.00 sec)


然后到slave服务器上执行手动同步:

mysql> change master to > master_host='master_ip',> master_user='user', 
> master_password='pwd', 
> master_port=3306, 
> master_log_file=localhost-bin.000094', 
> master_log_pos=33622483 ;
1 row in set (0.00 sec)
mysql> start slave;
1 row in set (0.00 sec)
mysql> show slave status\G
*************************** 1. row ***************************
........
          Master_Log_File: localhost-bin.000094
      Read_Master_Log_Pos: 33768775
            Relay_Log_File: localhost-relay-bin.000537
            Relay_Log_Pos: 1094034
    Relay_Master_Log_File: localhost-bin.000094
          Slave_IO_Running: Yes
        Slave_SQL_Running: Yes
          Replicate_Do_DB:

 


手动同步需要停止master的写操作!
查看mysql主从配置的状态及修正 slave不启动问题

1、查看master的状态

show master status;  //Position不应该为0
show processlist;  
//state状态应该为Has sent all binlog to slave; waiting for binlog to be updated

2、查看slave状态

show slave status;//Slave_IO_Running 与 Slave_SQL_Running 状态都要为Yes
show processlist;//应该有两行state值为:
Has read all relay log; waiting for the slave I/O thread to update it
Waiting for master to send event

 

3、错误日志

MySQL安装目录 /usr/local/mysql
MySQL日志目录 /usr/local/mysql/data/  形如,Hostname.err

 

4、Change master to


如果从库的Slave未启动,Slave_IO_Running为NO。
可能是主库是的master的信息有变化,
查看主库show master status;
记录下File,Position字段,假设为‘mysql-bin.000004’,98;
在从库执行:

mysql>stop slave;
mysql>change master to master_log_file='mysql-bin.000004',master_log_pos=98;
mysql>start slave;

5、SET global sql_slave_skip_counter=n;

如果从库的slave_sql_running为NO。
Err文件中记录:

Slave:Error "Duplicate entry '1' for key 1" on query.....


可能是master未向slave同步成功,但slave中已经有了记录。造成的冲突可以在从库上执行

set global sql_slave_skip_counter=n;


跳过几步。再restart slave就可以了。

6、同步错误处理

发现mysql slave服务器经常因为一些特殊字符或者符号产生的更新语句报错,整个同步也会因此而卡在那,最初的办法只是手动去出错的机器执行下面三条SQL语句,跳过错误即可。

mysql>stop slave;
mysql>set GLOBAL SQL_SLAVE_SKIP_COUNTER=1;
mysql>start slave;

 

说明:
Slave_IO_Running:连接到主库,并读取主库的日志到本地,生成本地日志文件
Slave_SQL_Running:读取本地日志文件,并执行日志里的SQL命令。