mysql复制的一例错误:Relay_Log_Pos不变

原创文章,转载请注明出处:http://huyanping.sinaapp.com/?p=170
作者:Jenner

最近公司的一台Mysql从机延迟了18W秒,两天前发现延迟时,观察SLAVE STATUS,一切正常,以为近期业务调整造成写操作过多,从机延迟的比较厉害,就没有做过多注意。元旦放假回来后发下延迟时间竟然已经有18W。


具体的情况描述如下:IO线程和SQL线程运行正常,master日志拷贝正常。唯一不正常的问题就是Relay_Log_Pos一直不变,且SLAVE STATUS状态并没有报错。以为某一条语句长时间锁住的某张表造成的,但观察processlist发现数据库中并没有任何语句在运行。为了不影响业务运行,我们将所有读操作迁移到了另外一台,并对这台机器进行原因分析。SLAVE STATUS状态如下图:

mysql复制的一例错误:Relay_Log_Pos不变_第1张图片


我们经过几次SET GLOBAL SQL_SLAVE_SKIP_COUNTER = 1操作(跳过当前执行位置),发现依然会存在卡住的问题。于是我们想找出卡住的原因,根据上图给出的位置,我们队relay_log进行了分析

mysqlbinlog relaylog.008077 --start-position=223496095 -f -d xxx | more
结果如下图:
mysql复制的一例错误:Relay_Log_Pos不变_第2张图片

我们发现每次卡住的位置都在unkown event事件前面,每次跳过后碰到这个就会卡住。
中继日志中产生这样的时间的原因无从得知,可能是我们调整了表结构分区造成的。
最后我们多次执行SET GLOBAL SQL_SLAVE_SKIP_COUNTER = 1操作后不再存在卡住的情况。


你可能感兴趣的:(mysql复制的一例错误:Relay_Log_Pos不变)