原创文章,转载请注明出处:http://huyanping.sinaapp.com/?p=170
作者:Jenner
最近公司的一台Mysql从机延迟了18W秒,两天前发现延迟时,观察SLAVE STATUS,一切正常,以为近期业务调整造成写操作过多,从机延迟的比较厉害,就没有做过多注意。元旦放假回来后发下延迟时间竟然已经有18W。
具体的情况描述如下:IO线程和SQL线程运行正常,master日志拷贝正常。唯一不正常的问题就是Relay_Log_Pos一直不变,且SLAVE STATUS状态并没有报错。以为某一条语句长时间锁住的某张表造成的,但观察processlist发现数据库中并没有任何语句在运行。为了不影响业务运行,我们将所有读操作迁移到了另外一台,并对这台机器进行原因分析。SLAVE STATUS状态如下图:
我们经过几次SET GLOBAL SQL_SLAVE_SKIP_COUNTER = 1操作(跳过当前执行位置),发现依然会存在卡住的问题。于是我们想找出卡住的原因,根据上图给出的位置,我们队relay_log进行了分析