业务反馈突然连接不上phxsql,没有权限,发现phxsql的17000端口挂掉了,也就是phxbinlogsrv进程挂掉

root     123041      1  0 May13 ?        00:00:00 sh /data1/phxsql/bin/mysqld_safe --defaults-file=/data1/phxsql/etc/my.cnf --super_read_only --plugin-load=phxsync_master_phxrpc.so
root     123052      1  9 May13 ?        13:07:09 /data1/phxsql/sbin/phxsqlproxy_phxrpc /data1/phxsql/etc/phxsqlproxy.conf daemon
root     123054      1  9 May13 ?        13:08:06 /data1/phxsql/sbin/phxsqlproxy_phxrpc /data1/phxsql/etc/phxsqlproxy.conf daemon
mysql    124432 123041  0 May13 ?        00:13:30 /data1/phxsql/sbin/mysqld --defaults-file=/data1/phxsql/etc/my.cnf --basedir=/data1/phxsql/percona.src --datadir=/data1/tmp/percona.workspace/data --plugin-dir=/data1/phxsql/lib --user=mysql --super-read-only --plugin-load=phxsync_master_phxrpc.so --log-error=/data1/tmp/percona.workspace/log.err --pid-file=/data1/tmp/percona.workspace/data/percona.pid --socket=/data1/tmp/percona.workspace/tmp/percona.sock --port=11111

在网上查到这是phxsql的一个bug,https://github.com/tencent-wechat/phxsql/issues/89


解决方案是增加从库的网络timeout时间,另外在my.cnf上也加入这个参数,重新启动phxbinlogsrv模块即可

show variables like 'slave_net_timeout';
set global  slave_net_timeout =31536000;