在linux下,解决mysql长连接异常错误(SIGPIPE)

1. 最近在linux下开发IM服务端,遇到一个导致服务端崩溃的问题:

问题描述:服务端运行一个晚上,到了第二天早上一来,登陆客户端时,系统崩溃,

从log与gdb的信息得知,崩溃在执行 mysql_ping()的时候:

(gdb) bt
#0  0x00110416 in __kernel_vsyscall ()
#1  0x0092f918 in send () from /lib/libpthread.so.0
#2  0x00190e85 in vio_write () from /usr/local/mysql/lib/libmysqlclient.so.18
#3  0x00179a96 in net_write_packet () from /usr/local/mysql/lib/libmysqlclient.so.18
#4  0x00179d98 in net_flush () from /usr/local/mysql/lib/libmysqlclient.so.18
#5  0x00179f20 in net_write_command () from /usr/local/mysql/lib/libmysqlclient.so.18
#6  0x00175a18 in cli_advanced_command () from /usr/local/mysql/lib/libmysqlclient.so.18
#7  0x0016ae7d in mysql_ping () from /usr/local/mysql/lib/libmysqlclient.so.18


通过在网上查资料得知,问题可能如下:
        应用程序和数据库建立连接,如果超过 wait_timeout (默认28000秒8小时) 应用程序不去访问数据库,连接一直处于空闲状态,那么MySQL就会自动关闭该连接 ,如果再在该连接上执行查询操作,就会发生MySQL server has gone away错误。
show variables like "%timeout%"; 
        一种方式是将此数值设大;
       另外一个好的解决方法是使用mysql_ping。在使用mysql_real_connect连接数据库之后,再使用mysql_options( &mysql, MYSQL_OPT_RECONNECT, … ) 来设置为自动重连。这样当mysql连接丢失的时候,使用mysql_ping能够自动重连数据库。如果是在mysql 5.1.6之前,那么则应在每次执行完real_connect 之后执行mysql_options( &mysql, MYSQL_OPT_RECONNECT, … ) ,如果是mysql 5.1.6+,则在connect之前执行一次就够了。
       有一种很自然的想法就是,新开一个线程,让它隔一定时间(如20秒)就执行一次mysql_ping.除此而外它什么都不用做。但是显然,这个线程必须与其它线程共享一个mysql连接,共享该mysql句柄。否则这样做一点意义都没有。


所以在代码中修改如下:
1. 在数据库初始化的函数中,在执行mysql_real_connect之前,使用mysql_options( &mysql, MYSQL_OPT_RECONNECT, … )
2. 增加一个新线程,定时地执行mysql_ping

问题解决



你可能感兴趣的:(linux)