进入正题之前
上回我们聊到关于MySQL的replication。https://segmentfault.com/a/11... 在进入今天的正题之前,先说一个可能大家很容易踩的坑。
Authentication Plugins问题
上回中实践部分用的是MySQL5.7。当你要把MySQL升级到MySQL8.0的时候,如果用同样的方法change master然后start slave后查看slave的状态的时候可能会发现以下错误。
mysql> show slave status\G
...
Last_IO_Error: error connecting to master '[email protected]:3306' - retry-time: 60 retries: 1
...
slave没有脸上master,这时候你的第一反应可能是change master写错了或者master的MySQL挂掉了等等。如果你的配置文件里没有default_authentication_plugin
这个参数,那多半是在它那跌倒了。
在MySQL5.7时,default_authentication_plugin
的默认值是mysql_native_password
。而到了MySQL8.0后,默认值变成了caching_sha2_password
,也就是说现在的密码默认被加密了,当然用以前的方法是连不上master服务器的了。下面两个方法仅供参考。
解决方法一
如果你之前一直使用mysql_native_password
,并且很多工具都是在此之上写出来的。这样的话建议在MySQL8.0中继续使用, 只要在在master的配置文件my.cnf中设置default_authentication_plugin = mysql_native_password
就行了。
解决方法二
如果你想使用caching_sha2_password,master和slave必须同时设置成支持加密链接。首先必须在master和slave中设置ssl连接。
创建master和slave的配对证书。(OpenSSL)
//自签名一个ca
$ openssl genrsa 2048 > ca-key.pem
$ openssl req -new -x509 -nodes -days 3600 -key ca-key.pem -out ca.pem
//用上面的ca签一个服务端证书
$ openssl req -newkey rsa:2048 -days 3600 -nodes -keyout server-key.pem -out server-req.pem
$ openssl rsa -in server-key.pem -out server-key.pem
$ openssl x509 -req -in server-req.pem -days 3600 -CA ca.pem -CAkey ca-key.pem -set_serial 01 -out server-cert.pem
//用上面的ca签一个客户端证书
$ openssl req -newkey rsa:2048 -days 3600 -nodes -keyout client-key.pem -out client-req.pem
$ openssl rsa -in client-key.pem -out client-key.pem
$ openssl x509 -req -in client-req.pem -days 3600 -CA ca.pem -CAkey ca-key.pem -set_serial 01 -out client-cert.pem
master和slave的配置文件中加入
//my.cnf
...
[mysqld]
ssl-ca=ca.pem
ssl-cert=server-cert.pem
ssl-key=server-key.pem
...
[client]
ssl-ca=ca.pem
ssl-cert=client-cert.pem
ssl-key=client-key.pem
...
slave change master, 将MASTER_SSL设成1。replication成功。
mysql> change master to
-> MASTER_HOST = '10.1.0.102',
-> MASTER_USER = 'root',
-> MASTER_LOG_FILE = 'binlog.000002',
-> MASTER_LOG_POS = 154,
-> MASTER_SSL = 1;
Query OK, 0 rows affected, 1 warning (0.06 sec)
mysql> start slave;
设置ssl还是很麻烦的,官方也提供了一个脚本方便大家设置ssl连接。https://dev.mysql.com/doc/ref...
SHOW SLAVE STATUS
今天将介绍的主角是show slave status这个命令,
mysql> show slave status\G
*************************** 1. row ***************************
Slave_IO_State: Waiting for master to send event
Master_Host: 10.1.0.102
Master_User: root
Master_Port: 3306
Connect_Retry: 60
Master_Log_File: binlog.000002
Read_Master_Log_Pos: 155
Relay_Log_File: 29d3afe99c90-relay-bin.000002
Relay_Log_Pos: 319
Relay_Master_Log_File: binlog.000002
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Replicate_Do_DB:
Replicate_Ignore_DB:
Replicate_Do_Table:
Replicate_Ignore_Table:
Replicate_Wild_Do_Table:
Replicate_Wild_Ignore_Table:
Last_Errno: 0
Last_Error:
Skip_Counter: 0
Exec_Master_Log_Pos: 155
Relay_Log_Space: 534
Until_Condition: None
Until_Log_File:
Until_Log_Pos: 0
Master_SSL_Allowed: Yes
Master_SSL_CA_File:
Master_SSL_CA_Path:
Master_SSL_Cert:
Master_SSL_Cipher:
Master_SSL_Key:
Seconds_Behind_Master: 0
Master_SSL_Verify_Server_Cert: No
Last_IO_Errno: 0
Last_IO_Error:
Last_SQL_Errno: 0
Last_SQL_Error:
Replicate_Ignore_Server_Ids:
Master_Server_Id: 11
Master_UUID: c41449f4-c3a3-11e8-b5c6-02420a010066
Master_Info_File: mysql.slave_master_info
SQL_Delay: 0
SQL_Remaining_Delay: NULL
Slave_SQL_Running_State: Slave has read all relay log; waiting for more updates
Master_Retry_Count: 86400
Master_Bind:
Last_IO_Error_Timestamp:
Last_SQL_Error_Timestamp:
Master_SSL_Crl:
Master_SSL_Crlpath:
Retrieved_Gtid_Set:
Executed_Gtid_Set:
Auto_Position: 0
Replicate_Rewrite_DB:
Channel_Name:
Master_TLS_Version:
Master_public_key_path:
Get_master_public_key: 0
1 row in set (0.00 sec)
mysql>
这个命令也就是输出一些slave的命令。为什么说这个命令重要,首先通过这个命令可以实时掌握replication的状况,而是在实际的运营中,replication出了问题通过这个命令也可以第一时间定位问题。了解这个命令中各参数的含义对于主从关系的MySQL运营维护有这重要的实际意义。
Slave_IO_State
当前slave的IO线程的状况。是show processlist里IO线程state的复制。Waiting for master to send event
slave正在等待master更新。如果等待时间超过slave_net_timeout(my.cnf设置),IO线程为重连master。
Waiting for the slave SQL thread to free enough relay log space
如果你设置了relay_log_space_limit
,当relay log大小超过这个值以后,IO线程会先等SQL线程删掉一部分relay log。
全部的state,https://dev.mysql.com/doc/ref...
MASTER_HOST,MASTER_USER,MASTER_PORT
master的地址,连接用户名,端口等的信息。
Connect_Retry
当master和slave之前出现连接问题时,每隔这个时间就会尝试一次重连master。可用过change master设置这个值。
Master_Log_File, Relay_Log_File, Relay_Master_Log_File
Master_Log_File
当前IO从master读取的binlog的文件名。Relog_Log_File
slave的SQL先前当读取的relay log文件名。Relay_Master_log_File
当前SQL执行的最新的SQL Event是包含在master哪个binlog文件中的。
Read_Master_Log_Pos, Relay_Log_Pos, Exec_Master_Log_Pos
这三个参数可以说是至关重要,也经常被搞混。Read_Master_Log_Pos
I/O读取到的log在master的binlog中的位置。
Relay_Log_Pos
SQL执行到的Relay Log的位置。
Exec_Master_Log_Pos
SQL执行到的SQL Event在master的binlog中的位置。
如果Read_Master_Log_Pos
和master的show master status的位置一样,而Exec_Master_Log_Pos
的值小于它们,那说明SQL线程出现了过载,正在执行一个非常熬时间的SQL或者slave服务器的性能出现恶化等等。
Slave_IO_Running, Slave_SQL_Running
IO线程,SQL线程是否在运行。
Slave_IO_Running = NO,IO线程没运行。
Slave_IO_Running = Connecting, IO线程正在运行,但是没连上master。
Slave_IO_Running = YES,IO线程在运行,并且连上了master。
Relay_Log_Space
Relay log的全部加起来的大小
Last_Errno, Last_Error
SQL线程上次的执行错误信息
Master_SSL_*
SSL连接时的设定。开头的ssl连接的例子中,如果我们没在slave中my.cnf设置证明书信息,我们需要通过change master手动设置。
Replicate_Do_DB, Replicate_Ignore_DB, Replicate_Do_Table, Replicate_Ignore_Table, Replicate_Wild_Do_Table, Replicate_Wild_Ignore_Table
Replication可以通过在my.cnf中设置--replicate-do-table等来设定具体同步哪些库或表。
Seconds_Behind_Master
简单来说,就是slave比master慢了多少。如果slave比master慢了很多,读写分离的架构中,用户读取到的数据就不是最新的,运营事故就很容易发生。一般情况下,如果这个值过大,我们可以考虑是否是slave服务器SQL线程出问题了。
如果对这个值是怎么计算出来的感兴趣的通许可以看一下这篇文章。
http://mysql.taobao.org/month...
需要记得一点的就是,当网络状况很差的时候,这个值会一直是0。所以只有在网络环境很好的前提下,这个值才能表示slave比master慢多少。所以这个参数有时候也并不可靠。
Channel_name
channel是指我们可以在slave同时指定多个master进行replication,用不同的channel名来进行区分。这个也叫multi-source replication。再合并多个master的时候很有用。实际操作也只要在change master to后面加上for channel字段就可以了
。同样start/stop slave后面也加上for channel就行了。
总结
今天就讲到这,上面只是介绍了一部分可能会场用到的参数,想了解其他参数的可以看官方文档。https://dev.mysql.com/doc/ref...。
下章讲一下一些在运营中常见的一些主从切换的方法。