第三十四节、如何判断一个数据库是不是出问题了？

在一主一备的双M架构里，主备切换只需要把客户端流量切换到备库；

而在一主多从架构里，主备切换除了要把客户端流量切到备库外，还需要把从库连接到新主库上。

主备切换有两种场景，一种是主动切换，一种是被动切换。而其中被动切换，往往是因为主库出问题了，由HA系统发起的。

如何判断一个数据库是否出问题?

select 1判断

select 1 成功返回，只能说明这个库的经进程，并不能说明主库没问题。

这里需要明确并发连接和并发查询的区别：

show processlist，看到的几千个链接，指的就是并发连接；而“当前正在执行”的语句，才是并发查询。

并发连接数达到几千个影响并不大，就是多占用一些内存而已，应该关注的是并发查询，因为并发查询太高才是CPU杀手。这也是为什么需要设置innodb_thread_concurrency参数的原因。

查表判断

为了能够检测InnoDB并发线程数过多导致的系统不可用情况，需要找一个访问InnoDB的场景，一般的做法是，在系统库里创建一个表，比如命名为health_check，里面只放一行数据，然后定期执行。

使用这个方法，可以检测出由于并发线程过多导致的数据库不可用的情况；

但空间满了以后，这种方法又会变得不好使了。

我们知道，更新食物要写binlog，而一旦binlog所在磁盘的空间占用率达到100%，那么所有的更新语句和事物提交的commit语句就都会被堵住，但是系统这时候是可以正常读数据的。

更新判断

通常做法是放一个timestamp字段，用来表示最后一次执行检测的时间：

mysql> update mysql.health_check set t_modified=now();

节点可用性的检测都应该包含主库和备库。如果用更新来检测主库的话，那么备库也要进行更新检测。但，悲苦的检测也是要写binlog的，所以表就不能只有一行数据了。

为了让主备之间的更新不产生冲突，在表上存入多行数据，并用A\B的server_id做主键

mysql> CREATE TABLE `health_check` ( `id` int(11) NOT NULL, `t_modified` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP, PRIMARY KEY (`id`)) ENGINE=InnoDB;

/* 检测命令 */

insert into mysql.health_check(id, t_modified) values (@@server_id, now()) on duplicate key update t_modified=now();

内部统计

针对磁盘利用率这个问题，如果MySQL可以告诉我们，内部每一次IO请求的时间，那判断数据库是否出问题的方法就可靠得多了。

第三十四节、如何判断一个数据库是不是出问题了？

select 1判断

查表判断

更新判断

内部统计

你可能感兴趣的:(第三十四节、如何判断一个数据库是不是出问题了？)