[这几天要折腾mysql服务器,所以在网上搜罗了一些维护策略,然后自己总结实验,下面是我的总结经验和别人的一些建议]
一、日志类型:
MySQL有几个不同的日志文件,可以帮助你找出mysqld内部发生的事情:
日志文件 |
记入文件中的信息类型 |
错误日志 |
记录启动、运行或停止时出现的问题。 |
查询日志 |
记录建立的客户端连接和执行的语句。 |
二进制日志 |
记录所有更改数据的语句。主要用于复制和即时点恢复。 |
慢日志 |
记录所有执行时间超过long_query_time秒的所有查询或不使用索引的查询。 |
事务日志 |
记录InnoDB等支持事务的存储引擎执行事务时产生的日志。 |
1.启动慢查询日志:
@MySQL如果启用了slow_query_log=ON选项,就会记录执行时间超过long_query_time(默认10s)的查询(初使表锁定的时间不算作执行 时间)。日志记录文件为slow_query_log_file[=file_name],如果没有给出file_name值, 默认为主机名,后缀为-slow.log。如果给出了文件名,但不是绝对路径名,文件则写入数据目录。
【这个可以在调试mysql性能的时候启用,可以找出是哪个sql指令最浪费时间。生产环境中建议关闭】
2.生产环境中关闭通用查询日志:
@由于打开通用查询日志是记录用户的所有操作,在生产环境中这个日志的量是非常大的,所以一般情况下都是不打开的,myslq默认的该日志功能也是关闭的,在特殊情况下才进行打开【一般只有在开发测试环境中,为了定位某些功能具体使用了哪些SQL语句的时候,才会在短时间段内打开该日志来做相应的分析。】;
mysql> set global general_log = 1; #1:启动通用查询日志,0:关闭通用查询日志
mysql> show global variables like '%general_log%';
+------------------+----------------------------+
| Variable_name | Value |
+------------------+----------------------------+
| general_log | ON | #是否启用了通用查询日志
| general_log_file | /var/run/mysqld/mysqld.log | #日志路径
+------------------+----------------------------+
2 rows in set (0.00 sec)
3.定期备份二进制日志和sql数据:【本地一份,远程日志主机一份,存储主机一份】
@在my.cnf中log-bin = [filename]是启用二进制日志,默认以[filename].000001往上记录的,从启用log-bin之后【此时最好用mysqldump保存当前的mysql某个库的数据,因为二进制日志只是记录了从现在起到最近一次mysql当机重启中的所有sql语句】,mysql就会开始记录每一个sql语句,一旦mysql因各种原因需要重启,则会产生新的二进制日志,000001的后缀名会不断往上自加。若是在mysql当机期间mysql的数据遭到了破坏(如磁盘损坏),之前的数据全部都被破坏了,这时候这个备份策略就可以帮你挽回损失。你可以从二进制日志中恢复从开始到最近一次mysql重启这段时间的数据。【二进制日志中记录的是每一个sql语句,可以用mysqlbinlog [filename]查看日志内容】
4.sync_binlog全局变量的取值一定要合适:
@默认情况下,并不是每次写入时都将二进制日志与硬盘同步。因此如果操作系统或机器(不仅仅是MySQL服务器)崩溃,有可能二进制日志中最后的语句丢失了。要想防止这种情况,你可以使用sync_binlog全局变量(1是最安全的值,但也是最慢的),使二进制日志在每N次二进制日志写入后与硬盘同步。对非事务表的更新执行完毕后立即保存到二进制日志中。
下面解释下sync_binlog:
“sync_binlog”:这个参数是对于MySQL系统来说是至关重要的,他不仅影响到Binlog对MySQL所带来的性能损耗,而且还影响到MySQL中数据的完整性。对于“sync_binlog”参数的各种设置的说明如下:
sync_binlog=0,当事务提交之后,MySQL不做fsync之类的磁盘同步指令刷新binlog_cache中的信息到磁盘,而让Filesystem自行决定什么时候来做同步,或者cache满了之后才同步到磁盘。
sync_binlog=n,当每进行n次事务提交之后,MySQL将进行一次fsync之类的磁盘同步指令来将binlog_cache中的数据强制写入磁盘。
在MySQL中系统默认的设置是sync_binlog=0,也就是不做任何强制性的磁盘刷新指令,这时候的性能是最好的,但是风险也是最大的。因为一旦系统Crash,在binlog_cache中的所有binlog信息都会被丢失。而当设置为“1”的时候,是最安全但是性能损耗最大的设置。因为当设置为1的时候,即使系统Crash,也最多丢失binlog_cache中未完成的一个事务,对实际数据没有任何实质性影响。从以往经验和相关测试来看,对于高并发事务的系统来说,“sync_binlog”设置为0和设置为1的系统写入性能差距可能高达5倍甚至更多。
5.如果数据库有很多的事务型操作,则建议把二进制日志的回滚上限设置大一些:
@对于事务表,例如BDB或InnoDB表,所有更改表的更新(UPDATE、DELETE或INSERT)被缓存起来,直到服务器接收到COMMIT语句。在该点,执行完COMMIT之前,mysqld将整个事务写入二进制日志。当处理事务的线程启动时,它为 缓冲查询分配binlog_cache_size大小的内存。如果语句大于该值,线程则打开临时文件来保存事务【所以如果bunlog_cache_size足够大,就避免了过多的磁盘的I/O操作,可以把数据全部缓存在内存中】。线程结束后临时文件被删除。【“max_binlog_cache_size”:和"binlog_cache_size"相对应,但是所代表的是binlog能够使用的最大cache内存大小。当我们执行多语句事务的时候,max_binlog_cache_size如果不够大的话,系统可能会报出“Multi- statementtransactionrequiredmorethan'max_binlog_cache_size'bytesofstorage”的错误。所以最好也把max_binlog_cache_size也调大些(具体多大看你的服务器了)】
6.尽量把max_binlog_size设置大些
@“max_binlog_size”:Binlog日志最大值,一般来说设置为512M或者1G,但不能超过1G。该大小并不能非常严格控制Binlog大小,尤其是当到达Binlog比较靠近尾部而又遇到一个较大事务的时候,系统为了保证事务的完整性,不可能做切换日志的动作,只能将该事务的所有SQL都记录进入当前日志,直到该事务结束。
7.下面是mysql环境的情况:
mysql> show variables like '%binlog%';
+--------------------------------+------------+ | Variable_name | Value | +--------------------------------+------------+ | binlog_cache_size | 1048576 | | innodb_locks_unsafe_for_binlog | OFF | | max_binlog_cache_size| 4294967295 | | max_binlog_size| 1073741824 | | sync_binlog| 0| +--------------------------------+------------+
8.只对一些必须要备份的库进行备份 [尤其是在主从架构中]
@这一点在使用mysql的主从架构的时候特别要注意,因为从服务器是根据主服务器的Binlog来实现同步的。如果对master上每一个库都要进行Binlog备份,则在master的操作极其频繁的情况下,mysqlI/O线程的I/O量就会非常大,则可能会有slave端的数据的延时,造成slave端可能有和master端数据不同步的情况。
@MySQL中Binlog的产生量是没办法改变的,只要我们的SQL语句 改变了数据库中的数据,那么就 必须将该 SQL语句 所对应的 事件 记录到 Binlog中。那我们是不是就没有办法优化复制了呢?当 然不是,在MySQL复制环境中,实际上是是有8个参数可以让我们控制需要复制或者需要忽
略而不进行复制的DB 或者Table 的,分别为:
binlog_do_db:设定哪些数据库(Schema)需要记录Binlog; 【j建议master端设置】
binlog_ignore_db:设定哪些数据库(Schema)不要记录Binlog; 【建议master端设置】
replicate_do_db:设定需要复制的数据库(Schema),多个DB用逗号(“,”)分隔;【建议slave端设置】
replicate_ignore_db:设定可以忽略的数据库(Schema);【建议slave端设置】
replicate_do_table:设定需要复制的Table;【建议slave端设置】
replicate_ignore_table:设定可以忽略的Table;【建议slave端设置】
replicate_wild_Do_table:功能同Replicate_Do_Table,但可以带通配符来进行设置;【建议slave端设置】
replicate_wild_ignore_table:功能同Replicate_Ignore_Table,可带通配符设置;【建议slave端设置】
通过上面这八个参数,我们就可以非常方便按照实际需求,控制从Master 端到Slave 端的Binlog量尽可能的少,从而减小Master 端到Slave端的网络流量,减少IO 线程的IO 量,还能 减少 SQL线程的解析与应用SQL 的数量,最终达到改善Slave上的数据延时问题。
@实际上,上面这八个参数中的前面两个是设置在Master端的,而后面六个参数则是设置在
Slave端的。虽然前面两个参数和后面六个参数在功能上 并没有非常直接的关系,但是对于优
化MySQL 的Replication来说都可以启到相似的功能。当然也有一定的区别,其主要区别如下:
如果在Master端设置前面两个参数,不仅仅会让Master 端的Binlog 记录所带来的IO 量减少,
还会让Master端的IO线程就可以减 少 Binlog的读取量,传递给Slave端的IO线程的Binlog量 自然就会较少。这样做的好处是可以减少网络 IO,减少Slave端IO线程的IO量,减少Slave端 的 SQL线程的工作量,从而最大幅度的优化复制性能。当然,在Master端设置也存在一定的弊 端,因为MySQL的判断是否需要复制某个事件不是根据产生该事件的SQL语句所更改的数据 所在的 DB,而是根据执行SQL语句时刻所在的默认DB,也就是我们登录时候指定的DB或 者运行“use database”中所指定的DB。只有当前默认DB和配置中所设定的DB完全吻合的 时候 IO线程才会将该事件读取给Slave的IO线程。所以如果在系统中出现在默认DB和设 定需要复制的 DB不一样的情况下改变了需要复制的DB中某个Table的数据的时候,该事件 是不会被复制到 Slave中去的,这样就会造成Slave端的数据和Master的数据不一致的情况出 现。同样,如果在默认Schema下更改了不需要复制的Schema中的数据,则会被复制到Slave端,当Slave端并没有该Schema的时候,则会造成复制出错而停止。
而如果是在 Slave端设置后面的六个参数,在性能优化方面可能比在Master端要稍微逊色一点,因为不管是需要还是不需要复制的 事件 都被 会被 IO线程读取到Slave端,这样不仅仅增加了 网络 IO量,也给Slave端的IO线程增加了RelayLog的写入量。但是仍然可以减少Slave的SQL线程在Slave端的日志应用量。虽然性能方面稍有逊色,但是在Slave端设置复制过滤机制,可以保证不会出现因为默认模式的问题而造 成 Slave和Master数据不一致或者复制出错的 问题。