一.MySQL Binlog格式介绍
mysql binlog日志有三种格式,分别为Statement,MiXED,以及ROW!
现在就去查查自己数据库使用的是什么模式。
现在是ROW模式,如何切换模式呢?
问题来了,binlog 的不同模式有什么区别呢?
1.Statement:每一条会修改数据的sql都会记录在binlog中。
优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO,提高性能。(相比row能节约多少性能与日志量,这个取决于应用的SQL情况,正常同一条记录修改或者插入row格式所产生的日志量还小于Statement产生的日志量,但是考虑到如果带条件的update操作,以及整表删除,alter表等操作,ROW格式会产生大量日志,因此在考虑是否使用ROW格式日志时应该跟据应用的实际情况,其所产生的日志量会增加多少,以及带来的IO性能问题。)
缺点:由于记录的只是执行语句,为了这些语句能在slave上正确运行,因此还必须记录每条语句在执行的时候的一些相关信息,以保证所有语句能在slave得到和在master端执行时候相同的结果。另外mysql 的复制,像一些特定函数功能,slave可与master上要保持一致会有很多相关问题(如sleep()函数, last_insert_id(),以及user-defined functions(udf)会出现问题).
使用以下函数的语句也无法被复制:
* LOAD_FILE()
* UUID()
* USER()
* FOUND_ROWS()
* SYSDATE() (除非启动时启用了 --sysdate-is-now 选项)
同时在INSERT ...SELECT 会产生比 RBR 更多的行级锁
我们一起看下statement状态下的增删改日志。
---------------------------------------------------------------------------------------------------------
SET TIMESTAMP=1504417835/*!*/;
BEGIN
/*!*/;
# at 1678
#170903 13:50:35 server id 2 end_log_pos 1780 CRC32 0x1bb72319 Query thread_id=5exec_time=0 error_code=0
SET TIMESTAMP=1504417835/*!*/;
insert into t1 values(999)
/*!*/;
# at 1780
#170903 13:50:35 server id 2 end_log_pos 1811 CRC32 0x558e0368 Xid = 37
COMMIT/*!*/;
# at 1811
#170903 13:50:50 server id 2 end_log_pos 1876 CRC32 0xe9fa13e4 Anonymous_GTID last_committed=6 sequence_number=7 rbr_only=no
SET @@SESSION.GTID_NEXT= 'ANONYMOUS'/*!*/;
# at 1876
#170903 13:50:50 server id 2 end_log_pos 1957 CRC32 0xb72aea08 Query thread_id=5exec_time=0 error_code=0
SET TIMESTAMP=1504417850/*!*/;
BEGIN
/*!*/;
# at 1957
#170903 13:50:50 server id 2 end_log_pos 2067 CRC32 0xd25c5827 Query thread_id=5exec_time=0 error_code=0
SET TIMESTAMP=1504417850/*!*/;
update t1 set id=9999 where id=999
/*!*/;
# at 2067
#170903 13:50:50 server id 2 end_log_pos 2098 CRC32 0x9ce2f804 Xid = 38
COMMIT/*!*/;
# at 2098
#170903 13:51:00 server id 2 end_log_pos 2163 CRC32 0xe3ac406e Anonymous_GTID last_committed=7 sequence_number=8 rbr_only=no
SET @@SESSION.GTID_NEXT= 'ANONYMOUS'/*!*/;
# at 2163
#170903 13:51:00 server id 2 end_log_pos 2280 CRC32 0xafaa339f Query thread_id=5exec_time=0 error_code=0
SET TIMESTAMP=1504417860/*!*/;
DROP TABLE `t1` /* generated by server */
/*!*/;
SET @@SESSION.GTID_NEXT= 'AUTOMATIC' /* added by mysqlbinlog */ /*!*/;
DELIMITER ;
# End of log file
/*!50003 SET COMPLETION_TYPE=@OLD_COMPLETION_TYPE*/;
/*!50530 SET @@SESSION.PSEUDO_SLAVE_MODE=0*/;
---------------------------------------------------------------------------------------------------------
2.Row:不记录sql语句上下文相关信息,仅保存哪条记录被修改。
优点: binlog中可以不记录执行的sql语句的上下文相关的信息,仅需要记录那一条记录被修改成什么了。所以rowlevel的日志内容会非常清楚的记录下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题
缺点:所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容,比如一条update语句,修改多条记录,则binlog中每一条修改都会有记录,这样造成binlog日志量会很大,特别是当执行alter table之类的语句的时候,由于表结构修改,每条记录都发生改变,那么该表每一条记录都会记录到日志中。
和上述做相同的操作,我们一起看下ROW状态下的增删改日志。
------------------------------------------------------------------------------------------------------
#mysqlbinlog -vv mysql-bin.000005
SET TIMESTAMP=1504409214/*!*/; 1.开始事物的时间:
BEGIN
/*!*/;
# at 547 2.sql-event起点 ,改点为事件的起点,是以547字节开始。
#170903 11:26:54 server id 2 end_log_pos 593 CRC32 0x4b8ca1d9 Table_map: `test1`.`t1` mapped to number 219 3.sqlevent 发生的时间点,是事件发生的时间。
# at 593
#170903 11:26:54 server id 2 end_log_pos 633 CRC32 0xacc956c2 Write_rows: table id 219 flags: STMT_END_F 4.server-Id,为master 的server-Id;5.sql-event终点及花费时间,错误码。
BINLOG '
fnarWRMCAAAALgAAAFECAAAAANsAAAAAAAEABXRlc3QxAAJ0MQABAwAB2aGMSw==
fnarWR4CAAAAKAAAAHkCAAAAANsAAAAAAAEAAgAB//7nAwAAwlbJrA==
'/*!*/;
### INSERT INTO `test1`.`t1`
### SET
### @1=999 /* INT meta=0 nullable=1 is_null=0 */
# at 633
#170903 11:26:54 server id 2 end_log_pos 664 CRC32 0x8100a8d5 Xid = 21
COMMIT/*!*/;
# at 664
#170903 11:28:34 server id 2 end_log_pos 729 CRC32 0x53c4213c Anonymous_GTID last_committed=2 sequence_number=3 rbr_only=yes
/*!50718 SET TRANSACTION ISOLATION LEVEL READ COMMITTED*//*!*/;
SET @@SESSION.GTID_NEXT= 'ANONYMOUS'/*!*/;
# at 729
#170903 11:28:34 server id 2 end_log_pos 802 CRC32 0x25df25fb Query thread_id=3 exec_time=0 error_code=0
SET TIMESTAMP=1504409314/*!*/;
BEGIN
/*!*/;
# at 802
#170903 11:28:34 server id 2 end_log_pos 848 CRC32 0x43558a32 Table_map: `test1`.`t1` mapped to number 219
# at 848
#170903 11:28:34 server id 2 end_log_pos 894 CRC32 0x428c49ac Update_rows: table id 219 flags: STMT_END_F
BINLOG '
4narWRMCAAAALgAAAFADAAAAANsAAAAAAAEABXRlc3QxAAJ0MQABAwABMopVQw==
4narWR8CAAAALgAAAH4DAAAAANsAAAAAAAEAAgAB///+5wMAAP4PJwAArEmMQg==
'/*!*/;
### UPDATE `test1`.`t1`
### WHERE
### @1=999 /* INT meta=0 nullable=1 is_null=0 */
### SET
### @1=9999 /* INT meta=0 nullable=1 is_null=0 */
# at 894
#170903 11:28:34 server id 2 end_log_pos 925 CRC32 0x20b14c1d Xid = 24
COMMIT/*!*/;
# at 925
#170903 11:28:49 server id 2 end_log_pos 990 CRC32 0xb87bad9e Anonymous_GTID last_committed=3 sequence_number=4 rbr_only=no
SET @@SESSION.GTID_NEXT= 'ANONYMOUS'/*!*/;
# at 990
#170903 11:28:49 server id 2 end_log_pos 1107 CRC32 0x3e89f8ab Query thread_id=3exec_time=0 error_code=0
use `test1`/*!*/;
SET TIMESTAMP=1504409329/*!*/;
DROP TABLE `t1` /* generated by server */
/*!*/;
SET @@SESSION.GTID_NEXT= 'AUTOMATIC' /* added by mysqlbinlog */ /*!*/;
DELIMITER ;
# End of log file
/*!50003 SET COMPLETION_TYPE=@OLD_COMPLETION_TYPE*/;
/*!50530 SET @@SESSION.PSEUDO_SLAVE_MODE=0*/;
通过日志你会发现,我做了3件事情,insert一条记录,update一条记录,drop一条记录
------------------------------------------------------------------------------------------------------
3.Mixedlevel: 是以上两种level的混合使用,一般的语句修改使用statment格式保存binlog,如一些函数,statement无法完成主从复制的操作,则采用row格式保存binlog,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择一种.新版本的MySQL中队row level模式也被做了优化,并不是所有的修改都会以row level来记录,像遇到表结构变更的时候就会以statement模式来记录。至于update或者delete等修改数据的语句,还是会记录所有行的变更。
二.Binlog基本配制与格式设定
1.基本配制
Mysql BInlog日志格式可以通过mysql的my.cnf文件的属性binlog_format指定。如以下:
binlog_format = MIXED //binlog日志格式
log_bin =目录/mysql-bin.log //binlog日志名
expire_logs_days = 7 //binlog过期清理时间
max_binlog_size 100m //binlog每个日志文件大小
2.Binlog日志格式选择
Mysql默认是使用Statement日志格式,推荐使用MIXED.
由于一些特殊使用,可以考虑使用ROWED,如自己通过binlog日志来同步数据的修改,这样会节省很多相关操作。对于binlog数据处理会变得非常轻松,相对mixed,解析也会很轻松(当然前提是增加的日志量所带来的IO开销在容忍的范围内即可)。
3.mysqlbinlog格式选择
mysql对于日志格式的选定原则:如果是采用 INSERT,UPDATE,DELETE 等直接操作表的情况,则日志格式根据 binlog_format 的设定而记录,如果是采用 GRANT,REVOKE,SET PASSWORD 等管理语句来做的话,那么无论如何 都采用 SBR 模式记录
4.Mixed日志说明:
在slave日志同步过程中,对于使用now这样的时间函数,MIXED日志格式,会在日志中产生对应的unix_timestamp()*1000的时间字符串,slave在完成同步时,取用的是sqlEvent发生的时间来保证数据的准确性。另外对于一些功能性函数slave能完成相应的数据同步,而对于上面指定的一些类似于UDF函数,导致Slave无法知晓的情况,则会采用ROW格式存储这些Binlog,以保证产生的Binlog可以供Slave完成数据同步。