mydumper备份mysql数据库

mydumper介绍

MySQL自身的mysqldump工具支持单线程工作,依次一个个导出多个表,没有一个并行的机制,这就使得它无法迅速的备份数据。

mydumper作为一个实用工具,能够良好支持多线程工作,可以并行的多线程的从表中读入数据并同时写到不同的文件里,这使得它在处理速度方面快于传统的mysqldump。其特征之一是在处理过程中需要对列表加以锁定,因此如果我们需要在工作时段执行备份工作,那么会引起DML阻塞。但一般现在的MySQL都有主从,备份也大部分在从上进行,所以锁的问题可以不用考虑。这样,mydumper能更好的完成备份任务。

 

mydumper特性

多线程备份
因为是多线程逻辑备份,备份后会生成多个备份文件
备份时对MyISAM表施加FTWRL(FLUSH TABLES WITH READ LOCK),会阻塞DML语句
保证备份数据的一致性
支持文件压缩
支持导出binlog
支持多线程恢复
支持以守护进程模式工作,定时快照和连续二进制日志
支持将备份文件切块
 

mydumper的安装

mydumper使用c语言编写,使用glibc库

mydumper安装所依赖的软件包
yum install glibc zlib pcre pcre-devel gcc gcc-c++ cmake make -y

安装依赖软件包,将mysql客户端库文件路径添加至/etc/ld.so.conf, 如/usr/local/mysql/lib

wget https://github.com/maxbube/mydumper/releases/download/v0.9.5/mydumper-0.9.5-2.el7.x86_64.rpm
 
安装完成后生成两个二进制文件mydumper和myloader位于/usr/local/bin目录下


主要步骤概括

    (1)主线程 FLUSH TABLES WITH READ LOCK, 施加全局只读锁,以阻止DML语句写入,保证数据的一致性
    (2)读取当前时间点的二进制日志文件名和日志写入的位置并记录在metadata文件中,以供即使点恢复使用
    (3)N个(线程数可以指定,默认是4)dump线程 START TRANSACTION WITH CONSISTENT SNAPSHOT; 开启读一致的事物
    (4)dump non-InnoDB tables, 首先导出非事物引擎的表
    (5)主线程 UNLOCK TABLES 非事物引擎备份完后,释放全局只读锁
    (6)dump InnoDB tables, 基于事物导出InnoDB表
    (7)事物结束
 

备份所生成的文件

所有的备份文件在一个目录中,目录可以自己指定
目录中包含一个metadata文件
    记录了备份数据库在备份时间点的二进制日志文件名,日志的写入位置,

    如果是在从库进行备份,还会记录备份时同步至主库的二进制日志文件及写入位置

每个表有两个备份文件:
    database.table-schema.sql 表结构文件

    database.table.sql 表数据文件

    如果对表文件分片,将生成多个备份数据文件,可以指定行数或指定大小分片

 

mydumper和myloader的使用

mydumper参数


-B, --database              要备份的数据库,不指定则备份所有库
-T, --tables-list           需要备份的表,名字用逗号隔开
-o, --outputdir             备份文件输出的目录
-s, --statement-size        生成的insert语句的字节数,默认1000000
-r, --rows                  将表按行分块时,指定的块行数,指定这个选项会关闭 --chunk-filesize
-F, --chunk-filesize        将表按大小分块时,指定的块大小,单位是 MB
-c, --compress              压缩输出文件
-e, --build-empty-files     如果表数据是空,还是产生一个空文件(默认无数据则只有表结构文件)
-x, --regex                 是同正则表达式匹配 'db.table'
-i, --ignore-engines        忽略的存储引擎,用都厚分割
-m, --no-schemas            不备份表结构
-d, --no-data                 不导出表数据
-G, --triggers                导出触发器  
-E, --events                 导出事件  
-R, --routines               导出存储过程  
-k, --no-locks              不使用临时共享只读锁,使用这个选项会造成数据不一致
-l, --long-query-guard      设定阻塞备份的长查询超时时间,单位是秒,默认是60秒(超时后默认mydumper将会退出)
-K, --kill-long-queries     kill掉长时间执行的查询,备份报错:Lock wait timeout exceeded; try restarting transaction

-D, --daemon                启用守护进程模式,守护进程模式以某个间隔不间断对数据库进行备份
-I, --snapshot-interval     dump快照间隔时间,默认60s,需要在daemon模式下
-L, --logfile               使用的日志文件名(mydumper所产生的日志), 默认使用标准输出
-h, --host                  连接的主机名
-u, --user                  备份所使用的用户
-p, --password              密码
-P, --port                  端口
-S, --socket                使用socket通信时的socket文件
-t, --threads               开启的备份线程数,默认是4
-C, --compress-protocol     压缩与mysql通信的数据
-V, --version               显示版本号
-v, --verbose               输出信息模式, 0 = silent, 1 = errors, 2 = warnings, 3 = info, 默认为 2
--lock-all-tables           锁全表,代替FLUSH TABLE WITH READ LOCK  
--tz-utc                    备份的时候允许备份Timestamp,这样会导致不同时区的备份还原会出问题,默认禁用
--skip-tz-utc               同上
--use-savepoints            使用savepoints来减少采集metadata所造成的锁时间,需要 SUPER 权限
--success-on-1146           Not increment error count and Warning instead of Critical in case of table doesn't exist
--less-locking              减少对InnoDB表的锁施加时间(这种模式的机制下文详解)

myloader使用参数

-d, --directory                   备份文件的文件夹
-q, --queries-per-transaction     每次事物执行的查询数量,默认是1000
-o, --overwrite-tables            如果要恢复的表存在,则先drop掉该表,使用该参数,需要备份时候要备份表结构
-B, --database                    需要还原的数据库
-e, --enable-binlog               启用还原数据的二进制日志
-h, --host                        主机
-u, --user                        还原的用户
-p, --password                    密码
-P, --port                        端口
-S, --socket                      socket文件
-t, --threads                     还原所使用的线程数,默认是4
-C, --compress-protocol           压缩协议
-V, --version                     显示版本
-v, --verbose                     输出模式, 0 = silent, 1 = errors, 2 = warnings, 3 = info, 默认为2

关闭写入日志到二进制中。主从不会复制。
myloader -u root -p 'mysql' -h localhost -B online20180801 -o -t 4 -v 3 -d /db/20180827/ -S /db/mysql_3306/mysql.sock

开启 -e:
myloader -u root -p 'mysql' -h localhost -B online20180801 -o -t 4 -v 3 -e -d /db/20180827/ -S /db/mysql_3306/mysql.sock


(1)备份指定库,并压缩备份文件
mydumper -u root -p ### -h localhost -B online -c -o /backup/01

(2)全备,并备份二进制日志文件。
mydumper -u root -p ### -h localhost -o /backup/02

 
(3)备份表,不备份表结构。
mydumper -u root -p ### -h localhost -B online -T tb_player accitem_list -m -o /backup/03


(4)指定备份数据库:备份mysql和test库:
mydumper -u backup -p 123456  -h 192.168.180.13 -P 3306 -t 3 -c -l 3600 -s 10000000 -e --regex '^(mysql\.|test\.)' -o bbb/

(5)指定不备份的数据库:不备份abc、mysql、test,备份其他数据库
mydumper -u backup -p 123456  -h 192.168.180.13 -P 3306 -t 3 -c -l 3600 -s 10000000 -e --regex '^(?!(abc\.|mysql\.|test\.))' -o bbb/

(6)不备份以test开头的库:--regex '^(?!(test))'

mydumper -u backup -p 123456 -h 192.168.180.13 -P 3306 -t 3 -c -l 120 -B online -G -E -R -r 500000 -K -C\
        --build-empty-files --socket=/tmp/mysql.sock -o tmp/ 

或者:
mydumper \
    --database=online \
    --host=localhost \
    --port=3306 \
    --user=root \
    --password='mysql' \
    --outputdir=/app/tmp \
    --rows=500000 \
    --compress \
    --build-empty-files \
    --threads=3 \
    --verbose=3 \
    --compress-protocol \
    --kill-long-queries \
    --triggers \
    --events \
    --routines \
    --less-locking \
    --long-query-guard=120 \
    --socket=/tmp/mysql.sock

导数据,全备注意,不要导出sys,


还原
myloader -u root -p ### -h localhost -B sltonline -d sltonline/

全备的,还原不要指定--database。他自动会创建
myloader \
    --database=sltonline \
    --host=localhost \
    --port=3306 \
    --user=root \
    --password='' \
    --directory=tmp/20180613/ \
    --queries-per-transaction=50000 \
    --threads=6 \
    --compress-protocol \
    --verbose=3 \
    --overwrite-tables \
    --socket=/db/mysql_3306/mysql.sock
 

mydumper的less locking模式

    mydumper使用--less-locking可以减少锁等待时间,此时mydumper的执行机制大致为

    主线程 FLUSH TABLES WITH READ LOCK (全局锁)
    Dump线程 START TRANSACTION WITH CONSISTENT SNAPSHOT;
    LL Dump线程 LOCK TABLES non-InnoDB (线程内部锁)
    主线程UNLOCK TABLES
    LL Dump线程 dump non-InnoDB tables
    LL DUmp线程 UNLOCK non-InnoDB
    Dump线程 dump InnoDB tables


mydumper把数据和表结构分开备份,并且把二进制日志备份出来单独放到一个文件中。

    *_post.sql.gz  备份的是存储过程。视图被当成表进行了备份。

------------------------------------------------
删除部分备份文件,不执行导入:

for ((i=247;i<=250;i++));do var=$(printf "%05d" "$i");echo online.msg01_base.$var.sql.gz;done

解压mydumper的压缩文件。
gunzip  -c db1-schema-create.sql.gz >test.sql

=============================================================

增量备份,根据测试和上面的原理来看,binlog位置表示的是:FLUSH TABLES WITH READ LOCK 之前的数据,
之后插入的数据,不会被备份进去。因此如果要增量备份,那就从该位置开始恢复即可。

因此增量备份,直接cp binlog文件即可。为了保证每一个binlog文件的完整型(也就是说不会导致备份之后,该文件继续写入,下次增量的时候又将该文件备份一次)
每次进行全备和增量备份之前,flush logs一下。


=============================================错误收集-===============

导入的时间出现这个报错:

** (myloader:766): CRITICAL **: the specified directory is not a mydumper backup

没有找到备份集,可能路径错误。


** (myloader:10552): CRITICAL **: Error switching to database online20180601,online20180701,sltpay whilst restoring table help_category
** Message: Thread 6 shutting down

原因很多,比如磁盘满了,内存占用太多被linux kill掉等等。

你可能感兴趣的:(备份恢复)