通过阅读源码 更加深入了解原理,以及如何进行全量数据同步,如何使用触发器来同步变更期间的原表的数据更改。(^-^)V
目录
源码分析
Get configuration information.
Connect to MySQL.
Create --plugin.
Setup lag and load monitors.
Check for replication filters.
Print --tries.
Get child tables of the original table, if necessary.
Check the --alter statement.
check and create PID file if user specified --pid.
Init the --plugin.
Step 1: Create the new table.
Step 2: Alter the new, empty table. This should be very quick, or die if the user specified a bad alter statement.
Step 3: Create the triggers to capture changes on the original table and apply them to the new table.
详细解读一下这三个触发器
DELETE TRIGGER 删除触发器
UPDATE TRIGGER 更新触发器
INSERT TRIGGER 插入触发器
Step 4: Copy rows.
对于空表
对于大表的该阶段步骤
Step 5: Update foreign key constraints if there are child tables.
Step 6: Swap tables
Step 7: Drop the old table.
测试步骤
开启全量日志
创建一张空表
进行变更
输出的日志
输出日志分析
这个文件非常“臃肿肥胖“,因为依赖的模块都在这一个文件中,这个文件有13000多行的代码。
找到函数的入口 main(),该脚本的主题流程如下
获取并 检查设置的参数,感觉对外键的处理让工具变的复杂了很多。
主要是根据设置的命令行参数进行检查设置,我根据源码举几个例子
连接到MySQL
check-foreign-keys 如果没有设置 则 SET foreign_key_checks=0
检查MySQL版本 是否大于 5.0.10,虽然5.0.2 支持了触发器,但是到 5.0.10 之前,触发器不能包含按名称对表的直接引用
检查参数 analyze-before-swap 是否必要
设置检查的从库延迟 与负载监控
检查复制的过滤规则
一些操作的重试次数 和 间隔。
Operation, tries, wait:
analyze_table, 10, 1
copy_rows, 10, 0.25
create_triggers, 10, 1
drop_triggers, 10, 1
swap_tables, 10, 1
update_foreign_keys, 10, 1
检查变更语句
变更步骤
创建中间表
中间表的表名 如果设置了参数 new-table-name,则新表名为 new-table-name。如果没有设置该参数,则为 _%T_new,%T为原表名。
如何创建中间表:
不能使用 CRATE TABLE LIKE ,因为他不会保留 外键约束。这里我们也需要重命名外键约束。这是因为外键约束内部存储的形式.,外键约束名字不能重复。如果不重命名外键约束,这个innodb 会抛出121错误,
这段代码并不完美。 如果我们将约束重命名为 foo 到 _foo 并且 该表或另一个表中已经存在该名称的约束,我们仍然可能发生冲突。 但如果有该表上有多个 FK,很难知道是哪一个导致的错误。 我们应该生成随机/UUID FK 名称还是其他名称?
Creating new table...
CREATE TABLE `osc_test`.`_my_table_new` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`first_name` varchar(50) DEFAULT NULL,
`last_name` varchar(50) DEFAULT NULL,
`job_title` varchar(100) DEFAULT NULL,
`hire_date` date DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4
Created new table osc_test._my_table_new OK.
对中间表进行变更
Altering new table...
ALTER TABLE `osc_test`.`_my_table_new` add index idx_first_name(first_name);
Altered `osc_test`.`_my_table_new` OK.
创建触发器 捕获变化 应用到中间表上
2023-12-22T15:33:19 Creating triggers...
2023-12-22T15:33:19 Created triggers OK.
-- DELETE TRIGGER
CREATE TRIGGER `pt_osc_osc_test_my_table_del` AFTER DELETE ON `osc_test`.`my_table` FOR EACH ROW DELETE IGNORE FROM `osc_test`.`_my_table_new` WHERE `osc_test`.`_my_table_new`.`id` <=> OLD.`id`
--UPDATE TRIGGER
CREATE TRIGGER `pt_osc_osc_test_my_table_upd` AFTER UPDATE ON `osc_test`.`my_table` FOR EACH ROW BEGIN DELETE IGNORE FROM `osc_test`.`_my_table_new` WHERE !(OLD.`id` <=> NEW.`id`) AND `osc_test`.`_my_table_new`.`id` <=> OLD.`id`;REPLACE INTO `osc_test`.`_my_table_new` (`id`, `first_name`, `last_name`, `job_title`, `hire_date`) VALUES (NEW.`id`, NEW.`first_name`, NEW.`last_name`, NEW.`job_title`, NEW.`hire_date`);END
--INSERT TRIGGER
CREATE TRIGGER `pt_osc_osc_test_my_table_ins` AFTER INSERT ON `osc_test`.`my_table` FOR EACH ROW REPLACE INTO `osc_test`.`_my_table_new` (`id`, `first_name`, `last_name`, `job_title`, `hire_date`) VALUES (NEW.`id`, NEW.`first_name`, NEW.`last_name`, NEW.`job_title`, NEW.`hire_date`)
id是主键,每个id 唯一
在原表 `osc_test`.`my_table` 某个id的数据被删除后, 会删除中间表`osc_test`.`_my_table_new` 中上id 与原表表相匹配的数据,因为使用DELETE IGNORE的语法,如果此时copy-data(全量数据拷贝)阶段还没有把该id的数据从原表拷贝到中间表,在中间表上执行DELETE IGNORE也不会报错。
中间表已经有该数据,即全量数据拷贝阶段已经把该数据拷贝到中间表,在原表删除后中间表的数据也会被删除。
中间表还没有该数据 ,也不用担心全量数据阶段会再把该数据拷贝到中间表,因为原表上已经被删除了呀。
当在osc_test.my_table
表上执行UPDATE操作时,触发器会在每一行被更新之后执行。
如果原表上更新导致 主键ID发生了变化,则中间表上 先删除该ID的数据,然后在插入REPLACE INTO
如果原表上更新导致 主键ID没有发生了变化,则在中间表直接 REPLACE INTO (忽略唯一性约束错误,会覆盖该ID的数据)
数据还没有同步到中间表,则会在中间表插入,等到全量数据同步的时候覆盖一次。
数据已经同步到中间表,则走上面的逻辑。
当在osc_test.my_table
表上执行INSERT操作时,触发器会在每一行被插入之后执行。
触发器的作用是将新插入的数据REPLACE INTO (插入或替换)到osc_test._my_table_new
表中,确保id
唯一。
中间表已经有该数据,即全量数据拷贝阶段已经把该数据拷贝到中间表,在原表插入新数据后替换中间表的数据。
中间表还没有该数据 ,即全量数据拷贝阶段还没有把该数据拷贝到中间表,但是由于触发器存在,该中间表中已经存在该ID的数据,在全量复制数据期间会再次覆盖插入一次(INSERT LOW_PRIORITY IGNORE INTO ) 。
拷贝全表数据
分为两种情况 ,第一中情况为 ,一个chunk_size大于该表的行数,就不用对表进行分块;第二种,需要进行分块(chunking the table)。
如果表的数据量只有一个chunk,需要确保从库的数据量也只有个chunk。
INSERT LOW_PRIORITY IGNORE INTO ,
LOCK IN SHARE MODE,加共享锁 , 查询一个chunk数据的时候不允许写,允许读,所以需要保证这个查询数据很短。
插入操作是对中间表进行,所以不会触发老表上的触发器,不用担心。
2023-12-22T15:33:19 Copying approximately 1 rows...
INSERT LOW_PRIORITY IGNORE INTO `osc_test`.`_my_table_new` (`id`, `first_name`, `last_name`, `job_title`, `hire_date`) SELECT `id`, `first_name`, `last_name`, `job_title`, `hire_date` FROM `osc_test`.`my_table` LOCK IN SHARE MODE /*pt-online-schema-change 140230 copy table*/
2023-12-22T15:33:19 Copied rows OK.
原文的注释和代码中用了 nibble , 原意是蚕食,感觉对大表来说比较形象,将大表分成小块同步到中间表 (“蚕食”)。
需要确保使用的是同一个分块索引。
获取每个chunk 的起始边界ID ,
SELECT /*!40001 SQL_NO_CACHE */ `id` FROM `osc_test`.`mytable2` FORCE INDEX(`PRIMARY`) ORDER BY `id` LIMIT 1 /*first lower boundary*/
获取第一次chunk 的截止边界 ,第一次chunk 的大小和 chunk-size的值相同。因为chunk-size的默认值是1000,所以WHERE ((`id` >= '1')) ORDER BY `id` LIMIT 999, 2; 获取到的ID是 1000
SELECT /*!40001 SQL_NO_CACHE */ `id` FROM `osc_test`.`mytable2` FORCE INDEX(`PRIMARY`) WHERE ((`id` >= '1')) ORDER BY `id` LIMIT 999, 2 /*next chunk boundary*/
查看 查询原表数据SQL的 执行计划
EXPLAIN SELECT `id`, `emp_id`, `ldap`, `name` FROM `osc_test`.`mytable2` FORCE INDEX(`PRIMARY`) WHERE ((`id` >= '1')) AND ((`id` <= '1000')) LOCK IN SHARE MODE /*explain pt-online-schema-change 127495 copy nibble*/
然后进行实际的插入
INSERT LOW_PRIORITY IGNORE INTO `osc_test`.`_mytable2_new` (`id`, `emp_id`, `ldap`, `name`) SELECT `id`, `emp_id`, `ldap`, `name` FROM `osc_test`.`mytable2` FORCE INDEX(`PRIMARY`) WHERE ((`id` >= '1')) AND ((`id` <= '1000')) LOCK IN SHARE MODE /*pt-online-schema-change 127495 copy nibble*/
查看SQL执行的警告 ,结束的时候可以作为参数--statistics 统计信息输出
SHOW WARNINGS
查看活跃会话数,这个注释是 作为 --max_load 和 --load的默认参数,如果服务器超过
SHOW GLOBAL STATUS LIKE 'Threads_running'
继续取下一个chunk的边界 ,chunk-size的值是根据 rows/s (每秒处理的行数)自动调节的,这次就变成了每个chunk 7442。
SELECT /*!40001 SQL_NO_CACHE */ `id` FROM `osc_test`.`mytable2` FORCE INDEX(`PRIMARY`) WHERE ((`id` >= '1001')) ORDER BY `id` LIMIT 7442, 2 /*next chunk boundary*/
一直循环该步骤 知道全表数据拷贝完成。
该交换是原子性的 ,即两张表的rename语句是在同一个语句中,该语句执行很快,所以元数据锁的时间也会很短
2023-12-22T15:33:19 Analyzing new table...
2023-12-22T15:33:19 Swapping tables...
RENAME TABLE `osc_test`.`my_table` TO `osc_test`.`_my_table_old`, `osc_test`.`_my_table_new` TO `osc_test`.`my_table`
2023-12-22T15:33:19 Swapped original and new tables OK.
删除原表
删除触发器
2023-12-22T15:33:19 Dropping old table...
DROP TABLE IF EXISTS `osc_test`.`_my_table_old`
2023-12-22T15:33:19 Dropped old table `osc_test`.`_my_table_old` OK.
2023-12-22T15:33:19 Dropping triggers...
DROP TRIGGER IF EXISTS `osc_test`.`pt_osc_osc_test_my_table_del`
DROP TRIGGER IF EXISTS `osc_test`.`pt_osc_osc_test_my_table_upd`
DROP TRIGGER IF EXISTS `osc_test`.`pt_osc_osc_test_my_table_ins`
2023-12-22T15:33:19 Dropped triggers OK.
变更完成
开启日志后,所有SQL都会被记录到 ,便于我们结合源码理解原理。
set global general_log=on;
这样变更过程中全量日志输出的内容会很少。
CREATE TABLE my_table (
id INT AUTO_INCREMENT PRIMARY KEY,
first_name VARCHAR(50),
last_name VARCHAR(50),
job_title VARCHAR(100),
hire_date DATE
) ENGINE=InnoDB;
pt-online-schema-change --user=root \
--socket='/home/storage/mysql/mysql_5306/run/mysql.sock' \
--port=5306 \
D=osc_test,t=my_table \
--alter="add index idx_first_name(first_name);" \
--execute \
--charset=utf8 \
--statistics --print --progress=time,10
No slaves found. See --recursion-method if host ehr-db-stage02.ys has slaves.
Not checking slave lag because no slaves were found and --check-slave-lag was not specified.
Operation, tries, wait:
analyze_table, 10, 1
copy_rows, 10, 0.25
create_triggers, 10, 1
drop_triggers, 10, 1
swap_tables, 10, 1
update_foreign_keys, 10, 1
Altering `osc_test`.`my_table`...
Creating new table...
CREATE TABLE `osc_test`.`_my_table_new` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`first_name` varchar(50) DEFAULT NULL,
`last_name` varchar(50) DEFAULT NULL,
`job_title` varchar(100) DEFAULT NULL,
`hire_date` date DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4
Created new table osc_test._my_table_new OK.
Altering new table...
ALTER TABLE `osc_test`.`_my_table_new` add index idx_first_name(first_name);
Altered `osc_test`.`_my_table_new` OK.
2023-12-22T15:33:19 Creating triggers...
2023-12-22T15:33:19 Created triggers OK.
2023-12-22T15:33:19 Copying approximately 1 rows...
INSERT LOW_PRIORITY IGNORE INTO `osc_test`.`_my_table_new` (`id`, `first_name`, `last_name`, `job_title`, `hire_date`) SELECT `id`, `first_name`, `last_name`, `job_title`, `hire_date` FROM `osc_test`.`my_table` LOCK IN SHARE MODE /*pt-online-schema-change 140230 copy table*/
2023-12-22T15:33:19 Copied rows OK.
2023-12-22T15:33:19 Analyzing new table...
2023-12-22T15:33:19 Swapping tables...
RENAME TABLE `osc_test`.`my_table` TO `osc_test`.`_my_table_old`, `osc_test`.`_my_table_new` TO `osc_test`.`my_table`
2023-12-22T15:33:19 Swapped original and new tables OK.
2023-12-22T15:33:19 Dropping old table...
DROP TABLE IF EXISTS `osc_test`.`_my_table_old`
2023-12-22T15:33:19 Dropped old table `osc_test`.`_my_table_old` OK.
2023-12-22T15:33:19 Dropping triggers...
DROP TRIGGER IF EXISTS `osc_test`.`pt_osc_osc_test_my_table_del`
DROP TRIGGER IF EXISTS `osc_test`.`pt_osc_osc_test_my_table_upd`
DROP TRIGGER IF EXISTS `osc_test`.`pt_osc_osc_test_my_table_ins`
2023-12-22T15:33:19 Dropped triggers OK.
# Event Count
# ====== =====
# INSERT 1
Successfully altered `osc_test`.`my_table`.
官方文档:
pt-online-schema-change — Percona Toolkit Documentation
源码分析 重庆八怪
https://www.jianshu.com/p/ecec3d307ec0/