MySQL主从同步以及索引的原理

1、主从同步原理

1.1、mysql主从同步(复制)概念

  1. 将Mysql某一台主机数据复制到其它主机(slaves)上,并重新执行一遍来实现的。
  2. 复制过程中一个服务器充当主服务器,而一个或多个其它服务器充当从服务器。
  3. 主服务器将更新写入二进制日志文件,并维护文件的一个索引以跟踪日志循环。
  4. 当一个从服务器连接主服务器时,它通知主服务器从服务器在日志中读取的最后一次成功更新的位置。
  5. 从服务器接收从那时起发生的任何更新,然后封锁并等待主服务器通知新的更新。
    ** 注意:是二进制日志文件,用于记录mysql的数据更新或者潜在更新(比如DELETE语句执行删除而实际并没有符合条件的数据)**

1.2、Mysql支持哪些复制

  1. 基于语句的复制: 在主服务器执行SQL语句,在从服务器执行同样语句。
    注:MySQL默认采用基于语句的复制,效率较高。一旦发现没法精确复制时, 会自动选基于行的复制。
  2. 基于行的复制: 把改变的内容复制过去,而不是把命令在从服务器上执行一遍. 从mysql5.0开始支持
  3. 混合类型的复制: 默认采用基于语句的复制,一旦发现基于语句的无法精确的复制时,就会采用基于行的复制。

1.3、Mysql主从复制原理

  1. master服务器将数据的改变都记录到二进制binlog日志中,只要master上的数据发生改变,则将其改变写入二进制日志;

  2. salve服务器会在一定时间间隔内对master二进制日志进行探测其是否发生改变,如果发生改变,则开始一个I/O Thread请求master二进制事件

  3. 同时主节点为每个I/O线程启动一个dump线程,用于向其发送二进制事件,并保存至从节点本地的中继日志中

  4. 从节点将启动SQL线程从中继日志中读取二进制日志,在本地重放,使得其数据和主节点的保持一致

  5. 最后I/O Thread和SQL Thread将进入睡眠状态,等待下一次被唤醒。

    需要理解:

    • 从库会生成两个线程,一个I/O线程,一个SQL线程;
    • I/O线程会去请求主库的binlog,并将得到的binlog写到本地的relay-log(中继日志)文件中;
    • 主库会生成一个log dump线程,用来给从库I/O线程传binlog;
    • SQL线程,会读取relay log文件中的日志,并解析成sql语句逐一执行;

1.4、Mysql复制流程图

  1. master将操作语句记录到binlog日志中
  2. salve服务器会在一定时间间隔内对master二进制日志进行探测其是否发生改变,如果发生改变
  3. salave开启两个线程:IO线程和SQL线程
    1)IO线程:负责读取master的binlog内容到中继日志relay log里;
    2)SQL线程:负责从relay log日志里读出binlog内容,并更新到slave的数据库里(保证数据一致)

MySQL主从同步以及索引的原理_第1张图片

2、MySQL索引原理

2.1、MyISAM实现索引

1)、MyISAM实现索引 介绍

  1. MyISAM引擎使用B+Tree作为索引结构,叶节点的data域存放的是数据记录的地址。
  2. MyISAM中索引检索的算法为首先按照B+Tree搜索算法搜索索引。
  3. 如果指定的Key存在,则取出其data域的值,然后以data域的值为地址,读取相应数据记录。
  4. MyISAM的索引方式也叫做“非聚集”的,之所以这么称呼是为了与InnoDB的聚集索引区分。

2.2、MyISAM索引的原理图

1. 这里设表一共有三列,假设我们以Col1为主键,则上图是一个MyISAM表的主索引(Primary key)示意。
2. 可以看出MyISAM的索引文件仅仅保存数据记录的地址。

MySQL主从同步以及索引的原理_第2张图片

2.2、InnoDB索引实现

1)、InnoDB的数据文件本身就是索引文件

  • 从上文知道,MyISAM索引文件和数据文件是分离的,索引文件仅保存数据记录的地址。
  • 而在InnoDB中,表数据文件本身就是按B+Tree组织的一个索引结构,这棵树的叶节点data域保存了完整的数据记录。
  • 这个索引的key是数据表的主键,因此InnoDB表数据文件本身就是主索引。

MySQL主从同步以及索引的原理_第3张图片
说明:

  • 可以看到叶节点包含了完整的数据记录,这种索引叫做聚集索引。
  • 因为InnoDB的数据文件本身要按主键聚集,所以InnoDB要求表必须有主键(MyISAM可以没有)
  • 如果没有显式指定,则MySQL系统会自动选择一个可以唯一标识数据记录的列作为主键
  • 如果不存在这种列,则MySQL自动为InnoDB表生成一个隐含字段作为主键,这个字段长度为6个字节,类型为长整形。

2)、InnoDB的辅助索引data域存储相应记录主键的值而不是地址

  • 换句话说,InnoDB的所有辅助索引都引用主键作为data域。
  • 这里以英文字符的ASCII码作为比较准则。
  • 聚集索引这种实现方式使得按主键的搜索十分高效,但是辅助索引搜索需要检索两遍索引
  • 首先检索辅助索引获得主键,然后用主键到主索引中检索获得记录。

3)、为什么不建议使用过长的字段作为主键

  • 例如知道了InnoDB的索引实现后,就很容易明白为什么不建议使用过长的字段作为主键
  • 因为所有辅助索引都引用主索引,过长的主索引会令辅助索引变得过大。
  • 再例如,用非单调的字段作为主键在InnoDB中不是个好主意,因为InnoDB数据文件本身是一颗B+Tree,
  • 非单调的主键会造成在插入新记录时数据文件为了维持B+Tree的特性而频繁的分裂调整,十分低效,而使用自增字段作为主键则是一个很好的选择。

你可能感兴趣的:(MySQL)