MySQL InnerDB

事务隔离级别

所谓隔离级别,就是在数据库事务中,为保证并发数据读写的正确性而提出的定义。每种关系型数据库都提供了各自特色的隔离级别实现,虽然在通常的定义中是以锁为实现单元,但实际的实现千差万别。
以最常见的 MySQL InnoDB 引擎为例,它是基于MVCC(Multi-Version Concurrency Control)和锁的复合实现的,按照隔离级别由低到高,MYSQL事务隔离级别分为四个不同层次:

  • 读未提交(Read Uncommitted),事务A能够看到事务B未提交的修改,允许出现脏读
  • 读已提交(Read Committed), 事务A只可以看到事务B已经提交的修改,允许出现不可重复读,即不能保证同一个事务中多次读取数据的结果一致。
  • 可重复读(Repeatable Read), 保证同一个事务中多次读取的数据是一致的。这是MYSQL默认的隔离级别。但是和其他数据库实现不同的是,MYSQL通过对一个范围加Gap锁,可以在一定程度上避免幻读情况。
  • 串行化(Serializable) ,事务之间是串行执行的,通常意味着读需要获取共享读锁,更新需要获取排他写锁。
    MYSQL InnerDB会根据不同的事务隔离级别,对数据修改增加一些"隐式"的锁,同时也支持通过特定语句进行显示的锁定,比如:
    SELECT ... LOCK IN SHARE MODE
    SELECT ... FOR UPDATE

悲观锁和乐观锁

悲观锁和乐观锁不是MYSQL中独有的概念,而是并发编程的基本概念。主要区别在于,操作共享数据时,“悲观锁”认为数据出现冲突的可能性更大,而“乐观锁”则认为大部分情况不会出现冲突,进而决定是否采用排他性的措施。JAVA中常用的synchronized关键字,以及并发包中的读写锁,都属于悲观锁,而CAS操作可以认为是乐观锁。
乐观锁的实现方式一般有一下两种:

  • 使用数据版本(Version)实现,这是乐观锁最常用的一种实现方式。何谓数据版本?即为数据增加一个版本标识,一般是通过为数据库表增加一个数字类型的 “version” 字段来实现。当读取数据时,将version字段的值一同读出,数据每更新一次,对此version值+1。当我们提交更新的时候,判断数据库表对应记录的当前版本信息与第一次取出来的version值进行比对,如果数据库表当前版本号与第一次取出来的version值相等,则予以更新,否则认为是过期数据。
  • 使用时间戳(timestamp),同样是在需要乐观锁控制的table中增加一个字段,名称无所谓,字段类型使用时间戳(timestamp), 和上面的version类似,也是在更新提交的时候检查当前数据库中数据的时间戳和自己更新前取到的时间戳进行对比,如果一致则OK,否则就是版本冲突.

当前读和快照读

Innodb的操作可以分为当前读(current read)和快照读(snapshot read):

  1. 快照读: 简单的SELECT 语句
  2. 当前读: SELECT IN SHARD MODE, SELECT FOR UPDATE, INSERT, UPDATE, DELETE
    在RR事务隔离级别下,快照读是通过MVCC和undo log来实现的,当前读是通过加record lock(记录锁)和gap lock(间隙锁)来实现的。
    所以我们通常所说的MYSQL 在一定程度上可以避免出现"幻读" 指的是当前读,如果在事务中使用了快照读,则不能保证出现“幻读”

MVCC实现

InnerDB MVCC是通过在每行记录后面保存两个隐藏的列来实现的。这两个列,一个保存了行的创建时间,一个保存行的过期时间(或删除时间)。当然存储的并不是实际的时间值,而是系统版本号(system version number)。每开始一个新的事务,系统版本号都会自动递增。事务开始时刻的系统版本号会作为事务的版本号,用来和查询到的每行记录的版本号进行比较

  • SELECT: 会根据以下两个条件检查每行记录
    1. 只查找版本早于当前事务版本的数据行(也就是,行的系统版本号小于或等于事务的系统版本号),这样可以确保事务读取的行,要么是在事务开始前已经存在的,要么是事务自身插入或者修改过的.
    2. 行的删除版本要么未定义,要么大于当前事务版本号。这可以确保事务读取到的行,在事务开始之前未被删除。
      只有符合上述两个条件的记录,才能返回作为查询结果
  • INSERT: 新插入的每一行保存当前系统版本号作为行版本号。
  • DELETE: 为删除的每一行保存当前系统版本号作为行删除标识。
  • UPDATE: 系统版本号 +1

redo,undo,binglog

https://www.linuxidc.com/Linux/2018-01/150614.htm
MySQL中有六种五种日志文件:

  • 重做日志(redo log)
  • 回滚日志(undo log)
  • 二进制日志(binlog)
  • 错误日志(errorlog)
  • 慢查询日志(slow query log)
  • 一般查询日志(general log)
  • 中继日志(relay log)
    其中重做日志和回滚日志与事务操作息息相关,二进制日志也与事务操作有一定的关系,这三种日志,对理解MySQL中的事务操作有着重要的意义
  1. 重做日志
  • 作用:确保事务的持久性。防止在发生故障的时间点,尚有脏页未写入磁盘,在重启mysql服务的时候,根据redo log进行重做,从而达到事务的持久性这一特性。
  • 内容:物理格式的日志,记录的是物理数据页面的修改的信息,其redo log是顺序写入redo log file的物理文件中去的。
  • 什么时候产生:事务开始之后就产生redo log,redo log的落盘并不是随着事务的提交才写入的,而是在事务的执行过程中,便开始写入redo log文件中
  • 什么时候释放:当对应事务的脏页写入到磁盘之后,redo log的使命也就完成了,重做日志占用的空间就可以重用(被覆盖)
  • 对应的物理文件:
    默认情况下,对应的物理文件位于数据库的data目录下的ib_logfile1&ib_logfile2
      innodb_log_group_home_dir 指定日志文件组所在的路径,默认./ ,表示在数据库的数据目录下。
      innodb_log_files_in_group 指定重做日志文件组中文件的数量,默认2
      关于文件的大小和数量,由一下两个参数配置
      innodb_log_file_size 重做日志文件的大小。
      innodb_mirrored_log_groups 指定了日志镜像文件组的数量,默认1
  • 其他:
      很重要一点,redo log是什么时候写盘的?前面说了是在事物开始之后逐步写盘的。
      之所以说重做日志是在事务开始之后逐步写入重做日志文件,而不一定是事务提交才写入重做日志缓存,
      原因就是,重做日志有一个缓存区Innodb_log_buffer,Innodb_log_buffer的默认大小为8M(这里设置的16M),Innodb存储引擎先将重做日志写入innodb_log_buffer中。
     然后会通过以下三种方式将innodb日志缓冲区的日志刷新到磁盘
      1,Master Thread 每秒一次执行刷新Innodb_log_buffer到重做日志文件。
      2,每个事务提交时会将重做日志刷新到重做日志文件。
      3,当重做日志缓存可用空间 少于一半时,重做日志缓存被刷新到重做日志文件
  1. 回滚日志
    作用:
      保存了事务发生之前的数据的一个版本,可以用于回滚,同时可以提供多版本并发控制下的读(MVCC),也即非锁定读
    内容:
      逻辑格式的日志,在执行undo的时候,仅仅是将数据从逻辑上恢复至事务之前的状态,而不是从物理页面上操作实现的,这一点是不同于redo log的。
    什么时候产生:
      事务开始之前,将当前是的版本生成undo log,undo 也会产生 redo 来保证undo log的可靠性
    什么时候释放:
      当事务提交之后,undo log并不能立马被删除,
      而是放入待清理的链表,由purge线程判断是否由其他事务在使用undo段中表的上一个事务之前的版本信息,决定是否可以清理undo log的日志空间。
    对应的物理文件:
      MySQL5.6之前,undo表空间位于共享表空间的回滚段中,共享表空间的默认的名称是ibdata,位于数据文件目录中。
      MySQL5.6之后,undo表空间可以配置成独立的文件,但是提前需要在配置文件中配置,完成数据库初始化后生效且不可改变undo log文件的个数
      如果初始化数据库之前没有进行相关配置,那么就无法配置成独立的表空间了。
      关于MySQL5.7之后的独立undo 表空间配置参数如下
      innodb_undo_directory = /data/undospace/ --undo独立表空间的存放目录
      innodb_undo_logs = 128 --回滚段为128KB
      innodb_undo_tablespaces = 4 --指定有4个undo log文件

如果undo使用的共享表空间,这个共享表空间中又不仅仅是存储了undo的信息,共享表空间的默认为与MySQL的数据目录下面,其属性由参数innodb_data_file_path配置。
其他:
  undo是在事务开始之前保存的被修改数据的一个版本,产生undo日志的时候,同样会伴随类似于保护事务持久化机制的redolog的产生。
  默认情况下undo文件是保持在共享表空间的,也即ibdatafile文件中,当数据库中发生一些大的事务性操作的时候,要生成大量的undo信息,全部保存在共享表空间中的。
  因此共享表空间可能会变的很大,默认情况下,也就是undo 日志使用共享表空间的时候,被“撑大”的共享表空间是不会也不能自动收缩的。
  因此,mysql5.7之后的“独立undo 表空间”的配置就显得很有必要了。

  1. 二进制日志
    作用:
      1,用于复制,在主从复制中,从库利用主库上的binlog进行重播,实现主从同步。
      2,用于数据库的基于时间点的还原。
    内容:
      逻辑格式的日志,可以简单认为就是执行过的事务中的sql语句。
      但又不完全是sql语句这么简单,而是执行的sql语句(增删改)反向的信息,
      也就意味着delete对应着delete本身和其反向的insert;update对应着update执行前后的版本的信息;insert对应着delete和insert本身的信息。
      在使用mysqlbinlog解析binlog之后一些都会真相大白。
      因此可以基于binlog做到类似于Oracle的闪回功能,其实都是依赖于binlog中的日志记录。

什么时候产生:
  事务提交的时候,一次性将事务中的sql语句(一个事物可能对应多个sql语句)按照一定的格式记录到binlog中。
  这里与redo log很明显的差异就是redo log并不一定是在事务提交的时候刷新到磁盘,redo log是在事务开始之后就开始逐步写入磁盘。
  因此对于事务的提交,即便是较大的事务,提交(commit)都是很快的,但是在开启了bin_log的情况下,对于较大事务的提交,可能会变得比较慢一些。
  这是因为binlog是在事务提交的时候一次性写入的造成的,这些可以通过测试验证。

什么时候释放:
  binlog的默认是保持时间由参数expire_logs_days配置,也就是说对于非活动的日志文件,在生成时间超过expire_logs_days配置的天数之后,会被自动删除。

对应的物理文件:
  配置文件的路径为log_bin_basename,binlog日志文件按照指定大小,当日志文件达到指定的最大的大小之后,进行滚动更新,生成新的日志文件。
  对于每个binlog日志文件,通过一个统一的index文件来组织。

其他:
  二进制日志的作用之一是还原数据库的,这与redo log很类似,很多人混淆过,但是两者有本质的不同
  1,作用不同:redo log是保证事务的持久性的,是事务层面的,binlog作为还原的功能,是数据库层面的(当然也可以精确到事务层面的),虽然都有还原的意思,但是其保护数据的层次是不一样的。
  2,内容不同:redo log是物理日志,是数据页面的修改之后的物理记录,binlog是逻辑日志,可以简单认为记录的就是sql语句
  3,另外,两者日志产生的时间,可以释放的时间,在可释放的情况下清理机制,都是完全不同的。

关于事务提交时,redo log和binlog的写入顺序,为了保证主从复制时候的主从一致(当然也包括使用binlog进行基于时间点还原的情况),是要严格一致的,
  MySQL通过两阶段提交过程来完成事务的一致性的,也即redo log和binlog的一致性的,理论上是先写redo log,再写binlog,两个日志都提交成功(刷入磁盘),事务才算真正的完成。
http://blog.itpub.net/29254281/viewspace-1398273/
http://www.cnblogs.com/leefreeman/p/8286550.html

多用户同时修改一条数据 ,并发问题
https://my.oschina.net/u/2377060/blog/803217

多个用户同时提交同一份表单,来修改同一条记录的问题

数据库分库分表

订单ID生成问题
MYSQL索引优化: https://www.jianshu.com/p/79c83531dfd1

你可能感兴趣的:(MySQL InnerDB)