索引和锁在数据库中可以说是非常重要的知识点了,在面试中也会经常会被问到的。本文力求简单讲清每个知识点,希望大家看完能有所收获。声明:如果没有说明具体的数据库和存储引擎,默认指的是MySQL中的InnoDB存储引擎。
我们对索引有以下的认知:
索引可以加快数据库的检索速度
看起来好像啥都知道,但面试让你说的时候可能就GG了:
所以说,如果我们写
select * from user where username = 'Java3y';
这样没有进行任何优化的sql语句,默认会这样做:
索引做了些什么可以让我们查询加快速度呢?其实就是将无序的数据变成有序(相对):
要找到id为8的记录简要步骤:
很明显的是:没有用索引我们是需要遍历双向链表来定位对应的页,现在通过**“目录”**就可以很快地定位到对应的页上了!其实底层结构就是B+树,B+树作为树的一种实现,能够让我们很快地查找出对应的记录。
B+树是平衡树的一种。
平衡树:它是一棵空树或它的左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树。如果一棵普通的树在极端的情况下,是能退化成链表的(树的优点就不复存在了)
B+树是平衡树的一种,是不会退化成链表的,树的高度都是相对比较低的,基本符合矮矮胖胖(均衡)的结构【这样一来我们检索的时间复杂度就是O(logn)】!从上一节的图我们也可以看见,建立索引实际上就是建立一颗B+树。
除了B+树之外,还有一种常见的是哈希索引。
哈希索引就是采用一定的哈希算法,把键值换算成新的哈希值,检索时不需要类似B+树那样从根节点到叶子节点逐级查找,只需一次哈希算法即可立刻定位到相应的位置,速度非常快。
查看mysql官方文档,从下面的图中可以得知,mysql 是支持hash索引的,但支持和不支持又和具体的存储引擎有关系。从图中,看到InnoDB是支持B+ tree索引,这是我们众所周知的。
我们具体查一下InnoDB文档那一部分:
表中表明,InnoDB不支持hash索引,但又给出了一个特殊的解释,InnoDB存储引擎是支持hash索引的,不过,hash索引的创建由InnoDB存储引擎引擎自动优化创建,不能人为干预是否在一张表中生成哈希索引!
聚集索引以及非聚集索引用的是B+树索引。
举个例子:现在我创建了索引(username,age),在查询数据的时候:
select username , age from user where username = 'Java3y' and age = 20;
很明显地知道,我们上边的查询是走索引的,并且,要查询出的列在叶子节点都存在!所以,就不用回表了。
索引在数据库中是一个非常重要的知识点!上面谈的其实就是索引最基本的东西,要创建出好的索引要顾及到很多的方面:
在mysql中的锁看起来是很复杂的,因为有一大堆的东西和名词:排它锁,共享锁,表锁,页锁,间隙锁,意向排它锁,意向共享锁,行锁,读锁,写锁,乐观锁,悲观锁,死锁。这些名词有的博客又直接写锁的英文的简写:X锁,S锁,IS锁,IX锁,MMVC。锁的相关知识又跟存储引擎,索引,事务的隔离级别都是关联的。
不少人在开发的时候,应该很少会注意到这些锁的问题,也很少会给程序加锁(除了库存这些对数量准确性要求极高的情况下),一般也就听过常说的乐观锁和悲观锁,了解过基本的含义之后就没了。
即使我们不会这些锁知识,我们的程序在一般情况下还是可以跑得好好的。因为这些锁数据库隐式帮我们加了:
只会在某些特定的场景下才需要手动加锁,学习数据库锁知识就是为了:
首先,从锁的粒度,我们可以分成两大类。
不同的存储引擎支持的锁粒度是不一样的。
InnoDB只有通过索引条件检索数据才使用行级锁,否则,InnoDB将使用表锁,也就是说,InnoDB的行锁是基于索引的。
表锁下又分为两种模式:
表读锁(Table Read Lock)
表写锁(Table Write Lock)
从下图可以清晰看到,在表读锁和表写锁的环境下:读读不阻塞,读写阻塞,写写阻塞!
读读不阻塞:当前用户在读数据,其他的用户也在读数据,不会加锁;
读写阻塞:当前用户在读数据,其他的用户不能修改当前用户读的数据,会加锁;
写写阻塞:当前用户在修改数据,其他的用户不能修改当前用户正在修改的数据,会加锁;
读锁和写锁是互斥的,读写操作是串行,如果某个进程想要获取读锁,同时另外一个进程想要获取写锁。在mysql里边,写锁是优先于读锁的!写锁和读锁优先级的问题是可以通过参数调节的:max_write_lock_count和low-priority-updates。
值得注意的是,MyISAM可以支持查询和插入操作的并发进行。可以通过系统变量concurrent_insert来指定哪种模式,在MyISAM中默认是:如果MyISAM表中没有空洞(即表的中间没有被删除的行),MyISAM允许在一个进程读表的同时,另一个进程从表尾插入记录。但是InnoDB存储引擎是不支持的。
上边简单讲解了表锁的相关知识,我们使用Mysql一般是使用InnoDB存储引擎的。InnoDB和MyISAM有两个本质的区别:
从上面也说了:我们是很少手动加表锁的。表锁对我们程序员来说几乎是透明的,即使InnoDB不走索引,加的表锁也是自动的!我们应该更加关注行锁的内容,因为InnoDB一大特性就是支持行锁!
InnoDB实现了以下两种类型的行锁。
看完上面的有没有发现,在一开始所说的:X锁,S锁,读锁,写锁,共享锁,排它锁其实总共就两个锁,只不过它们有多个名字罢了。
另外,为了允许行锁和表锁共存,实现多粒度锁机制,InnoDB还有两种内部使用的意向锁(Intention Locks),这两种意向锁都是表锁:
数据库事务有不同的隔离级别,不同的隔离级别对锁的使用是不同的,锁的应用最终导致不同事务的隔离级别。事务的隔离级别就是通过锁的机制来实现,只不过隐藏了加锁细节。
MVCC(Multi-Version Concurrency Control)多版本并发控制,可以简单地认为:MVCC就是行级锁的一个变种(升级版)。在表锁中我们读写是阻塞的,基于提升并发性能的考虑,MVCC一般读写是不阻塞的(所以说MVCC很多情况下避免了加锁的操作)。
MVCC实现的读写不阻塞正如其名:多版本并发控制—>通过一定机制生成一个数据请求时间点的一致性数据快照(Snapshot),并用这个快照来提供一定级别(语句级或事务级)的一致性读取。从用户的角度来看,好像是数据库可以提供同一数据的多个版本,快照有两个级别:
我们在初学的时候已经知道,事务的隔离级别有4种:
Read committed避免脏读的做法其实很简单:就是把释放锁的位置调整到事务提交之后,此时在事务提交前,其他进程是无法对该行数据进行读取的。但Read committed会出现不可重复读的现象:一个事务读取到另外一个事务已经提交的数据,也就是说一个事务可以看到其他事务所做的修改(A查询数据库得到数据,B去修改数据库的数据,导致A多次查询数据库的结果都不一样,危害是A每次查询的结果都是受B的影响的,那么A查询出来的信息就没有意思了)。
上面也说了,Read committed是语句级别的快照!每次读取的都是当前最新的版本!Repeatable read避免不可重复读采用的是事务级别的快照!每次读取的都是当前事务的版本,即使被修改了,也只会读取到当前事务版本的数据。
来看看InnoDB的MVCC是怎么样的吧,以下摘抄自《高性能MySQL》。
当我们用范围条件检索数据而不是相等条件检索数据,并请求共享或排他锁时,InnoDB会给符合范围条件的已有数据记录的索引项加锁;对于键值在条件范围内但并不存在的记录,叫做“间隙(GAP)”。InnoDB也会对这个“间隙”加锁,这种锁机制就是所谓的间隙锁。
间隙锁锁定索引记录间隙,确保索引记录的间隙不变,间隙锁是针对事务隔离级别为可重复读或以上级别而已的。Gap Lock在InnoDB的唯一作用就是防止其他事务的插入操作,以此防止幻读的发生。
值得注意的是:间隙锁只会在Repeatable read隔离级别下使用。
例子:假如emp表中只有101条记录,其empid的值分别是1,2,…,100,101
Select * from emp where empid > 100 for update;
上面是一个范围查询,InnoDB不仅会对符合条件的empid值为101的记录加锁,也会对empid大于101(这些记录并不存在)的“间隙”加锁。
InnoDB使用间隙锁的目的有两个:
上面说了一大堆关于MySQL数据库锁的东西,现在来简单总结一下。表锁其实我们程序员是很少关心它的:
现在我们大多数使用MySQL都是使用InnoDB,InnoDB支持行锁:
在默认的情况下,select是不加任何行锁的,事务可以通过以下语句显示给记录集加共享锁或排他锁。
InnoDB基于行锁还实现了MVCC多版本并发控制,MVCC在隔离级别下的Read committed和Repeatable read下工作。MVCC能够实现读写不阻塞!InnoDB实现的Repeatable read隔离级别配合GAP间隙锁已经避免了幻读!
本文转载自知乎博主Java3y的文章:https://zhuanlan.zhihu.com/p/40396971