MySQL怎么判断走索引还是全表扫描?

引入:我们在查询有索引的字段时,有时候会发现居然没有走索引,而是走了全表扫描。这是为什么呢?

因为MySQL发现走全表扫描会比走索引更快,因此选择了全表扫描。

MySQL是怎么判断走索引快还是走全表扫描快的呢?这里需要补充几个知识

聚簇索引和非聚簇索引。

聚簇索引:将数据存储与索引放到了一块,索引结构的叶子节点保存了行数据。

非聚簇索引:将数据与索引分开存储,索引结构的叶子节点指向了数据对应的位置

innodb中,在聚簇索引上创建的索引都称为辅助索引(复合索引,前缀索引,唯一索引)。辅助索引叶子节点存储的不再是行的物理位置,而是主键值,辅助索引访问数据总是需要访问两次索引。

在innodb中,辅助索引存储的不是数据,而是主键,因此每次查询(需要回表的查询)都需要扫描两次索引,先从辅助索引中找到主键,在根据主键值从主键索引找到对应的行数据。当数据量很大时,举一个极端的例子,如果说table表中的name字段都是非空的,使用 select * from table where name is not null,这时如果走索引,每次都需要查找辅助索引,然后根据找到的主键在进行主键索引查找找到所有的行数据。但是如果走全表扫描,只需要走一遍主键索引即可得到数据,会比走两次索引更快。但是相反的如果是is null,显然走一次索引即可查到符合条件的数据,因此这时走索引更快。

那么MySQL是怎么那么聪明的知道走索引快还是走全表扫描快的呢?难到两种方式找一遍?显然不可能。

索引通过遍历部分数据,也就是采样,来获得预测的基数

如果基数越大,也就是符合条件的样本越少,那么走索引的优势就越大。

反之基数越小,符合条件的样本的越多,走全表扫描的优势越大。

但是因为是采样,所以有时候也会判断错误,可以用force index()来强行使用索引。

你可能感兴趣的:(mysql,mysql,数据库,database)