MySQL---索引

目录

一、索引的分类

二、索引的底层原理是什么?

2.1、Innodb和MyIsAM两种引擎搜索数据时候的区别:

2.2、为什么MySQL(MyIsAM、Innodb)索引选择B+树而不是B树呢?

2.3、Innodb的主键索引和二级索引(辅助索引)

2.4、MysIAM的主键索引树和二级索引树

 2.5、哈希索引​编辑

2.6、Innodb自适应哈希索引

三、索引的常见问题

3.1、当有多个索引的时候怎么用呢?比如 a=1 and  b=2 and c=3

3.2、涉及到强转(字符串转整型)用不到索引

四、 sql和索引优化问题,怎么切入?用慢查询日志


索引的优点: 提高查询效率

索引的缺点: 索引并非越多越好,过多的索引会导致CPU使用率居高不下,由于数据的改变,会造成索

引文件的改动,过多的磁盘I/O造成CPU负荷太重

一、索引的分类

物理上(聚集索引&非聚集索引),逻辑上(单列索引&多列索引)

1、普通索引:没有任何限制条件,可以给任何类型的字段创建普通索引(创建新表&已有的表,数量不限,一张表的一次sql查询只能用一个索引)用索引肯定是where过滤的时候用的

2、唯一性索引:使用UNIQUE修饰的字段,值不能够重复,主键索引就隶属于唯一性索引

3、主键索引:使用Primary Key修饰的字段会自动创建索引(MyISAM, InnoDB)

在InnoDB下,如果创建一张表,会默认增加一个整形字段的列去作为主键,而在MyISAM下不会默认生成,因为InnoDB的数据和索引是存在一个文件下的,.IBD 文件中,他必须建索引树,然后在索引树中存数据,没用索引树是存不了数据的 

4、单列索引:在一个字段上创建索引

5、多列索引:在表的多个字段上创建索引 (uid+cid,多列索引必须使用到第一个列,才能用到多列索引,否则索引用不上)

6、全文索引:使用FULLTEXT参数可以设置全文索引,只支持CHAR,VARCHAR和TEXT类型的字段

上,常用于数据量较大的字符串类型上,可以提高查询速度(线上项目支持专门的搜索功能,给后台服务

器增加专门的搜索引擎支持快速高校的搜索 elasticsearch 简称es C++开源的搜索引擎 搜狗的

workflflow)

以索引为过滤条件,也不一定会使用到索引的,MySQL会先进行一下sql分析,如果查出来的数据量跟整表搜索差不多的话,还不如直接就是整表搜索了。因为使用索引的步骤还是比较多的:

首先要读索引文件,花费磁盘io,还要扫描索引树,数据取不完的话最终还要去表上取数据,还不如直接扫描整个表呢

索引创建的细节:

MySQL---索引_第1张图片

索引优化:

1、给经常要作为where过滤的条件要加上索引

2、给字符串列创建索引的时候要考虑索引的长度越短越好(只要能区分索引值就行)

3、如果过滤条件过滤字段涉及类型强转就不能用到索引了,过滤条件用到MySQL的函数,也用不到索引了

二、索引的底层原理是什么?

MySQL---索引_第2张图片

b树比AVL树最大的好处就是在于磁盘I/O的次数少,在内存上搜索起来效率其实差不多的

2.1、Innodb和MyIsAM两种引擎搜索数据时候的区别:

假设搜索语句是:select * from student where name = 'ZhangSan';

MyIsAM:

        name  没有索引: 会对name.MYD文件进行整表扫描查询。

        name  有索引:会有一个name.MYI的文件,从这个文件中会把数据加载到内存上构建一个b树,花费一次磁盘I/O读取到的数据就刚好写在b树的一个节点上面(最多磁盘I/O三次就行了),然后从根节点上开始字符串的比较,效率是log(n),因为MyIsAM的数据和索引存在不同的文件上,所以找到的data存放的只是真实数据的地址,还要到name.MYD上去拿数据

Innodb:

        name  没用索引:也会默认有索引树,会自己生成一个整形的主键值,因为查的是name,相当于就说把这课b树整个内容全部搜索一遍,也和整表搜索没啥区别。 

        name  有索引:就会加载name的b树,进行快速搜索就行了。

2.2、为什么MySQL(MyIsAM、Innodb)索引选择B+树而不是B树呢?

MySQL---索引_第3张图片

 问:索引的底层原理是什么?

select * from student where name='ZhangSan';

当要执行一个sql语句的时候,MySQL会先去分析一下过滤条件,如果没用索引的话,就去整表搜索 ,如果有索引的话,操作系统会从磁盘上的索引文件中将数据读到内存当中,用B+树来构建,为什么用B+树呢?

因为B+树是一颗平衡树,搜索的效率很好,而且B+树一个节点一个节点构建的,每个节点对应着一次磁盘I/O,能用较少的I/O次数构建出B+树结构。

而且所有的data都存在叶子节点上,每次搜索数据查询次数都比较平衡,有链表。。。。 

2.3、Innodb的主键索引和二级索引(辅助索引)

重点:二级索引有回表,可以选择相应的列避免回表

MySQL---索引_第4张图片

 using  filesort 问题

MySQL---索引_第5张图片

2.4、MysIAM的主键索引树和二级索引树

索引和数据分开存放的叫非聚集索引,放一起的叫聚集索引

MySQL---索引_第6张图片

 2.5、哈希索引MySQL---索引_第7张图片

2.6、Innodb自适应哈希索引

自适应索引不是我们主动去创建的,是MySQL为了优化自己去创建基于B+树

我们先来看自适应哈希索引是在什么条件下生成的:

MySQL---索引_第8张图片

 我们可以查看自适应哈希索引的开启情况

MySQL---索引_第9张图片

 查看分区情况

MySQL---索引_第10张图片

 自适应哈希索引也不一定能优化

MySQL---索引_第11张图片

三、索引的常见问题

3.1、当有多个索引的时候怎么用呢?比如 a=1 and  b=2 and c=3

 我们首先知道的是:一次sql只会用到一次索引,用到的是看哪个过滤出来的数据少,就用哪个,当然,也是可以进行强制指定到底用哪个索引的。

MySQL---索引_第12张图片

3.2、涉及到强转(字符串转整型)用不到索引

MySQL---索引_第13张图片

四、 sql和索引优化问题,怎么切入?用慢查询日志

slow_query_log  慢查询日志

MySQL可以设置慢查询日志,当SQL执行的时间超过我们设定的时间,那么这些SQL就会被记录在慢查

询日志当中,然后我们通过查看日志,用explain分析这些SQL的执行计划,来判定为什么效率低下,是

没有使用到索引?还是索引本身创建的有问题?或者是索引使用到了,但是由于表的数据量太大,花费

的时间就是很长,那么此时我们可以把表分成n个小表,比如订单表按年份分成多个小表等。

设置慢查询日志的参数:

MySQL---索引_第14张图片

 我们可以修改慢查询的时间阈值

MySQL---索引_第15张图片

1、 打开慢查询日志,设置合理的业务可以接受的慢查询时间。

2、 压测执行各种业务

3、 查看慢查询日志,找出所有执行耗时的sql

4、 用explain分析这些耗时的sql

MySQL---索引_第16张图片

5、         一、可能会出现用了 where + order by,有using  file  sort的问题。为什么会出现file sort 外部排序的情况呢?因为数据都是在磁盘上存放的,如果没有加合适的索引,就只能先将数据读到内存当中,然后再进行排序的了,可以将where和order  by 的数据进行一下联合索引,然后在进行。 

               二、可能是没有加索引 

               三、可能是where过滤条件用到了函数,导致没有用到索引

               四、可能涉及到了MySQL数据的强转(字符串转成了整型),没用到索引。        

你可能感兴趣的:(mysql,数据库)