什么是索引?
索引就是MySQL中可以高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护着满足 特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据, 这样就可以在这些数据结构 上实现高级查找算法,这种数据结构就是索引。
添加索引原则上来说可以大大的提高数据获取的效率。
索引的优势:
提高数据检索的效率,降低数据库 的IO成本。
通过索引列对数据进行排序,降低 数据排序的成本,降低CPU的消 耗。
索引的劣势:
索引也是占用空间的。
索引大大提高了查询效率,同时却也降低更新表的速度, 如对表进行INSERT、UPDATE、DELETE时,效率降低。
MySQL的索引是在存储引擎层实现的,不同的存储引擎有不同的索引结构,索引都有B+Tree索引、Hash索引、R-tree(空间索 引) 、Full-text(全文 索引)。我们常用的为B+Tree和Hash索引。
B+Tree是B-Tree的变种,主要有以下三点区别:
MySQL中除了支持B+Tree索引,还支持一种索引类型---Hash索引。
哈希索引就是采用一定的hash算法,将键值换算成新的hash值,映射到对应的槽位上,然后存储在 hash表中。
如果两个(或多个)键值,映射到一个相同的槽位上,他们就产生了hash冲突(也称为hash碰撞),可 以通过链表来解决,如果了解java的话应该很好理解。
Hash索引的优点:
查询效率高,通常(不存在hash冲突的情况)只需要一次检索就可以了,效率通常要高于B+tree索引。
在MySQL数据库,将索引的具体类型主要分为以下几类:主键索引、唯一索引、常规索引、全文索引。
而在在InnoDB存储引擎(MySQL默认存储引擎)中,根据索引的存储形式,又可以分为以下两种:
如果存在主键,主键索引就是聚集索引。
如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引。
如果表没有主键,且没有合适唯一索引,InnoDB会自动生成一个rowid作为隐藏的聚集索引。
聚集索引&二级索引的区别:
创建索引:
CREATE [ UNIQUE | FULLTEXT ] INDEX index_name ON table_name ( index_col_name,... ) ;
演示:例如给user表的name字段添加索引,中括号里的参数是可以省略的。
CREATE INDEX idx_user_name ON user(name);
查看索引:
SHOW INDEX FROM table_name ;
演示:例如查看user表中的索引。
SHOW INDEX FROM user ;
删除索引:
DROP INDEX index_name ON table_name ;
演示:例如删除我们刚刚创建的索引。
DROP INDEX idx_user_name ON user ;
介绍索引的使用之前,我们先要了解一下explain这个函数
EXPLAIN 或者 DESC命令获取 MySQL 如何执行 SELECT 语句的信息,包括在 SELECT 语句执行 过程中表如何连接和连接的顺序。
语法:
直接在select语句之前加上关键字 explain / desc即可。
EXPLAIN SELECT 字段列表 FROM 表名 WHERE 条件 ;
例如:我要查询user表中id=1的数据,其中id为主键索引
explain select * from tb_user where id = 1;
简单介绍一下比较重要的参数:
type:表示连接类型,性能由好到差的连接类型为NULL、system、const、 eq_ref、ref、range、 index、all 。在我们编写代码时,type尽量要往前靠。
如果索引了多列(联合索引),要遵守最左前缀法则。最左前缀法则指的是查询从索引的最左列开始,并且不跳过索引中的列。如果跳跃某一列,索引将会部分失效(后面的字段索引失效)。
在 tb_user 表中,有一个联合索引,这个联合索引涉及到三个字段,顺序分别为:profession, age,status。
在执行以下代码时:
explain select * from tb_user where profession = '软件工程' and age = 31 and status = '0';
可以看到在这里使用到了索引的,key_len为54。
explain select * from tb_user where profession = '软件工程';
可以看到满足最左前缀法则时是可以用到索引的,key_len=47;
explain select * from tb_user where profession = '软件工程' and status = '0';
可以看到status字段是不符合最左前缀法则的,跳过了联合索引中间的age字段,这时的key_len的 长度也为47。所以可以得出若不满足最最前缀法则实惠导致联合索引部分失效的情况。
联合索引中,出现范围查询(>,<),范围查询右侧的列索引失效。
explain select * from tb_user where profession = '软件工程' and age > 30 and status = '0';
当范围查询使用> 或 < 时,走联合索引了,联合索引全走长度为54这里索引的长度为49,就说明范围查询右边的status字段是没有走索引的。
字符串类型字段使用时,不加引号,索引将失效
explain select * from tb_user where profession = '软件工程' and age = 31 and status = 0;
如果字符串不加单引号,对于查询结果,没什么影响,但是数据库存在隐式类型转换,key_len长度为49,索引部分失效了。
若在索引列上进行运算操作, 索引则会失效。
explain select * from tb_user where substring(profession,1,2) = '软件' and age = 31 and status = 0;
可以看到联合索引直接全部失效了,这里若是单例索引也会失效的。
如果仅仅是尾部模糊匹配,索引不会失效。如果是头部模糊匹配,索引失效。
执行以下两句代码:
explain select * from tb_user where profession like '软件%';
explain select * from tb_user where profession like '%工程';
经过上述的测试,我们发现,在like模糊查询中,在关键字后面加%,索引可以生效。而如果在关键字 前面加了%,索引将会失效。
用or分割开的条件, 如果or前的条件中的列有索引,而后面的列中没有索引,那么涉及的索引都不会被用到。
explain select * from tb_user where id = 10 or age = 23;
可以看到id是主键索引,而age并没有索引,所以这里索引失效了。
use index : 建议MySQL使用哪一个索引完成此次查询(仅仅是建议,mysql内部还会再次进 行评估)。
explain select * from tb_user use index(idx_user_pro) where profession = '软件工程';
ignore index : 忽略指定的索引。
explain select * from tb_user ignore index(idx_user_pro) where profession = '软件工程';
force index : 强制使用索引。
explain select * from tb_user force index(idx_user_pro) where profession = '软件工程';
尽量使用覆盖索引,减少select *。 那么什么是覆盖索引呢? 覆盖索引是指 查询使用了索引,并且需要返回的列,在该索引中已经全部能够找到 。
也就是你要获取的数据就在叶子节点存放的键值以及主键id内。
当字段类型为字符串(varchar,text,longtext等)时,有时候需要索引很长的字符串,这会让索引变得很大,查询时,浪费大量的磁盘IO, 影响查询效率。此时可以只将字符串的一部分前缀,建 立索引,这样可以大大节约索引空间,从而提高索引效率。
语法: create index idx_xxxx on table_name(column(n)) ;
示例: 为tb_user表的email字段,建立长度为5的前缀索引。
create index idx_email_5 on tb_user(email(5));
单列索引:即一个索引只包含单个列。
联合索引:即一个索引包含了多个列。
在业务场景中,如果存在多个查询条件,考虑针对于查询字段建立索引时,建议建立联合索引, 而非单列索引。
码字不易,可以点个免费的赞!!