1.可以加快数据的检索速度(大大减少检索的数据量,这也是使用索引的主要原因)。
2.帮助服务器避免排序和临时表
3.将随机IO变为顺序IO
1.在经常需要搜索的列上创建,可以加快搜索速度。
2.在经常使用where子句中的列上面创建,加快条件的判断速度。
3.在经常需要排序的列上面创建,因为索引已经排序,这样可以直接使用索引的排序,加快排序查询时间。
4.对于中到大型表创建索引都是非常有效的,但对于超大型表创建索引成本较大,不建议使用。
5.在经常用在连接的列上创建索引,这些列一般都是外键,可以加快连接速度。
6.避免在where字句中对字段施加函数,这样会造成无法命中索引。
7.在使用innodb时使用与业务无关的自增主键作为主键,即逻辑主键,而不要使用业务主键。
8.最好将需要设置主键的列设置为NOT NULL,因为null需要更多的储存空间,而且某些运算null不能参与。
9.删除长期不使用的索引,不使用的索引会消耗不必要的性能,Mysql5.7可以通过查询sys库的chema_unused_indexes视图来查询长期未使用的索引。
哈希索引
1.对于哈希索引来说,底层的数据结构就是哈希表,因此在绝大多数需求为单条记录查询的时候,可以选择哈希索引,查询性能最快;其余场景建议使用BTree索引。
注:innodb不支持哈希索引
BTree索引
MyISAM与Innodb实现BTree索引的区别
MyISAM
1.B+Tree叶节点的data域存放的是数据记录的地址。在索引检索的时候,首先按照B+Tree搜索算法搜索索引,如果指定的key存在,则取出其data域的值,然后以data域的值为地址来读取相应的数据记录,这叫“非聚簇索引”。
Innodb
1.其数据文件本身就是索引文件。相比MyISAM,索引文件和数据文件是分离的,其表数据文件本身就是按照B+Tree组织的一个索引结构,树的叶节点data域保存了完整的数据记录。这个索引的key是数据表的主键,因此Innodb表数据文件本身就是主索引。这被称为聚簇索引(或聚集索引),而其余索引都作为辅助索引,辅助索引的data域储存相应记录的主键值而不是地址值,这也是和MyISAM不同的地方。在根据主索引搜索时,直接找到key所在的节点即可取出数据;在根据辅助索引查找时,则需要先取出主键的值,再走一遍主索引。因此设计表时不建议使用过长的字段作为主键,也不建议只用非单调的字段作为主键,这样会造成主索引频繁分裂。
覆盖索引
什么是覆盖索引
如果一个索引包含或者覆盖所有需要查询字段的值,那我们就称之为"覆盖索引",我们知道Innodb储存引擎中,如果不是主键索引,叶子节点储存的是主键+列值。最终还是要"回表",也就是要通过主键再查找一次。这样就会比较慢,覆盖索引就是把要查询出的列和索引是对应的,不做回表操作。
覆盖索引的使用
如创建一个索引(name,age),执行以下sql语句:
select name , age from tablename where name = ‘java’ and age = 20;
在查询时要查询的列在叶子节点都存在,所以不用做回表操作。
选择索引和编写应依照索引查询的三个原则
1.单行访问是很慢的。特别实在机械硬盘储存中(SSD的随机I/O要快很多,不过这一点仍然成立)。如果服务器读取一个数据块只是为了获取其中一行,那么就浪费了很多工作。最好读取的块中能包含尽可能多所需要的数据行。使用索引就可以创建位置引,用以提升效率。
2.顺序访问范围数据是很快的,这有两个原因,第一:顺序I/O不需要多次磁盘寻道,所以要比随机I/O快很多(特别是对机械硬盘),第二:如果服务器能够按需要顺序读取数据,那就不需要额外的排序操作,并且groupby查询也无需再做排序和将行按组进行聚合计算了。
3.覆盖索引查询是很快的。如果一个索引包含了查询需要的所有列,那么存储引擎就不需要再做回表查找行了。这样避免了大量的单行访问,上面第一条已经写明了单行访问是很慢的。
关于索引补充
最左前缀
mysql中可以以一定顺序引用多列,这种索引叫做联合索引,如User表中name与age,加联合索引就是(name,age),而最左前缀索引指的是,如果查询时查询条件精确的匹配索引左边的一列或连续几列,则此列就可以被用到,如下:
select * from user where name = ‘java’ and age = 20 ; //可以命中索引
select * from user where name = ‘java’; //可以命中索引
select * from user where age = 20; //不可以命中索引
这里需要注意的是如果查询时两个索引条件都用上了,但顺序不同,查询引擎会自动优化为匹配联合索引的顺序,是可以命中索引的。
由于最左前缀索引的原则,在创建联合索引时,索引字段的顺序需要考虑字段值去重后的个数,较多的放前面,order by字句也遵循此原则。
注意避免冗余索引
冗余索引指的是索引功能相同,能够命中就肯定能命中,那么就是冗余索引,如(name,age)和name这两个索引就是冗余索引,能够命中后者的查询肯定能命中前者,在大多数情况下都应该扩展已有的索引而不是重新创建索引。
通过sql语句为表字段创建索引
1.主键索引(PRIMARY KEY):
alter table ‘tablename’ primary key (‘column’);
2.唯一索引(UNIQUE):
alter table ‘tablename’ unique (‘column’);
3.普通索引(INDEX):
alter table ‘tablename’ index (‘column’);
4.全文索引 (FULLTEXT):
alter table ‘tablename’ fulltext (‘column’);
5.多列索引:
alter talbe ‘tablename’ index (‘column1’,‘column2’,‘column3’);