Mysql 索引学习总结

是什么

索引(Index)是帮助mysql高效获取数据的数据结构。

本质:数据结构,可以理解为排好序的快速查找数据结构

在数据之外,数据库还维护着满足特定查找的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查询算法,这样的数据结构就是索引。

一般来说,索引本身也很大,不可能全部存储在内存中,因此索引往往以文件形式存储在硬盘上。

优势

  • 提高数据库索引效率,减低数据库的IO成本
  • 减低数据库排序的成本,减低CPU的消耗

劣势

  • 创建索引和维护索引要耗费时间

  • 索引也是一张表也会占用一定的空间

  • 会降低更新表的速度,如对表的INSERT、UPDATE、DELETE等。

因为更新表时,mysql不仅要保存数据,还要保存索引文件每次更新索引列的字段。

类型

我们平时说的索引,如果没有特别指明,都是指B树结构组织的索引。其中聚集索引、次要索引、覆盖索引、复合索引、前缀索引、唯一索引默认都是用B+树索引,简称索引。除了B+树外类似索引外,还有哈希索引等等

创建索引方式

1、直接创建

CREATE INDEX [index_name] ON table(column(length))

2、修改表结构创建

ALTER TABLE table_name ADD INDEX index_name ON (column(length))

3、创建表的时候创建

CREATE TABLE `table` (
    `id` int(11) NOT NULL AUTO_INCREMENT ,
    `name` char(255) CHARACTER NOT NULL ,
    PRIMARY KEY (`id`),
    INDEX index_name (name(length))
)
  • 查询索引
show index from table_name
  • 删除索引
DROP INDEX [index_name] ON table

普通索引

即一个索引只包含单个列,一个表可以有多个单列索引

CREATE INDEX [index_name] ON table(column(length))

如果char,varchar类型,length可以小于字段实际长度;如果是BLOB和TEXT类型,必须指定长度。

唯一索引

索引列的指必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一。

CREATE UNIQUE INDEX indexName ON table(column(length))

主键索引

一种特殊的唯一索引,一个表只能有一个主键,不允许有空值,一般是在建表的时候同时创建主键索引

CREATE TABLE `table` (
    `id` int(11) NOT NULL AUTO_INCREMENT ,
    `title` char(255) NOT NULL ,
    PRIMARY KEY (`id`)
);

组合索引

即一个索引包含多个列,只有在查询条件中使用了创建索引的第一个字段,索引才会被使用。使用组合索引时遵循最左前缀集合

ALTER TABLE `table` ADD INDEX [index_name] (name,city,age); 

全文索引

主要用来查找文本中的关键字,而不是直接与索引中的值相比较。fulltext索引跟其它索引大不相同,它更像是一个搜索引擎,而不是简单的where语句的参数匹配。fulltext索引配合match against操作使用,而不是一般的where语句加like。它可以在create table,alter table ,create index使用,不过目前只有char、varchar,text 列上可以创建全文索引。值得一提的是,在数据量较大时候,现将数据放入一个没有全局索引的表中,然后再用CREATE index创建fulltext索引,要比先为一张表建立fulltext然后再将数据写入的速度快很多。

CREATE FULLTEXT INDEX [index_name] ON table(column)

索引结构

btree

在myisam里的形式和innodb稍有不同

在innodb里面有两种形态:其一是primary key形态其leafnode里存放的是数据.而且不仅存放了索引键的数据,还存放了其他字段的数据.其二是secondary index,其leafnode和普通的b-tree差不多,只是还存放了指向主键的信息. 而在myisam里,主键和其他的并没有太大区别.不过和innodb不太一样的地方是,在myisam里,leaf node里存放的不是主键的信息,存的是指向数据文件里的对应数据行的信息.

hash

  • 仅仅能满足"=","IN"和"<=>"查询,不能使用范围查询
  • 其检索效率非常高,索引的检索可以一次定位,不像B-Tree 索引需要从根节点到枝节点,最后才能访问到页节点这样多次的IO访问,所以 Hash 索引的查询效率要远高于 B-Tree 索引
  • 只有memory和ndb cluster支持这种索引

full-text

full-text在mysql里仅有myisam支持它,而且支持full-text的字段只有char,varchar,以及text数据类型,full-text主要是用来代替like "%***%"效率低下的问题的.

R-Tree

r-tree在mysql很少使用,仅支持geometry数据类型,支持该类型的存储引擎只有myisam,bdb,innodb,ndb,archive几种.相对于b-tree,r-tree的优势在于范围查找.

默认排序

数字索引:默认升序排序

文字索引:根据ASCII,汉子的机内码

那些情况需要建立索引

  • 主键自动建立唯一索引
  • 频繁作为查询条件的字段应该创建索引
  • 查询中与其他表关联的字段,外键关系建立索引
  • 高并发下倾向创建组合索引
  • 查询中排列的字段
  • 查询统计或分组的字段

那些情况不要创建索引

  • 表记录太少
  • 频繁更新的字段不适合建立索引
  • where条件里用不到的字段不适合建立索引
  • 数据列中包含很多重复的内容。

注意事项

  • 使用短索引

对串列进行索引,如果可能应该指定一个前缀长度。例如,如果有一个char(255)的列,如果在前10个或20个字符内,多数值是惟一的,那么就不要对整个列进行索引。短索引不仅可以提高查询速度而且可以节省磁盘空间和I/O操作

  • 索引列排序

查询只使用一个索引,因此如果where子句中已经使用了索引的话,那么order by中的列是不会使用索引的。因此数据库默认排序可以符合要求的情况下不要使用排序操作;尽量不要包含多个列的排序,如果需要最好给这些列创建复合索引。

  • like语句操作

一般情况下不推荐使用like操作,如果非使用不可,如何使用也是一个问题。like “%aaa%” 不会使用索引而like “aaa%”可以使用索引。

  • 不要在列上进行运算

这将导致索引失效而进行全表扫描,例如

SELECT * FROM table_name WHERE YEAR(column_name)<2017;
  • 不使用not in和<>操作

你可能感兴趣的:(Mysql 索引学习总结)