索引

概念

索引是一种特殊的文件,包含着对数据表里所有记录的引用指针。数据库索引好比是一本书前面的目录,能加快数据库的查询速度。

类型

(1)普通索引
(2)唯一索引
(3)全文索引(FULLTEXT)
(4)单列索引、多列索引
(5)组合索引(最左前缀)

普通索引

1、直接创建索引
语句:CREATE INDEX index_name ON table(column(length))
2、修改表结构的方式添加索引
语句:ALTER TABLE table_name ADD INDEX index_name (column(length))
3、创建表的时候同时创建索引
语句:CREATE TABLE table_name (···,INDEX index_name (title(length)))
4、删除索引
语句:DROP INDEX index_name ON table

唯一索引

索引列的值必须唯一,但允许有空值(注意和主键不同)。
1、创建唯一索引
语句:CREATE UNIQUE INDEX indexName ON table(column(length))
2、修改表结构的方式添加唯一索引
语句:ALTER TABLE table_name ADD UNIQUE indexName (column(length))
3、创建表的时候添加唯一索引
语句:CREATE TABLE table_name (···,UNIQUE indexName (title(length)))

全文索引(FULLTEXT)

全文索引仅可用于MyISAM 表,可以从CHAR、VARCHAR或TEXT列中作为CREATE TABLE语句的一部分被创建,或是随后使用ALTER TABLE 或CREATE INDEX被添加。对于大容量的数据表,生成全文索引是一个非常消耗时间非常消耗硬盘空间的做法。
1、创建全文索引
语句:CREATE FULLTEXT INDEX index_content ON tablename (content)
2、修改表结构添加全文索引
语句:ALTER TABLE table_name ADD FULLTEXT index_content(content)
3、创建表时添加全文索引
语句:CREATE TABLE table_name (···,FULLTEXT (content))

单列索引、多列索引

多个单列索引与单个多列索引的查询效果不同,因为执行查询时,MySQL只能使用一个索引,会从多个索引中选择一个限制最为严格的索引。

组合索引(最左前缀)

平时用的SQL查询语句一般都有比较多的限制条件,所以为了进一步榨取MySQL的效率,就要建立一个组合索引:
语句:ALTER TABLE table_name ADD INDEX index_name (column1(length),column2(length))。
建立这样的组合索引,其实是相当于分别建立了下面两组组合索引:
–(column1,column2)和–column1。并不是只要包含这两列的查询都会用到该组合索引;
例如:
使用到上面的索引
SELECT * FROM table_name WHERE column1=··· AND column2=···;
SELECT * FROM table_name WHERE column1=···;
不使用上面的索引
SELECT * FROM table_name WHERE column2=···;
SELECT * FROM table_name WHERE column1=··· OR column2=···;
!注:column1就是最左前缀,只有限制条件从column1开始筛选的索引才有效。

索引优化

1、索引不会包含有NULL值的列
只要列中包含有NULL值都将不会被包含在索引中,组合索引中只要有一列含有NULL值,那么这一列对于此组合索引就是无效的。所以我们在数据库设计时不要让字段的默认值为NULL。
2、使用短索引
对串列进行索引,如果可能应该指定一个前缀长度。短索引不仅可以提高查询速度而且可以节省磁盘空间和I/O操作。
3、索引列排序
MySQL查询只使用一个索引,因此如果where子句中已经使用了索引的话,那么order by中的列是不会使用索引的。
4、like语句操作
like “%aaa%”不会使用索引而like “aaa%”可以使用索引。
5、不要在列上进行运算
这将导致索引失效而进行全表扫描
注:MySQL只对以下操作符才使用索引:<,<=,=,>,>=,between,in,以及某些时候的like(不以通配符%或_开头的情形)。

EXPLAIN

1、作用:用于分析索引查询结果
2、用法:EXPLAIN sql语句
3、执行结果各字段的含义:
(1)id:select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序。
三种情况:
id相同——执行顺序由上至下;
id不同——如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行;
id相同、不同同时存在——id相同的是一组,组内从上往下执行,组外id值越大越先执行。
(2)select_type
SIMPLE——简单查询,查询中不包含子查询或者UNION
PRIMARY——查询中若包含任何复杂的子部分,最外层查询则被标记为PRIMARY
SUBQUERY——在SELECT或WHERE中包含了子查询
DERIVED——在FROM中包含的子查询被标记为DERIVED(衍生),MySQL会递归执行这些子查询,把结果放在临时表中
UNION——若第二个SELECT出现在UNION之后,则被标记为UNION:若UNION包含在FROM子句的子查询中,外层SELECT将被标记为:DERIVED
UNION RESULT——从UNION表获取结果的SELECT
(3)table:当前执行的表
(4)type:连接操作的类型
system——表只有一行记录(等于系统表),这是const类型的特例,平时不会出现,可以忽略不计
const——表示通过索引一次就找到了,const用于比较primary key 或者unique索引。因为只匹配一行数据,所以很快。如将主键置于where列表中,MySQL就能将该查询转换为一个常量。
eq_ref——唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描
ref——非唯一性索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以它应该属于查找和扫描的混合体。
range——只检索给定范围的行,使用一个索引来选择行,key列显示使用了哪个索引,一般就是在你的where语句中出现between、< 、>、in等的查询,这种范围扫描索引比全表扫描要好,因为它只需要开始于索引的某一点,而结束于另一点,不用扫描全部索引。
index——Full Index Scan,Index与All区别为index类型只遍历索引树。这通常比ALL快,因为索引文件通常比数据文件小。(也就是说虽然all和Index都是读全表,但index是从索引中读取的,而all是从硬盘读取的)
all——Full Table Scan 将遍历全表以找到匹配的行。
!类型从好到查:system > const > eq_ref > ref > range > index > all
(5)possible_keys:显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用。
(6)key:实际使用的索引,如果为NULL,则没有使用索引。查询中若使用了覆盖索引(select 后要查询的字段刚好和创建的索引字段完全相同),则该索引仅出现在key列表中。
(7)key_len:表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度,在不损失精确性的情况下,长度越短越好。key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的。
(8)ref:显示的是列的名字(或单词“const”),MySQL将根据这些列来选择行。哪些列或常量被用于查找索引列上的值。
(9)rows:根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数,也就是说,用的越少越好。
(10)Extra:包含不适合在其他列中显示但十分重要的额外信息。
Using filesort——说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序”;
Using temporary——使用了用临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询group by;
Using index——表示相应的select操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效率不错;
!注:如果同时出现using where,表明索引被用来执行索引键值的查找;如果没有同时出现using where,表明索引用来读取数据而非执行查找动作。
Using where——表明使用了where过滤;
Using join buffer——表明使用了连接缓存,比如说在查询的时候,多表join的次数非常多,那么将配置文件中的缓冲区的join buffer调大一些;
impossible where——where子句的值总是false,不能用来获取任何元组;
select tables optimized away——在没有GROUP BY子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化;
distinct——优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作。

你可能感兴趣的:(索引)