InnoDB表通过CREATE TABLE...ENGINE=InnoDB
语句创建,当InnoDB被定义为默认存储引擎时,不需要ENGINE=InnoDB
子句。每个表中的数据被分成几页,页中存储着插入表中的数据行,组成每个表的页排列在称为B+树索引的树状数据结构中。因此,在InnoDB中,索引是用于保存表数据(页)的树形数据结构(B+树)。
表示整个表的B+树索引称为聚集索引,它是根据主键列组织的。聚集索引叶子结点包含表的所有页。通常,聚集索引与主键是同义词,建议为创建的每个表定义一个主键。选择主键列时,请选择具有以下特征的列:
NULL
的列InnoDB选取聚集索引的规则如下:
PRIMARY KEY
时,InnoDB使用它作为聚集索引。PRIMARY KEY
, InnoDB使用第一个UNIQUE NOT NULL
列作为集群索引。DB_TRX_ID
、DB_ROLL_PTR
和DB_ROW_ID
,其中DB_ROW_ID
的值会随着行的插入而单调增加。如果一个表没有PRIMARY KEY
或合适的UNIQUE
索引,InnoDB会在DB_ROW_ID
列上生成一个隐藏的聚集索引GEN_CLUST_INDEX
。聚集索引以外的索引称为二级索引。在InnoDB中,二级索引中的每条记录都包含该行的主键列,以及二级索引指定的列。InnoDB使用这个主键值来搜索聚集索引中的行。
可以使用以下两种方式创建索引:
CREATE TABELE
:通常,在使用CREATE TABELE
创建表本身时创建表上的所有索引。这个原则对于InnoDB表尤其重要,因为主键决定了数据文件中行的物理布局。CREATE TABLE [IF NOT EXISTS] tbl_name
(create_definition,...)
CREATE TABLE [IF NOT EXISTS] tbl_name
[(create_definition,...)]
[IGNORE | REPLACE]
[AS] query_expression
CREATE TABLE [IF NOT EXISTS] tbl_name
{ LIKE old_tbl_name | (LIKE old_tbl_name) }
create_definition: {
col_name column_definition
| {INDEX} [index_name] (key_part,...)
| [CONSTRAINT [symbol]] PRIMARY KEY (key_part,...)
| [CONSTRAINT [symbol]] UNIQUE [KEY] [index_name] (key_part,...)
| [CONSTRAINT [symbol]] FOREIGN KEY
[index_name] (col_name,...)
reference_definition
| check_constraint_definition
}
column_definition: {
data_type [NOT NULL | NULL] [DEFAULT {literal | (expr)} ]
[VISIBLE | INVISIBLE]
[AUTO_INCREMENT] [UNIQUE [KEY]] [[PRIMARY] KEY]
[COMMENT 'string']
[reference_definition]
[check_constraint_definition]
| data_type
[GENERATED ALWAYS] AS (expr)
[VIRTUAL | STORED] [NOT NULL | NULL]
[VISIBLE | INVISIBLE]
[UNIQUE [KEY]] [[PRIMARY] KEY]
[COMMENT 'string']
[reference_definition]
[check_constraint_definition]
}
key_part: {col_name [(length)] | (expr)} [ASC | DESC]
CREATE INDEX
语:CREATE INDEX
允许您向现有表添加索引。CREATE INDEX
被映射到ALTER TABLE
语句来创建索引。但CREATE INDEX
不能用于创建主键,即聚集索引。CREATE [UNIQUE] INDEX index_name
ON tbl_name (key_part,...)
key_part: {col_name [(length)] | (expr)} [ASC | DESC]
(key_part1, key_part2,…)
的索引规范用于创建多列或单列索引,例如,(col1, col2, col3)
指定一个多列索引,索引键由col1
、col2
和col3
的值组成。key_part
规范可以以ASC
或DESC
结尾,以指定索引值是按升序还是降序存储。如果没有给出顺序说明符,默认为升序。对于字符串列,可以创建仅使用列值前导部分的索引,使用col_name(length)
语法指定索引前缀长度:
CHAR
、VARCHAR
、BINARY
和VARBINARY
关键部分指定前缀。BLOB
和TEXT
键部分指定前缀。CREATE TABLE
、ALTER TABLE
和CREATE INDEX
语句中,索引规范的前缀长度被解释为非二进制字符串类型的字符数和二进制字符串类型的字节数。在为使用多字节字符集的非二进制字符串列指定前缀长度时,请考虑到这一点。MySQL 8.0.13及更高版本支持索引表达式值而不是列或列前缀值的功能键部分。使用功能键部件可以对不直接存储在表中的值建立索引。例子:
CREATE TABLE t1 (col1 INT, col2 INT, INDEX func_index ((ABS(col1))));
CREATE INDEX idx1 ON t1 ((col1 + col2));
CREATE INDEX idx2 ON t1 ((col1 + col2), (col1 - col2), col1);
ALTER TABLE t1 ADD INDEX ((col1 * 40) DESC);
功能关键部件必须遵循以下规则。如果关键部件定义包含不允许的构造,则会发生错误。
SUBSTRING()
函数,并且在查询时必须包含相同的SUBSTRING()
函数才能使用该索引,下面的例子中只有第二个查询才能使用索引:CREATE TABLE tbl (
col1 LONGTEXT,
INDEX idx1 ((SUBSTRING(col1, 1, 10)))
);
SELECT * FROM tbl WHERE SUBSTRING(col1, 1, 9) = '123456789';
SELECT * FROM tbl WHERE SUBSTRING(col1, 1, 10) = '1234567890';
表达式索引是通过隐藏列实现的,隐藏列本身不需要存储空间。
UNIQUE
索引创建了一个约束,使得索引中的所有值必须是不同的。如果尝试添加具有与现有行匹配的键值的新行,则会发生错误。如果为UNIQUE
索引中的列指定前缀值,则列值在前缀长度内必须是唯一的。UNIQUE
索引允许包含NULL
的列有多个NULL
值。
提高SELECT
操作性能的最佳方法是在查询中测试的一个或多个列上创建索引。索引项的作用类似于指向表行的指针,允许查询快速确定哪些行与WHERE
子句中的条件匹配,并检索这些行的其他列值。所有MySQL数据类型都可以被索引。虽然为查询中可能使用的每个列创建索引很诱人,但是不必要的索引会浪费MySQL确定使用哪些索引的空间和时间。索引还会增加插入、更新和删除的成本,因为每个索引都必须更新。您必须找到适当的平衡,以使用最优索引集实现快速查询。
索引用于快速查找具有特定列值的行。如果没有索引,MySQL必须从第一行开始,然后遍历整个表以找到相关的行。表越大,成本就越高。如果表中有相关列的索引,MySQL可以快速确定在数据文件中间查找的位置,而不必查看所有数据。这比按顺序读取每一行要快得多。MySQL使用索引进行以下操作:
WHERE
子句匹配的行。(col1, col2, col3)
上有一个三列索引,则在(col1)
、(col1, col2)
和(col1, col2, col3)
上有索引搜索功能。VARCHAR
和CHAR
声明为相同的大小,则认为它们是相同的。MIN()
或MAX()
函数查找多列索引某索引列key_col
时,如果在WHERE
子句中使用了该多列索引key_col
左前缀索引列时,MySQL将对每个MIN()
或MAX()
表达式进行单个键查找,并用常量替换它。如果所有表达式都用常量替换,则查询立即返回。例如:SELECT MIN(key_part2),MAX(key_part2)
FROM tbl_name WHERE key_part1=10;
SELECT key_part3 FROM tbl_name
WHERE key_part1=1
索引对于小表或查询大部分或所有行的大表上的查询不太重要。当查询需要访问大多数行时,顺序读取比通过索引处理要快。
上文MySQL是怎样使用索引的中蕴含着许多索引优化措施,除此之外还有以下措施:
PRIMARY KEY
短,以减少二级索引的存储开销。每个二级索引项包含对应行的主键列的副本。PRIMARY KEY
,然后是所有UNIQUE
索引,然后是非唯一索引。这有助于MySQL优化器优先考虑使用哪个索引,也可以更快地检测重复的UNIQUE
键。