Mysql数据库提供两种类型的索引,如果没正确设置,索引的利用效率会大打折扣。
CREATE TABLE test ( id INT NOT NULL, last_name CHAR(30) NOT NULL, first_name CHAR(30) NOT NULL, PRIMARY KEY (id), INDEX name (last_name,first_name) );
以上创建的其实是一个多列索引,创建列索引的代码如下:
CREATE TABLE test ( id INT NOT NULL, last_name CHAR(30) NOT NULL, first_name CHAR(30) NOT NULL, PRIMARY KEY (id), INDEX name (last_name), INDEX_2 name (first_name) );
一个多列索引可以认为是包含通过合并(concatenate)索引列值创建的值的一个排序数组。 当查询语句的条件中包含last_name 和 first_name时,例如:
SELECT * FROM test WHERE last_name='Kun' AND first_name='Li';
sql会先过滤出last_name符合条件的记录,在其基础上在过滤first_name符合条件的记录。那如果我们分别在last_name和first_name上创建两个列索引,
mysql的处理方式就不一样了,它会选择一个最严格的索引((获得结果集记录数最少))来进行检索,可以理解为检索能力最强的那个索引来检索,
另外一个利用不上了,这样效果就不如多列索引了。
但是多列索引的利用也是需要条件的,如果不是按照索引最左边列 "last name" 开始查找,则无法使用索引。
例如:以下形式的查询语句能够利用上多列索引:
SELECT * FROM test WHERE last_name='Widenius'; SELECT * FROM test WHERE last_name='Widenius' AND first_name='Michael'; SELECT * FROM test WHERE last_name='Widenius' AND (first_name='Michael' OR first_name='Monty'); SELECT * FROM test WHERE last_name='Widenius' AND first_name >='M' AND first_name < 'N';
但是以下形式的查询语句利用不上多列索引(因为查询里有不以最左列last name 开始条件)
SELECT * FROM test WHERE first_name='Michael'; SELECT * FROM test WHERE last_name='Widenius' OR first_name='Michael';
多列建索引比对每个列分别建索引更有优势,因为索引建立得越多就越占磁盘空间,在更新数据的时候速度会更慢。
另外建立多列索引时,顺序也是需要注意的,应该将严格的索引放在前面,这样筛选的力度会更大,效率更高。
多列建索引有最左前缀(Leftmost Prefixing)的原则。下面说说这个原则。
现在我们有一个firstname、lastname、age列上的多列索引,我们称这个索引为fname_lname_age。当搜索条件是以下各种列的组合时,
MySQL将使用fname_lname_age索引:
firstname,lastname,age
firstname,lastname
firstname
从另一方面理解,它相当于我们创建了(firstname,lastname,age)、(firstname,lastname)以及(firstname)这些列组合上的索引。
下面这些查询都能够使用这个fname_lname_age索引:
Select peopleid FROM people Where firstname='Mike' AND lastname='Sullivan' AND age='17';
Select peopleid FROM people Where firstname='Mike' AND lastname='Sullivan';
Select peopleid FROM people Where firstname='Mike';
下面这些查询不能够使用这个fname_lname_age索引:
如何去建立一个多列索引,最重要的一个问题是如何安排列的顺序是至关重要的,
总规则可以说是cardinality越大的字段应该排在索引的第一位。cardinality就是该列如果作为索引键来建立索引,而产生的不重复索引值个数。
重复索引值个数越高,就越该作为多列索引中的最左边的索引列。因为它可以让mysql过滤掉更多的行数。
另外,如果选择为索引的字段是字符串,比如varchar, text, blob,则可以使用前缀索引:即用该字段的前面多少位,而不是全字段来作为索引(可以用explain 命令
来看看用这两者来分组得到的不同记录数是否接近,越接近越好)。
可以用下面的explain 语句去查看用到了哪些index,还有就是得到了多少条记录数,这样可以优化索引。
mysql> explain select product_id from orders where order_id in (123, 312, 223, 132, 224) \G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: orders
type: range
possible_keys: orderid_productid
key: orderid_productid
key_len: 5
ref: NULL
rows: 5
Extra: Using where; Using index
1 row in set (0.00 sec)