MySql性能(6)—索引优化(前缀索引)

在《阿里巴巴开发手册》第5章MySQL数据库的索引规约中,是这样描述的:

MySql性能(6)—索引优化(前缀索引)_第1张图片
索引规范.png

1. 什么是前缀索引

在《高性能mysql第三版中》第五章5.3.2前缀索引是这样描述的:

有时候需要索引很长的字符串,这会让索引变得大且慢,通常可以索引开始的部分字符,这样可以大大节约索引空间,从而提高索引效率。但是也会降低索引的选择性。

索引的选择性是指,不重复的索引值(也称为基数)和数据表的记录总数(#T)的比值,范围从1/#T到1之间。索引的选择性越高则查询效率越高,因为选择性高的索引可以让MySQL在查找时过滤掉更多的行。唯一索引的选择性是1,这是最好的索引选择性,性能也是最好的。

一般情况下某个列的前缀选择性也是足够高的,足以满足查询性能。对于BLOB、TEXT或者很长的VARCHAR类型的列,必须使用前缀索引,因为MySQL不允许索引这些列的完整长度。

诀窍在于要选择足够长的前缀以保证比较高的选择性,同时又不能太长(以便节约空间)。前缀应该最够长,以使得前缀索引的选择性接近于索引整个列(即列不能太长,并且选择性不能太低)。

2. 如何确定前缀长度

为了决定前缀的合适长度,我们需要查询前缀值出现的频率。

MySql性能(6)—索引优化(前缀索引)_第2张图片
以city分组,获取数据.png

注意到,上面每个值都出现了45-65次。现在查找到最频繁出现的城市前缀,先从3个前缀字母开始。

MySql性能(6)—索引优化(前缀索引)_第3张图片
image.png

每个前缀都比原来的城市出现的次数更多,因此唯一前缀比唯一城市要少得多,然后我们增加前缀长度,直到这个前缀的选择性接近完整列的选择性,经过实验后出现前缀为7时比较合适。

MySql性能(6)—索引优化(前缀索引)_第4张图片
image.png

计算合适的前缀长度的另一个办法就是计算完整列的选择性,并使前缀的选择性接近于完整列的选择性。

请注意:若是唯一索引的选择性是1,这是最好的索引选择性,性能也是最好的。

MySql性能(6)—索引优化(前缀索引)_第5张图片
image.png
MySql性能(6)—索引优化(前缀索引)_第6张图片
唯一索引的选择性为1.png

通常来说(尽管也有例外情况),这个例子中如果索引的选择性能够接近0.031,基本上就可用了。可以在一个查询中针对不同前缀长度进行计算。这对于大表非常有用。

MySql性能(6)—索引优化(前缀索引)_第7张图片
选择不同的前缀长度计算选择性.png

查询显示当前缀长度到达7的时候,在增加前缀长度,选择性提升的幅度很少。

只看平均选择性是不够的,也有例外的情况。需要考虑最坏的情况下的选择性。平均选择性会让你以为前缀长度为4或者5的索引已经足够,但如果数据分布很不均匀,可能会有陷阱。

MySql性能(6)—索引优化(前缀索引)_第8张图片
平均选择性存在的陷阱.png

3. 如何创建前缀索引

前缀索引.png

前缀索引是一个能使索引更小、更快的有效办法,但另一方面也有缺点:mysql无法使用前缀索引做ORDER BY和GROUP BY,也无法使用前缀索引做覆盖扫描。

4. 前缀索引优化场景

前缀索引的一个场景是:针对很长的十六进制唯一ID使用前缀索引。如果采用长度为8的前缀索引通常能显著提升性能,并且这种方法对上层应用完全透明。

若索引字段为UUID,若使用前缀索引进行优化,下列为测试数据Mysql使用Java UUID作为唯一值时使用前缀索引测试

历史文章

mybatis&&数据库优化&&缓存目录
JAVA && Spring && SpringBoot2.x — 学习目录

你可能感兴趣的:(MySql性能(6)—索引优化(前缀索引))