这里我拿邮箱举例
查询邮箱sql
mysql> select f1, f2 from SUser where email='xxx';
如果这个邮箱字段没有索引,那么这个语句只能做全表扫描,所以我们需要给这个语句创建索引,给这个字符串类型创建索引的方式有俩个,一个是直接创建普通索引,一个是前缀索引。
前缀索引:可以定义字符串的一部分作为索引,占用空间会变小,但是可能会增加额外的扫描次数。
普通索引:mysql> alter table SUser add index index1(email);
前缀索引:mysql> alter table SUser add index index2(email(6));
查询语句:
select id,name,email from SUser where email='[email protected]';
如果使用的是index1,首先遍历通过普通索引的值找到第一个满足条件的主键,将这条记录计入结果集,然后查找下一条记录,发现不符合 email='[email protected]的条件,然后结果集到主键索引树直接找到数据。
如果使用的是index2,首先从index2的索引树找到满足索引值是"zhangs"的记录,找到的第一个满足条件的值,然后回表判断是否满足email='[email protected]的条件,如果不满足在刚才index2树的位置查找下一条记录,直到查找在index2上取到的值不是zhangs的时候,循环结束。
**综上:**使用前缀索引的话,增加了太多的查询成本,所以在使用前缀索引的时候,需要定义好长度,这样可以节省空间和访问磁盘次数。
注意:在使用前缀索引的时候是用不到覆盖索引对查询性能的优化的,因为系统并不确认前缀索引截取的定义是否完整。
补充:如果非常想用前缀索引,可以根据实际情况使用倒序存储,创建hash字段索引的方式
1 直接创建索引,这样比较占用空间;
2 创建前缀索引,节省空间,但会增加查询扫描,并且不能使用覆盖索引;
3 倒叙存储,再创建前缀索引,用于绕过字符串本身前缀区分度不够的问题;
4 创建hash字段索引,查询新能稳定,有额外的存储和计算消耗,不支持范围扫描。