MyISAM索引实现
MyISAM索引文件和数据文件是分离的,索引文件的data域保存记录所在页的地址(物理存储位置),通过这些地址来读取页,进而读取被索引的行数据。
MyISAM的索引原理图如下,Col1为主键:
而对于二级索引,在 MyISAM存储引擎中以与上图同样的方式实现,也就是主索引和辅助索引在结构上没有任何区别,只是主索引要求key是唯一的,而辅助索引的key可以重复。
InnoDB索引实现
1、聚集索引
InnoDB存储引擎表是索引组织表,即按照主键的顺序存储数据。
与 MyISAM相同的一点是,InnoDB 也采用 B+Tree这种数据结构来实现 B-Tree索引。而很大的区别在于,InnoDB 存储引擎采用“聚集索引”的数据存储方式实现B-Tree索引,
聚集索引(clustered index)就是按照每张表的主键构造一棵B+树,树中的叶子节点存放着表中的行记录数据也就是数据行和相邻的键值紧凑地存储在一起。
下图为 InnoDB聚集索引原理图:
由此可看出InnoDB的数据文件本身要按主键聚集,因此在InnoDB中要求一张表必须有主键(而MyISAM引擎中可以没有),如果没有显式指定主键,MySQL会自动选择一个可以唯一标识数据记录的列作为主键。如果还 不存在这种列,则MySQL自动为InnoDB表生成一个长整型、长度为6个字节的隐含字段作为主键。
2、辅助索引
InnoDB对辅助索引采取的方式是在叶子页中保存主键值,通过这个主键值来回表查询到一条完整记录,所以按辅助索引检索实际上进行了二次查询,效率肯定是没有按照主键检索高的。下图是辅助索引的实现方式:
由于辅助索引包含主键索引,为了减小辅助索引所占空间,我们应该将 InnoDB 表中的主键索引尽量定义得小一些(MySIAM会使用前缀压缩技术使得索引变小,而InnoDB不会压缩索引)。
同时由于InnoDB数据文件本身是一棵B+Tree,非单调的主键会造成在插入新记录时数据文件为了维持B+Tree的特性而频繁的分裂调整,造成效率低下,而使用自增字段作为主键则是一个很好的选择。
总结:
InnoDB的数据文件本身就是主索引文件,而MyISAM的主索引和数据是分开的。
InnoDB的辅助索引data域存储相应记录主键的值而不是地址。而MyISAM的辅助索引和主索引没有多大区别。
innoDB是聚簇索引,数据存储在对应索引之下。