索引

索引是什么

索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分),它们包含着对数据表里所有记录的引用指针。

更通俗的说,数据库索引好比是一本书前面的目录,能加快数据库的查询速度


索引的目的

索引的目的在于提高查询效率,可以类比字典,如果要查“mysql”这个单词,我们肯定需要定位到m字母,然后从下往下找到y字母,再找到剩下的sql。如果没有索引,那么你可能需要把所有单词看一遍才能找到你想要的,如果我想找到m开头的单词呢?或者ze开头的单词呢?是不是觉得如果没有索引,这个事情根本无法完成?


索引的原理

除了词典,生活中随处可见索引的例子,如火车站的车次表、图书的目录等。它们的原理都是一样的,通过不断的缩小想要获得数据的范围来筛选出最终想要的结果,同时把随机的事件变成顺序的事件,也就是我们总是通过同一种查找方式来锁定数据。

数据库也是一样,但显然要复杂许多,因为不仅面临着等值查询,还有范围查询(>、<、between、in)、模糊查询(like)、并集查询(or)等等。数据库应该选择怎么样的方式来应对所有的问题呢?我们回想字典的例子,能不能把数据分成段,然后分段查询呢?最简单的如果1000条数据,1到100分成第一段,101到200分成第二段,201到300分成第三段……这样查第250条数据,只要找第三段就可以了,一下子去除了90%的无效数据。


索引的使用

查看索引

showindexfrom表名;

创建索引

如果指定字段是字符串,需要指定长度,建议长度与定义字段时的长度一致

字段类型如果不是字符串,可以不填写长度部分

createindex索引名称on表名(字段名称(长度))

删除索引

dropindex索引名称on表名;


索引demo

1. 创建测试表testindex

createtabletest_index(titlevarchar(10));

2. 使用python程序(ipython也可以)通过pymsql模块 向表中加入百万条数据

from pymysql import connect

def main():

# 创建Connection连接

conn = connect(host='localhost',port=3306,database='jing_dong',user='root',password='mysql',charset='utf8')

# 获得Cursor对象

cursor = conn.cursor()

# 插入10万次数据

for i in range(1000000):

cursor.execute("insertintotest_indexvalues('ha-%d')" % i)

# 提交数据

conn.commit()

if __name__ == "__main__":

main()

3. 查询

开启运行时间监测

setprofiling=1;

查找第1万条数据ha-99999

select*fromtest_indexwheretitle='ha-99999';

查看执行的时间:

showprofiles;

为表title_index的title列创建索引:

createindextitle_indexontest_index(title(10));

执行查询语句:

select*fromtest_indexwheretitle='ha-99999';

再次查看执行的时间

showprofiles;

注意:

要注意的是,建立太多的索引将会影响更新和插入的速度,因为它需要同样更新每个索引文件。对于一个经常需要更新和插入的表格,就没有必要为一个很少使用的where字句单独建立索引了,对于比较小的表,排序的开销不会很大,也没有必要建立另外的索引。

建立索引会占用磁盘空间


哪些情况需要创建索引

是否需要创建索引内容

哪些情况需要创建索引1、主键自动建立唯一索引

2、频繁作为查询条件的字段应该创建索引

3、查询中与其他表关联的字段,外键关系建立索引

4、频繁更新的字段不适合建立索引,因为每次更新不单单是更新了记录还会更新索引

5、WHERE条件里用不到的字段不创建索引

6、查询中排序的字段,排序的字段若通过索引去访问将大大提高排序速度

7、查询中统计或者分组字段

哪些情况不需要创建索引1、表记录太少

2、经常增删改的表

3、如果某个数据列包含许多重复内容,为它建立索引就没有太大的实际效果

你可能感兴趣的:(索引)