索引

索引是什么

索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分)，它们包含着对数据表里所有记录的引用指针。

更通俗的说，数据库索引好比是一本书前面的目录，能加快数据库的查询速度

索引的目的

索引的目的在于提高查询效率，可以类比字典，如果要查“mysql”这个单词，我们肯定需要定位到m字母，然后从下往下找到y字母，再找到剩下的sql。如果没有索引，那么你可能需要把所有单词看一遍才能找到你想要的，如果我想找到m开头的单词呢？或者ze开头的单词呢？是不是觉得如果没有索引，这个事情根本无法完成？

索引的原理

除了词典，生活中随处可见索引的例子，如火车站的车次表、图书的目录等。它们的原理都是一样的，通过不断的缩小想要获得数据的范围来筛选出最终想要的结果，同时把随机的事件变成顺序的事件，也就是我们总是通过同一种查找方式来锁定数据。

数据库也是一样，但显然要复杂许多，因为不仅面临着等值查询，还有范围查询(>、<、between、in)、模糊查询(like)、并集查询(or)等等。数据库应该选择怎么样的方式来应对所有的问题呢？我们回想字典的例子，能不能把数据分成段，然后分段查询呢？最简单的如果1000条数据，1到100分成第一段，101到200分成第二段，201到300分成第三段……这样查第250条数据，只要找第三段就可以了，一下子去除了90%的无效数据。

索引的使用

查看索引

showindexfrom表名;

创建索引

如果指定字段是字符串，需要指定长度，建议长度与定义字段时的长度一致

字段类型如果不是字符串，可以不填写长度部分

createindex索引名称on表名(字段名称(长度))

删除索引

dropindex索引名称on表名;

索引demo

1. 创建测试表testindex

createtabletest_index(titlevarchar(10));

2. 使用python程序（ipython也可以）通过pymsql模块向表中加入百万条数据

from pymysql import connect

def main():

# 创建Connection连接

conn = connect(host='localhost',port=3306,database='jing_dong',user='root',password='mysql',charset='utf8')

# 获得Cursor对象

cursor = conn.cursor()

# 插入10万次数据

for i in range(1000000):

cursor.execute("insertintotest_indexvalues('ha-%d')" % i)

# 提交数据

conn.commit()

if __name__ == "__main__":

main()

3. 查询

开启运行时间监测

setprofiling=1;

查找第1万条数据ha-99999

select*fromtest_indexwheretitle='ha-99999';

查看执行的时间：

showprofiles;

为表title_index的title列创建索引：

createindextitle_indexontest_index(title(10));

执行查询语句：

select*fromtest_indexwheretitle='ha-99999';

再次查看执行的时间

showprofiles;

注意：

要注意的是，建立太多的索引将会影响更新和插入的速度，因为它需要同样更新每个索引文件。对于一个经常需要更新和插入的表格，就没有必要为一个很少使用的where字句单独建立索引了，对于比较小的表，排序的开销不会很大，也没有必要建立另外的索引。

建立索引会占用磁盘空间

哪些情况需要创建索引

是否需要创建索引内容

哪些情况需要创建索引1、主键自动建立唯一索引

2、频繁作为查询条件的字段应该创建索引

3、查询中与其他表关联的字段,外键关系建立索引

4、频繁更新的字段不适合建立索引,因为每次更新不单单是更新了记录还会更新索引

5、WHERE条件里用不到的字段不创建索引

6、查询中排序的字段,排序的字段若通过索引去访问将大大提高排序速度

7、查询中统计或者分组字段

哪些情况不需要创建索引1、表记录太少

2、经常增删改的表

3、如果某个数据列包含许多重复内容,为它建立索引就没有太大的实际效果

索引

你可能感兴趣的:(索引)