SQL 语句性能优化策略

  1. 尽量避免全表扫描,首先考虑在where和order by涉及的列上简历索引
  2. 避免在where子句中对字段进行null判断,所以最好在创建表的时候给每个字段都加默认值
  3. 避免在where中使用 != 或 <> ,MYSQL只有对以下操作符才使用索引: < , <= , = , > , >= , BETWEEN , IN 以及某些时候的LIKE
  4. 避免在where中使用or,用了or会导致引擎放弃使用索引而使用全表扫描, 可以使用UNION 替代or
  5. in和not in也要慎用,否则会导致全表扫描,对于连续的数值,能用between就不要用in了:Select id from t where num between 1 and 3
  6. LIKE只有在 “abc%”的情况下才会用到索引,“%abc%”会导致全表扫描
  7. where中避免使用表达式操作
  8. 很多时候用exists代替in是一个好的选择:select num from a where num in(select num from b)。用下面的语句替换:select num from a where exists(select 1 from b where num=a.num)
  9. 索引固然可以提高相应的select的效率,但同时也降低了insert及update的效率,因为insert或update时有可能会重建索引,所以怎样建索引需要慎重考虑,视具体情况而定。一个表的索引数最好不要超过6个,若太多则应考虑一些不常使用到的列上建的索引是否有必要
  10. 尽量使用数字型字段,若只含数值信息的字段尽量不要设计为字符型,这会降低查询和连接的性能,并会增加存储开销
  11. 最好不要使用 ”*“ 返回所有:select from t ,用具体的字段列表代替 “*” ,不要返回用不到的任何字段
  12. 使用表的别名(Alias):当在SQL语句中连接多个表时,请使用表的别名并把别名前缀于每个Column上。这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误
  13. 在IN后面值的列表中,将出现最频繁的值放在最前面,出现得最少的放在最后面,减少判断的次数
  14. 尽量使用exists代替select count(1)来判断是否存在记录,count函数只有在统计表中所有行数时使用,而且count(1)比count(*)更有效率
  15. 尽量使用“>=”,不要使用“>”
  16. 下列SQL条件语句中的列都建有恰当的索引,但执行速度却非常慢:
SELECT * FROM record WHERE substrINg(card_no,1,4)=’5378’ (13秒) 

SELECT * FROM record WHERE amount/30< 1000 (11秒) 

SELECT * FROM record WHERE convert(char(10),date,112)=’19991201’ (10秒) 

分析:

WHERE子句中对列的任何操作结果都是在SQL运行时逐列计算得到的,因此它不得不进行表搜索,而没有使用该列上面的索引。

如果这些结果在查询编译时就能得到,那么就可以被SQL优化器优化,使用索引,避免表搜索,因此将SQL重写成下面这样:

SELECT * FROM record WHERE card_no like ‘5378%’ (< 1秒) 

SELECT * FROM record WHERE amount< 1000*30 (< 1秒) 

SELECT * FROM record WHERE date= ‘1999/12/01’ (< 1秒)
  1. 提高GROUP BY语句的效率,可以通过将不需要的记录在GROUP BY之前过滤掉。下面两个查询返回相同结果,但第二个明显就快了许多
-- 低效
SELECT JOB , AVG(SAL) FROM EMP GROUP BY JOB HAVING JOB =’PRESIDENT’ OR JOB =’MANAGER’ 
-- 高效
SELECT JOB , AVG(SAL) FROM EMP WHERE JOB =’PRESIDENT’ OR JOB =’MANAGER’ GROUP BY JOB
  1. SQL语句用大写,因为Oracle总是先解析SQL语句,把小写的字母转换成大写的再执行

  2. 别名的使用,别名是大型数据库的应用技巧,就是表名、列名在查询中以一个字母为别名,查询速度要比建连接表快1.5倍

  3. 索引创建规则:

    • 表的主键、外键必须有索引;
    • 数据量超过300的表应该有索引;
    • 经常与其他表进行连接的表,在连接字段上应该建立索引;
    • 经常出现在Where子句中的字段,特别是大表的字段,应该建立索引;
    • 索引应该建在选择性高的字段上;
    • 索引应该建在小字段上,对于大的文本字段甚至超长字段,不要建索引;
    • 复合索引的建立需要进行仔细分析,尽量考虑用单字段索引代替;
    • 正确选择复合索引中的主列字段,一般是选择性较好的字段;
    • 复合索引的几个字段是否经常同时以AND方式出现在Where子句中?单字段查询是否极少甚至没有?如果是,则可以建立复合索引;否则考虑单字段索引;
    • 如果复合索引中包含的字段经常单独出现在Where子句中,则分解为多个单字段索引;
    • 如果复合索引所包含的字段超过3个,那么仔细考虑其必要性,考虑减少复合的字段;
    • 如果既有单字段索引,又有这几个字段上的复合索引,一般可以删除复合索引;
    • 频繁进行数据操作的表,不要建立太多的索引;
    • 删除无用的索引,避免对执行计划造成负面影响;
    • 表上建立的每个索引都会增加存储开销,索引对于插入、删除、更新操作也会增加处理上的开销。另外,过多的复合索引,在有单字段索引的情况下,一般都是没有存在价值的;相反,还会降低数据增加删除时的性能,特别是对频繁更新的表来说,负面影响更大
    • 尽量不要对数据库中某个含有大量重复的值的字段建立索引
  4. 我们应该为数据库里的每张表都设置一个ID做为其主键,而且最好的是一个INT型的(推荐使用UNSIGNED),并设置上自动增加的AUTO_INCREMENT标志

  5. 当只要一行数据时使用LIMIT 1

  6. 优化表的数据类型,选择合适的数据类型:

    原则:更小通常更好,简单就好,所有字段都得有默认值,尽量避免null

    例如:数据库表设计时候更小的占磁盘空间尽可能使用更小的整数类型。(mediumint就比int更合适)

    比如时间字段:datetime和timestamp,datetime占用8个字节,而timestamp占用4个字节,只用了一半,而timestamp表示的范围是1970—2037适合做更新时间

    MySQL可以很好的支持大数据量的存取,但是一般说来,数据库中的表越小,在它上面执行的查询也就会越快

    因此,在创建表的时候,为了获得更好的性能,我们可以将表中字段的宽度设得尽可能小

    例如:在定义邮政编码这个字段时,如果将其设置为CHAR(255),显然给数据库增加了不必要的空间。甚至使用VARCHAR这种类型也是多余的,因为CHAR(6)就可以很好的完成任务了

    同样的,如果可以的话,我们应该使用MEDIUMINT而不是BIGIN来定义整型字段,应该尽量把字段设置为NOT NULL,这样在将来执行查询的时候,数据库不用去比较NULL值

    对于某些文本字段,例如“省份”或者“性别”,我们可以将它们定义为ENUM类型。因为在MySQL中,ENUM类型被当作数值型数据来处理,而数值型数据被处理起来的速度要比文本类型快得多这样,我们又可以提高数据库的性能

  1. 字符串数据类型:char,varchar,text选择区别
  2. 任何对列的操作都将导致表扫描,它包括数据库函数、计算表达式等等,查询时要尽可能将操作移至等号右边

你可能感兴趣的:(SQL 语句性能优化策略)