策略概述

对MySQL优化是一个综合性的技术，主要包括一下几个方面：

a. 表的设计的合理化 [ 符合3NF ]

b. 添加适当的索引（index）[ 普通索引主键索引唯一索引全文索引 ]

c. 分表技术 [ 水平分割垂直分割 ]

d. 读写分离 [ select add/update/delete ]

e. 存储过程 [ 模块化编程可以提高速度 ]

f. 对mysql配置优化(my.ini) [ 配置最大并发数调整缓存大小 ]

g. 对mysql服务器硬件升级

h. 定时进行碎片整理 [ 尤其是MyISAM引擎 ]

数据库分类

关系型数据库: mysql/oracle/db2/informix/sysbase/sql server

特点: 面向对象或集合

非关系型数据库: mongodb/redis

特点: 面向文档

三范式标准

合理的表设计应遵循三大范式，即3NF。首先要符合1NF，才能满足2NF，进一步3NF。

1NF:即表的列具有原子性，不可再分解，即列的信息不能再分解，只要数据库是关系型数据库，就自动满足1NF。

2NF:表中的记录是唯一的，就满足2NF，通常我们设计一个主键来实现。主键不含业务逻辑，一般是自增的，数据比较稳定。

3NF:即表中不要有冗余数据，就是说，表的信息如果能够被推导出来，就不应该单独设计一个字段来存放。

比如下面的设计就不满足3NF：

反3NF:没有冗余的数据库未必是最好的数据库，有时为了提高运行效率，就必须降低方式标准，适当保留冗余数据。

比如下面的设计就要反3NF：

具体的做法是，在概念数据模型设计时遵守第三范式，降低范式标准的工作放到物理数据模型设计时考虑，降低范式就是增加字段，允许冗余。

SQL语句优化

背景问题: 如何在一个大项目中迅速的定位执行速度比较慢的语句，即定位慢查询。

1.查询mysql运行状态

show status 命令

show status like 'uptime';           //查询当前mysql运行时间

show status like 'com_select';       //查询select命令执行次数(add/update/delete类推)

show [session|global] status like ...//如果不写[session|global]默认是session会话，取出当前窗口命令执行情况，如果你想看所有命令执行汇总，则应指定global

show status like 'connections';      //查询mysql连接数

show status like 'slow_queries';     //查询慢查询次数

2.定位慢查询准备工作

这里为了模仿应用场景，我们使用存储过程构建一个大表，表中有4000w条记录，并且这些记录应不同，否则测试效果和实际情况差距很大。默认情况下，mysql认为10s才是一个慢查询，因此我们需要修改mysql慢查询规定的标准时间。

show variables like 'long_query_time';    //查询当前慢查询规定时间

set long_query_time = 1;                  //修改慢查询规定时间，这时如果语句执行超过1s就会被统计到

创建大表的SQL代码如下：

/*部门表*/
CREATE TABLE dept( 
deptno MEDIUMINT   UNSIGNED  NOT NULL  DEFAULT 0, 
dname VARCHAR(20)  NOT NULL  DEFAULT "",
loc VARCHAR(13) NOT NULL DEFAULT ""
) ENGINE=MyISAM DEFAULT CHARSET=utf8 ;

/*雇员表*/
CREATE TABLE emp(
empno  MEDIUMINT UNSIGNED  NOT NULL  DEFAULT 0, /*编号*/
ename VARCHAR(20) NOT NULL DEFAULT "", /*名字*/
job VARCHAR(9) NOT NULL DEFAULT "",/*工作*/
mgr MEDIUMINT UNSIGNED NOT NULL DEFAULT 0,/*上级编号*/
hiredate DATE NOT NULL,/*入职时间*/
sal DECIMAL(7,2)  NOT NULL,/*需求*/
comm DECIMAL(7,2) NOT NULL,/*红利*/
deptno MEDIUMINT UNSIGNED NOT NULL DEFAULT 0 /*部门编号*/
)ENGINE=MyISAM DEFAULT CHARSET=utf8;

/*薪水表*/
CREATE TABLE salgrade(
grade MEDIUMINT UNSIGNED NOT NULL DEFAULT 0,
losal DECIMAL(17,2)  NOT NULL,
hisal DECIMAL(17,2)  NOT NULL
)ENGINE=MyISAM DEFAULT CHARSET=utf8; 

测试数据：
INSERT INTO salgrade VALUES (1,700,1200);
INSERT INTO salgrade VALUES (2,1201,1400);
INSERT INTO salgrade VALUES (3,1401,2000);
INSERT INTO salgrade VALUES (4,2001,3000);
INSERT INTO salgrade VALUES (5,3001,9999);

//为了存储过程能够正常执行，我们需要把命令结束符修改一下：
delimiter $$

//创建自定义函数：
create function rand_string(n INT) 
returns varchar(255) #该函数会返回一个字符串
begin 
#char_str定义一个变量，类型是varchar(100)，默认'abcdefghijklmnopqrstuvwxyzABCDEFJHIJKLMNOPQRSTUVWXYZ'
declare chars_str varchar(100) default 'abcdefghijklmnopqrstuvwxyzABCDEFJHIJKLMNOPQRSTUVWXYZ';
declare return_str varchar(255) default '';
declare i int default 0;
while i < n do 
   set return_str =concat(return_str,substring(chars_str,floor(1+rand()*52),1));
   set i = i + 1;
end while;
return return_str;
end $$

create function rand_num( )
   returns int(5)
begin 
   declare i int default 0;
   set i = floor(10+rand()*500);
return i;
end $$

//创建存储过程
create procedure insert_emp(in start int(10),in max_num int(10))
begin
declare i int default 0;
set autocommit = 0;  
repeat
    set i = i + 1;
    insert into emp values ((start+i),rand_string(6),'SALESMAN',0001,curdate(),2000,400,rand_num());
    until i = max_num
end repeat;
commit;
end $$

//调用存储过程
call insert_emp(100001,4000000);

MySQL中可以保存的内容有：表，视图，函数，过程，触发器。

MySQL中除了concat()等内置函数以外还可以定义自己的自定义函数，自定义函数也可以在php脚本中调用：

3.将慢查询SQL语句记录到日志中

默认情况下，MySQL不会记录慢查询，需要在启动MySQL的时候指定慢查询。

bin/mysql.exe --safe-mode --slow-query-log [mysql5.5可以在my.ini配置文件中指定]
bin/mysql.exe -log-slow-queries=d:/abc.log [低版本mysql5.0可以在my.ini配置文件中指定]

先关闭MySQL再重新启动，如果启动慢查询日志，默认把这个文件放在my.ini文件中记录的位置。

#Path to the database root
datadir="C:/Documents and Settings/All Users/Application Data/MYSQL 5.5/Data"

索引往往和物理存储相关联，数据库中数据迁移的时候应注意这一点。

运行在安全模式下的MySQL会将一些操作记录日志，具备一定的恢复能力。

通过测试，我们可以看到在日志中记录下了MySQL的慢查询语句及其相关信息。

4.针对慢SQL语句的优化方案

通过explain语句分析mysql数据库如何执行sql语句，explain可以帮助我们在不真正执行某个sql语句时，显示mysql会怎样执行该条sql语句，从而帮助我们分析语句执行情况。

//explain分析sql的回显结果说明

id : 查询序列号

select_type：查询类型

table：查询标名

type：扫描方式(all表示全表扫描)

possible_keys：可能使用到的索引

key：实际使用的索引

rows：该sql语句扫描了多少行，可能得到多少记录

Extra：sql语句的额外信息，比如排序方式

索引的使用

添加索引
1.1 主键索引
当把一张表的某个列设为主键的时候，则该列就是主键索引：
```
create table aaa(
id int unsigned primary key auto_increment,            //这个id列就是主键索引
name varchar(32) not null default '' 
);
```
如果创建表时没有指定主键索引，可以在创建表后添加：
```
create table bbb (id int , name varchar(32) not null default '');
alter table bbb add primary key (id);
```
1.2 普通索引
一般来说，通常是先创建表，再创建普通索引
```
create table ccc(
id in unsigned,
name varchar(32)
);
create index 索引名 on 表 (列);
```
1.3 全文索引

全文索引主要是针对文本的检索，比如文章等，只有MYISAM存储引擎支持全文索引。

全文索引的添加
```
create table article(
id int unsigned auto_increment not null primary key,
title varchar(200),
body text,
fulltext(title,body)
)engine=myisam charset utf8;
```
全文索引的使用
```
select * from article where body like '%mysql%';     [不会使用全文索引]
explain select * from article where body like "%mysql%";      [通过分析我们证明了不会使用全文索引]
select * from article where match(title, body) against('database');  [会使用全文索引]
```
全文索引的说明
1. 在MySQL中全文索引(fulltext)只针对MYISAM存储引擎有效。
2. MySQL自己提供的全文索引(fulltext)只针对英文有效，针对中文有sphinx(coreseek)解决方案。
3. 全文索引的使用方法 match (字段名) against ('关键字');
4. 全文索引的停止词：在一个文本中创建索引是一个无穷大的数，因此，对于一些常用的词和字符就不会创建，这些词成为停止词。
1.4 唯一索引

当表的某列被指定为unique约束时，这列就是一个唯一索引。

创建表时创建唯一索引
```
create table ddd(id int primary key auto_increment, name varchar(32) unique);
```
创建表后创建唯一索引
```
create table eee(id int primary key  auto_increment, name varchar(32));
create unique index 索引名 on 表名 (列名)
```
唯一索引的字段可以为空，为空时可以重复，但是不为空时则不能重复。

主键索引的字段不可以为空，也不可以重复。

查询索引

desc 表名 [该方法的缺点是不能够显示索引名]

show index(es) from 表名;

show keys from 表名;

删除索引

alter table 表名 drop index 索引名;  

alter table 表名 drop primary key;         //删除主键索引

修改索引

先删除，再创建。

索引的原理（二叉树算法BTREE）

索引的注意事项

索引的代价

磁盘占用

对dml语句(update delete insert)的效率影响，由于维护索引文件，会使其变慢。
索引的使用

a. 较为频繁的作为查询条件字段应该创建索引
```
select * from emp where empno=1;
```
b. 唯一性太差的字段即便频繁作为查询条件也不适合单独创建索引
```
select * from emp where sex='男';
```
c. 更新非常频繁的字段不适合创建索引
```
select * from emp where logincount=1;
```
d. 不会出现在where子句中的字段不该创建索引

总结起来满足如下条件的字段才应该创建索引

肯定在where条件经常使用。
该字段的内容不是唯一的几个值。
字段内容不是经常变化的。

索引注意事项
```
alter table dept add index my_ind(dname, loc);  //dname是左边的列，loc是右边的列  
```
如果我们的表中有复合索引(索引作用在多列上)，此时我们应注意：
1. 对于创建的多列索引，只要查询条件使用了最左边的列，索引一般就会被使用
```
explain select * from dept where dname='aaa'\G   //会用到索引 

explain select * from dept where loc='xxx'\G     //不会用到索引
```
2. 对于like的查询，查询如果是'%aaa'，不会使用索引，如果是'aaa%'，会使用索引
```
explain select * from dept where dname like '%aaa'\G   //不会使用索引

explain select * from dept where dname like 'aaa%'\G   //会使用索引
```
在like查询时关键字的最前面不能使用'%'或'_'这样的字符，如果一定要在前面有变化的值则考虑使用全文索引或sphinx
1. 如果条件中有or，即使其中有条件带索引也不会使用。换言之，就是要求使用的所有字段都必须建立索引。
我们建议大家尽量避免使用or关键字
1. 如果列类型是字符串，那一定要在条件中将数据使用引号引用起来，否则不能使用到索引。(数值类型会转化为字符串类型)
2. 如果mysql估计使用全表扫描要比使用索引快，则不使用索引。

索引使用查询

show status like 'Handle_read%';

handler_read_key  这个值越高表示使用索引查询到的次数越多

handler_read_md_next  这个值越高说明查询效率越低

查询语句技巧

在使用group by分组查询时，默认分组后还会排序，可能会降低速度

select * from dept group by depname\G           //默认会排序

select * from dept group by depname order by null\G     //避免了排序

有些情况下可以使用连接来代替子查询，因为使用join时MySQL不需要在内存中创建临时表

select * from dept, emp where dept.deptno=emp.deptno;   //简单处理方式

select * from dept left join emp on dept.deptno=emp.deptno; //使用左外连接更好

MySQL优化技术

策略概述

数据库分类

三范式标准

SQL语句优化

你可能感兴趣的:(MySQL优化技术)