Mysql详解

一、Mysql简介

1.启动和停止MySQL服务

方式一:计算机-管理-服务-启动或停止Mysql
方式二: 启动 net start mysql服务名
停止 net stop mysql服务名

2.服务端的登陆和退出

mysql -h 主机名 -u用户名 -p 密码
exit

3.DQL、DML、DDL、DCL语言

DML(Data Mainipulation Language):数据操纵语句,用于增删查改数据库记录
INSERT\UPDATE\DELETE\SELECT
DDL(Data Definition Language):数据定义语言,用于库和表的创建、修改、删除
CREATE\ALTER\DROP\CREATE INDEX\DROP INDEX
DCL(Data Control Language):数据控制语言,用于定义用户的访问权限和安全级别
GRANT\REVOKE\COMMIT\ROLLBACK\SAVEPOINT\LOCK

4.数据库基本操作

查看mysql中有哪些数据库?show
使用一个数据库 use
新建一个数据库 create

查看制定数据库中有哪些表
创建表 create
查看表的结构 show
删除表 alter
查看表 select
向表中插入记录 insert
修改记录 update
删除记录 delete

查询表中所有列
查询特定列
对数据进行过滤
运算符

二、DQL

1.SELECT和FROM

SELECT 列名或*(列名用逗号隔开) FROM 表名;

2.别名

AS 加别名 全字母大写
“别名” 指定别名;

3.字符串

字符串可以是 SELECT 列表中的一个字符,数字,日期。
日期和字符只能在单引号中出现。
每当返回一行时,字符串被输出一次。

4.DESCRIBE

DESCRIBE 表命;
显示表的结构

5.distinct

distinct去重,但是大表一般用distinct效率不高,大数据量的时候都禁止用distinct,建议用group by解决重复问题。

6.Where

用于过滤,紧跟FROM
可以用 = 、<、>、 BETWEEN … AND … 、IN(值、值、值) 、 LIKE 、 IS NULL

Mysql详解_第1张图片

LIKE中%代表0个或多个字符、_代表一个字符,可以同时使用

AND、OR、NOT 逻辑运算

ORDER BY 写在SELECT之后, -ASC升序(不写默认) -DESC降序
ORDER BY 列名/别名,列名/别名 ASC
可以使用不在SELECT列表中的列排序

7.分组函数

分组函数作用于一组数据,并对一组数据返回一个值
AVG() 平均数,
COUNT() 总数,
MAX() 最大值,
MIN() 最小值,
SUM() 总和
可用在SELECT WHERE中

8.GROUP BY

可以使用GROUP BY 将表中的数据分成若干组,与SELCET中分组函数配合使用
在SELECT列表中所有未包含在组函数中的列都应该包含在GROUP BY子句中

Mysql详解_第2张图片

GROUP BY中可以包含多个列,

9.HAVING

使用HAVING过滤分组,
1.行已经被分组
2.使用了分组函数
3.满足HAVING子句中的条件的分组将被显示出来
Mysql详解_第3张图片

10.多表查询

等值连接
非等值连接 (内连接)
外连接
交叉连接

select 列名,… from 表1
【inner|left outer|right outer|cross】join 表2 on 连接条件
【inner|left outer|right outer|cross】join 表3 on 连接条件
【where 筛选条件】
【group by 分组字段】
【having 分组后的筛选条件】
【order by 排序的字段或表达式】

INNER JOIN 两边表同时有对应的数据,即任何一边缺失数据就不显示。
LEFT JOIN 会读取左边数据表的全部数据,即便右边表无对应数据。
RIGHT JOIN 会读取右边数据表的全部数据,即便左边表无对应数据。

使用表名前缀在多个表中区分相同的列

可以使用表的别名在FROM中,使用后SELECT中需要使用别名.列名

Mysql详解_第4张图片

连接n各表,至少需要n-1个连接条件,

11.ON

自然连接中是以具有相同名字的列为连接条件的。

可以使用ON子句指定额外的连接条件,这个连接条件是与其它条件分开的
ON子句使语句更具有易读性
内连接: [inner] join on

外连接:
左外连接 left[ out] join on
右外连接 right [out] join on

12.表连接总结

Mysql详解_第5张图片
Mysql详解_第6张图片

13.UNION

联合 拼接 去重
Mysql详解_第7张图片
UNION ALL 不去重
Mysql详解_第8张图片

14.常见函数

1、字符函数

upper转换成大写
lower转换成小写
Mysql详解_第9张图片
concat拼接
substr截取子串
length 获取字节个数
instr返回子串第一次出现的索引
lpad左填充
rpad右填充
trim去掉前后指定的空格和字符
ltrim去掉左边空格
rtrim去掉右边空格
replace替换
Mysql详解_第10张图片

2、数学函数
round 四舍五入

在这里插入图片描述
rand 随机数
floor向下取整
ceil向上取整
mod取余
truncate截断

3、日期函数

now当前系统日期+时间
curdate当前系统日期
curtime当前系统时间
str_to_date 将字符转换成日期
在这里插入图片描述
date_format将日期转换成字符
Mysql详解_第11张图片

4、流程控制函数
if 处理双分支
case语句 处理多分支
	情况1:处理等值判断
	情况2:处理条件判断	
5、其他函数
version版本
database当前库
user当前连接用户

三、DML

1.INSERT INTO

INSERT INTO 表名(列名) VALUES (值)
字符和日期型数据应包含在单引号中
Mysql详解_第12张图片

插入空值
Mysql详解_第13张图片
从其他表中拷贝数据
Mysql详解_第14张图片

2.UPDATE

UPDATE 表名 SET 列名=值 WHERE 条件

如果没有WHERE表中相关列全部改变
若没有该列 则报错。

3.DELETE FROM

DELETE FROM 表名 WHERE 条件

四、子查询

1.基本概念:

出现在其他语句内部的select语句
select first_name
from employees
where
department_id in(
select department_id
from departments
where location_id=1700
)

子查询要包括在括号内。
将子查询放在比较条件的右侧

2.单行子查询

只返回一行
单行操作符对应单行子查询,多行操作符对应多行自查询

子查询 (内查询) 在主查询之前一次执行完成。
子查询的结果被主查询(外查询)使用 。

使用子查询解决:谁的工资比Abel高?(子查询为Abel的工资是多少?)

3.多行子查询

返回多行查询结果
使用多行比较操作符
IN/NOT IN 、等于列表中任意一个
ANY/SOME 、和子查询返回的某一个比较
ALL 和子查询返回的所有值比较
解决问题:
返回location_id是1400或1700的部门中的所有员工姓名 IN
返回其它部门中比job_id为‘IT_PROG’部门任一工资低的员工的员工号、姓名、job_id 以及salary ANY
返回其它部门中比job_id为‘IT_PROG’部门所有工资低的员工的员工号、姓名、job_id 以及salary ALL

五、DDL

1.CTEATE创建、SHOW查看、USE使用数据库

Mysql详解_第15张图片

2.数据库命名规则

Mysql详解_第16张图片

3.CTEATE创建表

必须指定表名、列名、数据类型、尺寸

CREATE TABLE 表名(
	列名 数据类型(长度),
	列名 数据类型(长度)
);

4.AS使用子查询创建表

复制现有的表

Mysql详解_第17张图片
Mysql详解_第18张图片

5.ALTER TABLE

实现对已有表中的列进行添加、修改、删除、重命名
ADD添加列:
在这里插入图片描述
MODIFY修改列:
DEFAULT
在这里插入图片描述

DROP COLUMN删除一个列
在这里插入图片描述

CHANGE重命名
Mysql详解_第19张图片

6.DROP TABLE

DROP TABLE 表名

数据和结构都被删除
所有正在运行的相关事务倍提交
所有相关索引被删除
删除操作不能回滚

7.TRUNCATE TABLE

TRUNCATE TABLE 表名

清空表中的所有数据
删除操作不能回滚,使用delete删除表中的数据可以回滚

8.RENAME

改变表的视图名称
Mysql详解_第20张图片

六、MySQL中的数据类型

1.数值类型

整数类型 字节 范围
tinyint 1 -128到127
无符号0到255
smallint 2
medimint 3
int Integer 4
Bigint 8
float 4
double 8
DEC(m,d)
DECIMAL(m,d) m+2
bit(M) 1~8

2.字符类型

字符类型 字节 范围
char(m) m m为0~255
varchar(m) m m为0~65535
binary
varbinary 存储二进制
Enum 1或2 1255或165535 指定值
Set 1到8 0~64 多个指定值

3.日期类型

日期类型 字节 最小值 最大值
date 4 1001-01-01 9999-12-31
datetime 8 1001-01-01 0:0:0 9999-12-31 23:59:59
timestamp 4
time 3
year 1 1901 2155

七、约束

1.NOT NULL

非空约束

表中增加约束:ALTER TABLE 表名 MODIFY 列名 数据类型 NOT NULL;

2.UNIQUE

唯一约束,允许出现多个空值
一个表可以有多个唯一约束,
多个列组合的唯一约束即列与列组合起来唯一。
mysql会给唯一约束的列上默认创建一个唯一索引。

表中增加唯一约束:
ALTER TABLE 表名 ADD UNIQUE(列名,列名);
ALTER TABLE 表名 ADD CONSTRAINT uk_name_pwd UNIQUE(列名,列名);
ALTER TABLE 表名 MODIFY 列名 数据类型 UNIQUE;

3.PRIMARY KEY

主键约束,唯一且非空
如果使多列组合的主键约束,那么这些列都不允许为空值,并且组合的值不允许重复。
每个表最多一个主键
Mysql详解_第21张图片
Mysql详解_第22张图片

4.FOREIGN KEY

外键约束

5.CHECK

Mysql不支持check约束,但可以使用check,没有效果

6.DEFAULT

八、分页

1.LIMIT

前10条记录:SELECT * FROM table LIMIT 0,10;
 第11至20条记录:SELECT * FROM table LIMIT 10,10;
 第21至30条记录: SELECT * FROM table LIMIT 20,10;
kai’sh
LIMIT x,b
从x开始的的b条记录

SELECT * FROM table LIMIT(PageNo - 1)*PageSize,PageSize;

九、事务

1.事务的概述

事务由单独单元的一个或多个SQL语句组成,在这个单元中,每个MySQL语句是相互依赖的。而整个单独单 元作为一个不可分割的整体,如果单元中某条SQL语句一 旦执行失败或产生错误,整个单元将会回滚。所有受到影 响的数据将返回到事物开始以前的状态;如果单元中的所有SQL语句均执行成功,则事物被顺利执行。

2.存储引擎

在mysql中的数据用各种不同的存储技术存储在文件或内存中。
通过show engines;来查看mysql支持的存储引擎。
在mysql中用的最多的存储引擎有:
innodb,myisam ,memory 等。
其中innodb支持事务,而 myisam、memory等不支持事务

3.事务的特点

原子性:要么都执行,要么都回滚
一致性:保证数据的状态操作前和操作后保持一致
隔离性:多个事务同时操作相同数据库的同一个数据时,一个事务的执行不受另外一个事务的干扰
持久性:一个事务一旦提交,则数据将持久化到本地,除非其他事务对其进行修改

4.事务的使用?

1、开启事务(以第一个DML语句的执行作为开始)
2、编写事务的一组逻辑操作单元(多条sql语句)
3、提交事务或回滚事务

set autocommit=0;
start transaction;//开启事务
commit;//事务提交
rollback;//回滚

savepoint 断点
commit to 断点
rollback to 断点

5.事务并发问题如何发生?

脏读:一个事务读取到了另外一个事务未提交的数据

不可重复读:同一个事务中,多次读取到的数据不一致

幻读:一个事务读取数据时,另外一个事务进行更新,导致第一个事务读取到了没有更新的数据

6.如何避免事务的并发问题?

当多个事务同时操作同一个数据库的相同数据时

通过设置事务的隔离级别
1、READ UNCOMMITTED 未提交读
2、READ COMMITTED 已提交 读可以避免脏读
3、REPEATABLE READ 重复读 可以避免脏读、不可重复读和一部分幻读
4、SERIALIZABLE 串行读 可以避免脏读、不可重复读和幻读

set session|global transaction isolation level 隔离级别名;

select @@tx_isolation;//查看隔离级别

十、视图

1.VIEM

MySQL从5.0.1版本开始提供视图功能。
一种虚拟存在的表,行和列的数据来自定义视图的查询中使用的表,并且是在使用视图时动态生成的,只保存了sql逻辑,不保存查询结果

应用场景
多个地方用到同样的查询结果
该查询结果使用的sql语句较复杂

2.视图和表的区别

使用方式 占用物理空间

视图 完全相同 不占用,仅仅保存的是sql逻辑

表 完全相同 占用

视图的优势
1、sql语句提高重用性,效率高
2、和表实现了分离,提高了安全性

3.视图的创建、修改、删除查看

视图的创建 语法: CREATE VIEW 视图名 AS 查询语句;
视图的删除 DROP VIEW test_v1,test_v2,test_v3;
视图结构的查看 DESC test_v7; SHOW CREATE VIEW test_v7;
视图逻辑的更新:
CREATE OR REPLACE VIEW test_v7
AS SELECT last_name
FROM employees
WHERE employee_id>100;

ALTER VIEW test_v7ASSELECT employee_id
FROM employees;
SELECT * FROM test_v7;

(1)查看视图的数据
SELECT * FROM my_v4;
SELECT * FROM my_v1 WHERE last_name=‘Partners’;

(2)插入视图的数据
INSERT INTO my_v4(last_name,department_id) VALUES(‘虚竹’,90);

(3)修改视图的数据
UPDATE my_v4 SET last_name =‘梦姑’ WHERE last_name=‘虚竹’;

(4)删除视图的数据
DELETE FROM my_v4;

4.视图不能更新的情况

包含以下关键字的sql语句:
分组函数、distinct、group by、having、union或者union all 常量视图
Select中包含子查询 join
from一个不能更新的视图
where子句的子查询引用了from子句中的表

十一、存储过程以及函数

1.procedure

事先经过编译并存储在数据库中的一段sql语句的集合。

2.存储过程的分类

1、无返回无参
2、仅仅带in类型,无返回有参
3、仅仅带out类型,有返回无参
4、既带in又带out,有返回有参
5、带inout,有返回有参
注意:in、out、inout都可以在一个存储过程中带多个

3.创建

create procedure 存储过程名(in|out|inout 参数名 参数类型,…)
begin
存储过程体
end

4.注意事项

1、需要设置新的结束标记
delimiter 新的结束标记
示例:
delimiter $
CREATE PROCEDURE 存储过程名(IN|OUT|INOUT 参数名 参数类型,…)
BEGIN
sql语句1;
sql语句2;
END $

2、存储过程体中可以有多条sql语句,如果仅仅一条sql语句,则可以省略begin end

3、参数前面的符号的意思
in:该参数只能作为输入 (该参数不能做返回值)
out:该参数只能作为输出(该参数只能做返回值)
inout:既能做输入又能做输出

5.调用存储过程

call 存储过程名(实参列表)

6.FUNCTION

创建:
CREATE FUNCTION 函数名(参数名 参数类型,…)
RETURNS 返回类型
BEGIN
函数体
END

7.调用函数

调用函数 SELECT 函数名(实参列表)

8.函数与存储过程的区别

关键字 调用语法 返回值 应用场景
函数 FUNCTION SELECT 函数() 只能是一个 一般用于查询结果为一个值并 返回时,当有返回值而且仅仅一个
存储过程 PROCEDURE CALL 存储过程() 可以有0个或多个 一般用于更新

9.存储过程以及函数的修改、删除、查看

• 修改存储过程:
alter procedure 存储过程名 [charactristic…]
• 修改函数:
alter function 函数名 [charactristic…]
characteristic:
{contains sql|no sql|reads sql data|modifies sql data}
|sql security{definer|invoker}
|comment ‘string’

说明:一次只能删除一个存储过程或者函数,并且要求有该 过程或函数的alter routine 权限
删除存储过程:
drop procedure [if exists] 存储过程名
删除函数:
drop function [if exists] 函数名

1.查看存储过程或函数的状态:
show {procedure|function} status like 存储过程或函数名
2.查看存储过程或函数的定义:
show create {procedure|function} 存储过程或函数名
3.通过查看information_schema.routines了解存储过程和函数的信息(了解)
select * from rountines where rounine_name =存储过程名|函数名

十二、流程控制结构

1.变量

系统变量:全局变量和会话变量
自定义变量:用户变量,局部变量

2.全局变量

作用域:针对于所有会话(连接)有效,但不能跨重启
查看所有全局变量SHOW GLOBAL VARIABLES;
查看满足条件的部分系统变量SHOW GLOBAL VARIABLES LIKE ‘%char%’;
查看指定的系统变量的值SELECT @@global.autocommit;
为某个系统变量赋值SET @@global.autocommit=0;SET GLOBAL autocommit=0;

3.会话变量

作用域:针对于当前会话(连接)有效
查看所有会话变量SHOW SESSION VARIABLES;
查看满足条件的部分会话变量SHOW SESSION VARIABLES LIKE ‘%char%’;
查看指定的会话变量的值SELECT @@autocommit;SELECT @@session.tx_isolation;
为某个会话变量赋值SET @@session.tx_isolation=‘read-uncommitted’;
SET SESSION tx_isolation=‘read-committed’;

4.用户变量

声明并初始化:
SET @变量名=值;
SET @变量名:=值;
SELECT @变量名:=值;
赋值:
方式一:一般用于赋简单的值
SET 变量名=值;
SET 变量名:=值;
SELECT 变量名:=值;

方式二:一般用于赋表 中的字段值
SELECT 字段名或表达式INTO变量
FROM 表;
使用:
select @变量名;

5.局部变量

声明:
declare 变量名 类型 【default 值】;
赋值:
方式一:一般用于赋简单的值
SET 变量名=值;
SET 变量名:=值;
SELECT 变量名:=值;

方式二:一般用于赋表 中的字段值
SELECT 字段名或表达式 INTO 变量
FROM 表;
使用:
select 变量名

6.用户变量和局部变量的区别

作用域	定义位置	语法

用户变量 当前会话 会话的任何地方 加@符号 不用指定类型
局部变量 定义它的BEGIN END中 BEGIN END的第一句话 一般不用加@ 需要指定类型

7.if函数

语法:if(条件,值1,值2)
特点:可以用在任何位置

8.case语句

语法:
情况一:类似于switch
case表达式
when 值1 then 结果1或语句1(如果是语句,需要加分号)
when 值2 then 结果2或语句2(如果是语句,需要加分号)

else 结果n或语句n(如果是语句,需要加分号)
end 【case】(如果是放在begin end中需要加上case,如果放在select后面不需要)

情况二:类似于多重if
case
when 条件1 then 结果1或语句1(如果是语句,需要加分号)
when 条件2 then 结果2或语句2(如果是语句,需要加分号)

else 结果n或语句n(如果是语句,需要加分号)
end 【case】(如果是放在begin end中需要加上case,如果放在select后面不需要)

9.if elseif语句

语法:
if 情况1 then 语句1;
elseif 情况2 then 语句2;
…else 语句n;
end if;
特点: 只能用在begin end中!!!!!!!!!!!!!!!

10.if语句比较

应用场合
if函数 简单双分支
case结构 等值判断 的多分支
if结构 区间判断 的多分支

11.循环

语法:
【标签:】WHILE 循环条件 DO
循环体END WHILE 【标签】;
特点:
只能放在BEGIN END里面
如果要搭配leave跳转语句,需要使用标签,否则可以不用标签
leave类似于java中的break语句,跳出所在循环!!!

十三、索引

1.索引的定义

MySQL官方对索引的定义为:
索引(Index)是帮助MySQL高效获取数据的数据结构.可以得出索引的本质就是数据结构
  你可以简单理解为"排序好的快速查找数据结构"
  在数据之外,数据库还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构的基础上实现高级查找算法,这种数据结构就是索引
  一般来说索引本身很大,不适合全部存储在内存中,因此索引往往以索引文件的形式存储在磁盘上
  我们平常所说的索引,如果没有特别指明,都是指B树(多路搜索树,并不一定是二叉的)结构组织的索引,其中聚集索引,次要索引,覆盖索引,复合索引,前缀索引,唯一索引默认都是使用B+树索引,统称索引.当然,除了B+树这种类型的索引之外,还有哈稀索引(hash index)等

2.索引的优缺点

优势
  类似大学图书馆建书目录索引,提高数据检索的效率,降低数据库的IO成本
  通过索引列对数据进行排序,降低数据排序成本,降低了CPU的消耗
  可以加速表和表之间的连接
劣势
  实际上索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录,所以索引也是要占内存空间的
  虽然索引大大提高了查询速度,同时都会降低更新表的速度,如对表进行insert,update和delete
  因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引的字段,都会调整因为更新所带来的键值变化后的索引信息
  索引只是高效的一个因素,如果你的MySQL有大数据量的表,就需要花时间研究建立最优秀的索引,或优化查询方法

3.索引的分类

单值索引:即一个索引只包含单个列,一个表不\可以有多个单列索引

唯一索引:索引列的值必须唯一,但允许有控制,例如手机号,银行卡号等值必须是唯一

复合索引:即一个索引包含多个列,例如手机号和银行卡号一起,如果一个表中的数据在查询时有多个字段总是同时出现则这些字段就可以作为复合索引

4.索引的基本语法

创建:create [unique] index indexName on tbname(columnname(lenght))

更改:alter table tbname add [unique] index [indexName] on (columnname(lenght))
更改:alter table tbname add [unique] fulltext [indexName] on (columnname(lenght))#指定索引为fulltext,用于全文索引
删除:drop index [indexName] on tbname;
查看:show index from tbname\G;

5.索引结构

BTree索引
  Hash索引
  full-text全文索引
  R-Tree索引

6.创建索引的应用场景

哪种情况需要创建索引
  1.主键自动建立唯一索引
  2.频繁作为查询条件的字段应该创建索引
  3.查询中与其他表关联的字段,外键关系建立索引
  4.频繁更新的字段不适合创建索引,因为每次更新不单单是更新数据还会更新索引
  5.Where条件里用得到的字段适合创建索引
  6.单键/组合索引的选择问题,在高并发下倾向创建组合索引
  7.查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度
  8.查询中统计或者分组字段
  
哪种情况不需要建索引
  1.表记录太少(一般生产环境下,三百万条记录性能就可能开始下降,官方说的是五百万到八百万)
  2.经常增删改的表
  3.某个数据列的值包含许多重复的内容

7.性能分析

1.MySQL Query Optimizer(查询优化器)

1.1MySQL中有专门负责优化select语句的优化器模块,主要功能:通过计算分析系统中收集到的统计信息,为客户端请求的query提供它认为最有的执行计划(它认为最优的数据检索方式,但不见得是DBA认为是最优的,这部分是最耗时间的)
  1.2当客户端向MySQL请求一条query,命令解析其模块完成请求分类,区别是select并转发给MySQL Query Optimizer时,MySQL Query Optimizer首先会对整条Query进行优化,处理掉一些常量表达式的预算,直接转换成常量值,并对query中的查询条件进行简化和转换,如去掉一些无用或显而易见的条件,结构调整等,然后分析query中的Hint信息(如果有),看显示Hint信息是否可以完全确定该query的执行计划,如果没有Hint或Hint信息不足以完全确定执行计划,则会读取所涉及对象的统计信息,根据query进行写相应的计算分析,然后再得出最后的执行计划。

2.MySQL常见瓶颈

CPU:CPU在饱和的时候一般发生在数据装入内存或从磁盘读取数据时候
  IO:磁盘IO瓶颈发生在装入数据远大于内存容量的时候
  服务器硬件的性能瓶颈,top,free,iostat和vmstat来查看系统的性能状态

3.Explain

3.1explain+SQL语句顺序解释
  表的读取顺序(数字大的先读,相同的则由上而下读取)
  数据读取操作的操作类型
  哪些索引可以使用
  哪些索引被实际使用
  索引总长度
  表之间的引用
  每张表有多少行被优化器查询
  额外的信息(出现using index较好,出现using filesort较差)
3.2怎么用
  explain+SQL语句
  执行计划包含以下的信息
id select_type table type possible_keys key key_len ref rows extra

8.导致索引失败的案例

1.建什么索引用什么索引,顺序也最好保持一致
  2.最佳左前缀索引名称命名(如字段name,age,city,则索引命名应该是nameAgeCity或者xxx_nameAgeCity,顺序很重要)
  3.不在索引列上做任何操作(计算,函数,or,类型转换),会导致索引失效而转向全表扫描
  4.存储引擎不能使用索引中范围条件右边的列(如name=‘lin’ and age>25 and city=‘qingdao’,则age后面的索引会实效)
  5.尽量使用覆盖索引(只访问索引的查询(索引列和要查询的列一致)),减少select *
  6.MySQL在使用不等于(!=或者<>)的时候无法使用索引会导致全表扫描
  7.is null,is not null 也无法使用索引
  8.like以通配符在这(’%abc’,’%abc%’)两种情况会索引实效变成全表扫描,‘abc%‘则不会,若要’%abc’,’%abc%'不失效,建议使用覆盖索引,且查询的字段要少于索引或者与索引一致,不使用select *。如为name,age,city建了索引,请这么使用:select name或者select age,或者select city或者select name,age,city。如果select name,age,city,email则会全表扫描
  9.字符串不加引号索引失效,
  10.少用or,用他来连接时索引会失效
  11.select * from A where exists (select 1 from where b.id=A.id)#当A表的数据系小于B表时,用exists优于in
  12.使用join代替子查询

9.数据类型的选择

1.数字类型
    Float和double选择(尽量选择float)
    区分开TINYINT / INT / BIGINT,能确定不会使用负数的字段,建议添加 unsigned定义
    能够用数字类型的字段尽量选择数字类型而不用字符串类型的
  2.字符类型
    char,varchar,TEXT的选择:非万不得已不要使用 TEXT 数据类型,定长字段,建议使用 CHAR 类型(填空格),不定长字段尽量使用 VARCHAR(自动适应长度,超过阶段),且仅仅设定适当的最大长度
  3.时间类型
    按选择优先级排序DATE(精确到天)、TIMESTAMP、DATETIME(精确到时间)
  4.ENUM
    对于状态字段,可以尝试使用 ENUM 来存放
  5.避免使用NULL字段
    很难查询优化且占用额外索引空间

10.字符编码

同样的内容使用不同字符集表示所占用的空间大小会有较大的差异,所以通过使用合适的字符集,可以帮助我们尽可能减少数据量,进而减少IO操作次数。
  1.纯拉丁字符能表示的内容,选择 latin1 字符编码
  2.中文可选用utf-8
  3.MySQL的数据类型可以精确到字段,所以当我们需要大型数据库中存放多字节数据的时候,可以通过对不同表不同字段使用不同的数据类型来较大程度减小数据存储量,进而降低 IO 操作次数并提高缓存命中率

11.order by优化和group by 优化

order by优化
  重点:使用order by就需要看会不会产生filesort
  mysql支持两种方式排序,index和filesort,index效率高
  尽量使用Index方式排序,避免使用FileSort方式排序
  尽可能在索引列上完成排序操作,遵照索引列的最佳左前缀
  如果不在索引列上,filesort有两种算法:双路排序和单路排序
  双路排序:取一堆数据,要对磁盘进行两次扫描(mysql4.1之前,后来的版本增加了单路排序)
  单路排序:从磁盘读取查询需要的所有列,按照order by列在buffer对他们进行排序,然后扫描排序后的列表进行输出,效率快,但会使用更多的内存空间,因此注意调整sort_buffer_size和max_lenght_for_sort_data参数值(增大值),避免创建tmp文件从而进行多次I/O

group by优化
  和order by差不多
  先排序后分组,遵照索引列的最佳左前缀
  当无法使用索引列时,增大max_lenght_for_sort_data和sort_buffer_size的值
  where高于having,能在where限定的条件就不要去having限定了

12.优化总结

	1.开启慢查询日志
 	2.expain+慢SQL分析
  3.show profile查询sql在mysql服务器里面的执行细节和生命周期情况
  4.sql数据库服务器的参数调优 

十四、Mysql高级简介

1.Mysql 高手是怎样练成的

数据库内部结构和原理
 数据库建模优化
 数据库索引建立
 SQL 语句优化
 SQL 编程(自定义函数、存储过程、触发器、定时任务)
 mysql 服务器的安装配置
 数据库的性能监控分析与系统优化
各种参数常量设定
主从复制
分布式架构搭建、垂直切割和水平切割
数据迁移
容灾备份和恢复
shell 或 python 等脚本语言开发
对开源数据库进行二次开发

2.检查当前系统是否安装过 Mysql

(1)CentOS6 环境下
命令:rpm -qa|grep mysql

默认 Linux 在安装的时候,自带了 mysql 相关的组件。
先卸载系统自带的 mysql,
执行卸载命令 rpm -e --nodeps mysql-libs
(1)CentOS7 环境下
命令:rpm -qa|grep mariadb

默认 Linux(CentOS7)在安装的时候,自带了 mariadb(mysql 完全开源版本)相关的组件。
先卸载系统自带的 mariadb,执行卸载命令 rpm -e --nodeps mariadb-libs

3.检查/tmp 文件夹权限

查看/tmp 文件夹权限:
赋予其最大权限:chomd -R 777 /tmp

4.安装mysql

安装的版本是 mysql 5.5,官网下载地址:http://dev.mysql.com/downloads/mysql/
①将 rpm 安装包拷贝到 opt 目录下
命令ll查看当前文件夹中文件列表
②在安装目录下执行 rpm 安装
rpm -ivh MySQL-client-5.5.54-1.linux2.6.x86_64.rpm
rpm -ivh MySQL-server-5.5.54-1.linux2.6.x86_64.rpm
-ivm含义:
安装完成后,出现如下警告,需要为软件设置 root 用户的密码。
Mysql详解_第23张图片
③查看是否安装成功:mysqladmin --version
或者也可以通过 rpm 命令来查看:
④设置用户和密码: mysqladmin –u root password xxxxxx

5.Mysql 服务

Mysql 服务的启动和停止
查看状态:service mysql status
启动服务:service mysql start
停止服务:service mysql stop
重启服务:service mysql restart
启动之后,查看进程:ps -ef|grep mysql

6.mysql的安装位置

Mysql详解_第24张图片

7.设置Mysql 服务的自启动

Mysql 服务是开机自动启动的!
查看:chkconfig --list|grep mysql
如果要取消开机自启动,则输入命令 ntsysv
出现以下界面:
使用空格取消选中,然后按 TAB 确定!

8.Mysql重复启动问题

启动两个,登陆时报错
杀死所有和mysql有关的操作:killall mysqld
d代表demon,守护进程

再重启服务:service mysql start

9.修改字符集

字符集乱码原因
如果在建库建表的时候,没有明确指定字符集,则采用默认的字符集 latin1,其中是不包含中文字符的。查看默认的编码字符集:
show variabels like ‘%char%’;

永久修改

(1)修改配置文件
在/usr/share/mysql/ 中找到 my.cnf 的配置文件,拷贝其中的 my-huge.cnf 到 /etc/ 并命名为 my.cnf 。添加以
下内容后再重启服务。
注意:必须将文件拷贝到指定路径,且名称为 my.cnf
[client]
default-character-set=utf8
[mysqld]
character_set_server=utf8
character_set_client=utf8
collation-server=utf8_general_ci
[mysql]
default-character-set=utf8
再次查看:
show variabels like ‘%char%’;
注意:已经创建的数据库的设定不会发生变化,参数修改只对新建的数据库有效!

(2)修改已创建库、表字符集
修改数据库的字符集
mysql> alter database mydb character set ‘utf8’;
修改数据表的字符集
mysql> alter table mytbl convert to character set ‘utf8’;

(3)修改已经乱码数据
无论是修改 mysql 配置文件或是修改库、表字符集,都无法改变已经变成乱码的数据。
只能删除数据重新插入或更新数据才可以完全解决

10.设置大小写不敏感

①查看大小写是否敏感:show variables like ‘%lower_case_table_names%’ windows
系统默认大小写不敏感,但是 linux 系统是大小写敏感的

②设置大小写不敏感:在 my.cnf 这个配置文件 [mysqld] 中加入 lower_case_table_names = 1 ,然后重启服务器

注意:如果要设置属性为大小写不敏感,要在重启数据库实例之前就需要将原来的数据库和表转换为小写,否则将找不到数据库名。
在进行数据库参数设置之前,需要掌握这个参数带来的影响,切不可盲目设置。

11.sql_mode

sql_mode 定义了对 Mysql 中 sql 语句语法的校验规则!
sql_mode 是个很容易被忽视的变量,默认值是空值,在这种设置下是可以允许一些非法操作的,比如允许一些 非法数据的插入。在生产环境必须将这个值设置为严格模式,所以开发、测试环境的数据库也必须要设置,这样在 开发测试阶段就可以发现问题。

sql_mode 常用的值
ONLY_FULL_GROUP_BY 对于 GROUP BY 聚合操作,如果在 SELECT 中的列,没有在 GROUP BY 中出现,那么这个 SQL 是不合法的,因为列不在 GROUP BY 从句中
NO_AUTO_VALUE_ON_ZERO 该值影响自增长列的插入。默认设置下,插入 0 或 NULL 代表生成下一个自增 长值。如果用户 希望插入的值为 0,而该列又是自增长的,那么这个选项就有用了
STRICT_TRANS_TABLES 在该模式下,如果一个值不能插入到一个事务表中,则中断当前的操作,对非事务表不做限制
NO_ZERO_IN_DATE 在严格模式下,不允许日期和月份为零
NO_ZERO_DATE 设置该值,mysql 数据库不允许插入零日期,插入零日期会抛出错误而不是警告
ERROR_FOR_DIVISION_BY_ZERO 在 INSERT 或 UPDATE 过程中,如果数据被零除,则产生错误而非警告。如果未给出该模式,那么数据被零除时 MySQL 返回 NULL
NO_AUTO_CREATE_USER 禁止 GRANT 创建密码为空的用户
NO_ENGINE_SUBSTITUTION 如果需要的存储引擎被禁用或未编译,那么抛出错误。不设置此值时,用默认的存储引擎替代,并抛出一个异常
PIPES_AS_CONCAT 将"||"视为字符串的连接操作符而非或运算符,这和 Oracle 数据库是一样的,也和字符串的拼接函数 Concat 相类似
ANSI_QUOTES 启用 ANSI_QUOTES 后,不能用双引号来引用字符串,因为它被解释为识别符
ORACLE 设置等同于PIPES_AS_CONCAT, ANSI_QUOTES, IGNORE_SPACE, NO_KEY_OPTIONS, NO_TABLE_OPTIONS, NO_FIELD_OPTIONS, NO_AUTO_CREATE_USER

2.6.2 查看和修改
①查看当前的 sql_mode:
select @@sql_mode;
②sql_mode 的影响案例:group by 查询语法错误!
CREATE TABLE mytbl2 (id INT,NAME VARCHAR(200),age INT,dept INT);
INSERT INTO mytbl2 VALUES(1,‘zhang3’,33,101);
INSERT INTO mytbl2 VALUES(2,‘li4’,34,101);
INSERT INTO mytbl2 VALUES(3,‘wang5’,34,102);
INSERT INTO mytbl2 VALUES(4,‘zhao6’,34,102);
INSERT INTO mytbl2 VALUES(5,‘tian7’,36,102);
查询每个 dept 中年龄最大的人:SELECT NAME,dept,MAX(age) FROM mytbl2 GROUP BY dept;
正 确 写 法 :
SELECT id,name,ab.dept,ab.maxage FROM mytbl2 m INNER JOIN(SELECT dept,MAX(age)maxage FROM mytbl2 GROUP BY dept)ab ON ab.dept=m.dept AND m.age=ab.maxage;
③临时修改 sql_mode: set @@sql_mode=’’;
④永久修改,需要在配置文件 my.cnf 中修改:
[mysqld] 下添加 sql_mode=’’ 然后重启 mysql 即可

十五、Mysql用户和管理权限

1.相关命令

create user zhang3
identified by ‘123123’;
创建名称为 zhang3 的用户,密码设为 123123;

select host,user,password,select_priv,insert_priv,drop_priv
from mysql.user;
查看用户和权限的相关信息

set password =password(‘123456’)
修改当前用户的密码

update mysql.user
set password=password(‘123456’)
where user=‘li4’;
修改其他用户的密码
所有通过user 表的修改,必须用 flush privileges;命令才能生效

update mysql.user set user=‘li4’ where user=‘wang5’;
修改用户名
所有通过 user 表的修改,必须用 flush privileges;命令才能生效

drop user li4
删除用户
不要通过 delete from user u where user=‘li4’ 进行删除,系统会有残留信息保留。

2.实例说明

select host,user,password,select_priv,insert_priv,drop_priv
from mysql.user;

host :表示连接类型
% 表示所有远程通过 TCP 方式的连接
IP 地址 如 (192.168.1.2,127.0.0.1) 通过制定 ip 地址进行的 TCP 方式的连接机器名 通过制定 i 网络中的机器名进行的 TCP 方式的连接
::1 IPv6 的本地 ip 地址 等同于 IPv4 的 127.0.0.1
localhost 本地方式通过命令行方式的连接 ,比如 mysql -u xxx -p 123xxx 方式的连接。
user:表示用户名
同一用户通过不同方式链接的权限是不一样的。
password:密码
所有密码串通过 password(明文字符串) 生成的密文字符串。加密算法为 MYSQLSHA1 ,不可逆 。
mysql 5.7 的密码保存到 authentication_string 字段中不再使用 password 字段。
select_priv , insert_priv 等
为该用户所拥有的权限。

3.授予权限

grant 权限 1,权限 2,…权限 n
on 数据库名称. 表名称
to 用户名@用户地址
identified by ‘连接口令’
该权限如果发现没有该用户,则会直接新建一个用户。
示例:
grant select,insert,delete,drop
on atguigudb.*
to li4@localhost ;
给 li4 用户用本地命令行方式下,授予 atguigudb 这个库下的所有
表的插删改查的权限。

grant all privileges on .
to joe@’%’
identified by ‘123’;
授予通过网络方式登录的的 joe 用户 ,对所有库所有表的全部权限,密码设为 123.

4.收回权限

show grants 查看当前用户权限

revoke [权限 1,权限 2,…权限 n]
on 库名.表名
from 用户名@用户地址 ;
收回权限命令

REVOKE ALL PRIVILEGES
ON mysql.*
FROM joe@localhost;
收回全库全表的所有权限
REVOKE select,insert,update,delete
ON mysql.*
FROM joe@localhost;
收回 mysql 库下的所有表的插删改查权限

权限收回后,必须用户重新登录后,才能生效。

5.查看权限

show grants; 查看当前用户权限
select * from user ;

十六、逻辑框架简介

1.mysql整体框架

和其它数据库相比,MySQL 有点与众不同,它的架构可以在多种不同场景中应用并发挥良好作用。主要体现在存储引擎的架构上,插件式的存储引擎架构将查询处理和其它的系统任务以及数据的存储提取相分离。这种架构可以根据业务的需求和实际需要选择合适的存储引擎。
连接层、服务层、引擎层、存储层

1.1连接层

最上层是一些客户端和连接服务,包含本地 sock 通信和大多数基于客户端/服务端工具实现的类似于 tcp/ip 的通信。
主要完成一些类似于连接处理、授权认证、及相关的安全方案。
在该层上引入了线程池的概念,为通过认证安全接入的客户端提供线程。同样在该层上可以实现基于 SSL 的安全链接。服务器也会为安全接入的每个客户端验证它所具有的操作权限。

1.2 服务层

Management Serveices & Utilities 系统管理和控制工具
SQL Interface: SQL 接口。
接受用户的 SQL 命令,并且返回用户需要查询的结果。
比如 select from 就是调用 SQL Interface
Parser 解析器。
SQL 命令传递到解析器的时候会被解析器验证和解析
Optimizer 查询优化器。
SQL 语句在查询之前会使用查询优化器对查询进行优化,比如有 where 条件时,优化器来决定先投影还是先过滤。
Cache 和 Buffer 查询缓存。
如果查询缓存有命中的查询结果,查询语句就可以直接去查询缓存中取数据。这个缓存机制是由一系列小缓存组成的。比如表缓存,记录缓存,key 缓存,权限缓存等

1.3.引擎层

存储引擎层,存储引擎真正的负责了 MySQL 中数据的存储和提取,服务器通过 API 与存储引擎进行通信。不同的存储引擎具有的功能不同,这样我们可以根据自己的实际需要进行选取。

1.4.存储层

数据存储层,主要是将数据存储在运行于裸设备的文件系统之上,并完成与存储引擎的交互。

2.profile

show profile
查看sql执行周期

2.1 开启 profile

查看 profile 是否开启:show variables like ‘%profiling%’
如果没有开启,可以执行 set profiling=1 开启!

2.2 使用 profile

执行 show prifiles 命令,可以查看最近的几次查询。
根据 Query_ID,可以进一步执行 show profile cpu,block io for query Query_id 来查看 sql 的具体执行步骤。

3.大致的查询流程

mysql 客户端通过协议与 mysql 服务器建连接,发送查询语句,先检查查询缓存,如果命中,直接返回结果,
否则进行语句解析,也就是说,在解析查询之前,服务器会先访问查询缓存(query cache)——它存储 SELECT 语句以及相应的查询结果集。如果某个查询结果已经位于缓存中,服务器就不会再对查询进行解析、优化、以及执行。它仅仅将缓存中的结果返回给用户即可,这将大大提高系统的性能。

语法解析器和预处理:首先 mysql 通过关键字将 SQL 语句进行解析,并生成一颗对应的“解析树”。mysql 解析器将使用 mysql 语法规则验证和解析查询;预处理器则根据一些 mysql 规则进一步检查解析数是否合法。
查询优化器当解析树被认为是合法的了,并且由优化器将其转化成执行计划。一条查询可以有很多种执行方式,最后都返回相同的结果。优化器的作用就是找到这其中最好的执行计划。

然后,mysql 默认使用的 BTREE 索引,并且一个大致方向是:无论怎么折腾 sql,至少在目前来说,mysql 最多只用到表中的一个索引。

4.SQL 的执行顺序

手写的顺序:
Mysql详解_第25张图片
真正执行的顺序:
随着 Mysql 版本的更新换代,其优化器也在不断的升级,优化器会分析不同执行顺序产生的性能消耗不同而动态调整执行顺序。

5.数据库引擎:myISAM和InnoDB

对比项 MyISAM InnoBD
外键 不支持 支持
事务 不支持 支持
行表锁 表锁,即使操作一条记录也会锁住整个表,不适合高并发的操作 行锁,操作时只锁某一行,不对其他行有影响,适合高并发的操作
缓存 只缓存索引,不缓存真实数据 不仅缓存索引还要缓存真实数据,对内存要求较高,而且内存大小对性能有决定性的影响
关注点 读性能 并发写、事务、资源
默认安装 y y
默认使用 n y
自带系统表使用 y n

show engines:查看所有的数据库引擎
show variables like ‘%storage_engine%’ 查看默认的数据库引擎

十七、SQL预热

1.常见的Join查询图

Mysql详解_第26张图片

2.案例

十八、索引优化分析

1.什么是索引?

MySQL 官方对索引的定义为:索引(Index)是帮助 MySQL 高效获取数据的数据结构。可以得到索引的本质:
索引是数据结构。可以简单理解为排好序的快速查找数据结构。
在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法。这种数据结构,就是索引。下图就是一种可能的索引方式示例:
Mysql详解_第27张图片
左边是数据表,一共有两列七条记录,最左边的是数据记录的物理地址。为了加快 Col2 的查找,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针。
这样就可以运用二叉查找在一定的复杂度内获取到相应数据,从而快速的检索出符合条件的记录。
一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储的磁盘上。

2.索引的优缺点

优势:
 提高数据检索的效率,降低数据库的IO成本。
 通过索引列对数据进行排序,降低数据排序的成本,降低了CPU的消耗。
劣势:
 虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行INSERT、UPDATE和DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息。
 实际上索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录,所以索引列也是要占用空间的。

3.Btree索引

MySQL 使用的是 Btree 索引。
Mysql详解_第28张图片
【初始化介绍】
一颗 b 树,浅蓝色的块我们称之为一个磁盘块,可以看到每个磁盘块包含几个数据项(深蓝色所示)和指针(黄色所示),如磁盘块 1 包含数据项 17 和 35,包含指针 P1、P2、P3,
P1 表示小于 17 的磁盘块,P2 表示在 17 和 35 之间的磁盘块,P3 表示大于 35 的磁盘块。
真实的数据存在于叶子节点即 3、5、9、10、13、15、28、29、36、60、75、79、90、99。
非叶子节点不存储真实的数据,只存储指引搜索方向的数据项,如 17、35 并不真实存在于数据表中。
【查找过程】
如果要查找数据项 29,那么首先会把磁盘块 1 由磁盘加载到内存,此时发生一次 IO,在内存中用二分查找确定 29
在 17 和 35 之间,锁定磁盘块 1 的 P2 指针,内存时间因为非常短(相比磁盘的 IO)可以忽略不计,通过磁盘块 1
的 P2 指针的磁盘地址把磁盘块 3 由磁盘加载到内存,发生第二次 IO,29 在 26 和 30 之间,锁定磁盘块 3 的 P2 指
针,通过指针加载磁盘块 8 到内存,发生第三次 IO,同时内存中做二分查找找到 29,结束查询,总计三次 IO。
真实的情况是,3 层的 b+树可以表示上百万的数据,如果上百万的数据查找只需要三次 IO,性能提高将是巨大的,
如果没有索引,每个数据项都要发生一次 IO,那么总共需要百万次的 IO,显然成本非常非常高。

4.B+tree索引

Mysql详解_第29张图片
B+Tree 与 B-Tree 的区别
1)B-树的关键字和记录是放在一起的,叶子节点可以看作外部节点,不包含任何信息;
B+树的非叶子节点中只有关键字和指向下一个节点的索引,记录只放在叶子节点中。
2)在 B-树中,越靠近根节点的记录查找时间越快,只要找到关键字即可确定记录的存在;而 B+树中每个记录的查找时间基本是一样的,都需要从根节点走到叶子节点,而且在叶子节点中还要再比较关键字。

从这个角度看 B-树的性能好像要比 B+树好,而在实际应用中却是 B+树的性能要好些。因为 B+树的非叶子节点不存放实际的数据,这样每个节点可容纳的元素个数比 B-树多,树高比 B-树小,这样带来的好处是减少磁盘访问次数。尽管 B+树找到 一个记录所需的比较次数要比 B-树多,但是一次磁盘访问的时间相当于成百上千次内存比较的时间,因此实际中B+树的性能可能还会好些,而且 B+树的叶子节点使用指针连接在一起,方便顺序遍历(例如查看一个目录下的所有文件,一个表中的所有记录等),这也是很多数据库和文件系统使用 B+树的缘故。

思考:为什么说 B+树比 B-树更适合实际应用中操作系统的文件索引和数据库索引?

  1. B+树的磁盘读写代价更低
    B+树的内部结点并没有指向关键字具体信息的指针。因此其内部结点相对 B 树更小。如果把所有同一内部结点的关键字存放在同一盘块中,那么盘块所能容纳的关键字数量也越多。一次性读入内存中的需要查找的关键字也就越多。相对来说 IO 读写次数也就降低了。
  2. B+树的查询效率更加稳定
    由于非终结点并不是最终指向文件内容的结点,而只是叶子结点中关键字的索引。所以任何关键字的查找必须 走一条从根结点到叶子结点的路。所有关键字查询的路径长度相同,导致每一个数据的查询效率相当。

5.聚簇索引和非聚簇索引

聚簇索引并不是一种单独的索引类型,而是一种数据存储方式。
术语‘聚簇’表示数据行和相邻的键值聚簇的存储在一起。如下图,左侧的索引就是聚簇索引,因为数据行在磁盘的排列和索引排序保持一致。

聚簇索引的好处:

按照聚簇索引排列顺序,查询显示一定范围数据的时候,由于数据都是紧密相连,数据库不不用从多个数据块中提取数据,所以节省了大量的 io 操作。

聚簇索引的限制:

对于 mysql 数据库目前只有 innodb 数据引擎支持聚簇索引,而 Myisam 并不支持聚簇索引。
由于数据物理存储排序方式只能有一种,所以每个 Mysql 的表只能有一个聚簇索引。一般情况下就是该表的主键。

为了充分利用聚簇索引的聚簇的特性,所以 innodb 表的主键列尽量选用有序的顺序 id,而不建议用无序的 id,比如 uuid 这种。

6.时间复杂度(扩展)

同一问题可用不同算法解决,而一个算法的质量优劣将影响到算法乃至程序的效率。算法分析的
目的在于选择合适算法和改进算法。
时间复杂度是指执行算法所需要的计算工作量,用大 O 表示记为:O(…)

7.Mysql 索引分类

单值索引

概念:即一个索引只包含单个列,一个表可以有多个单列索引
语法:
所表一起创建:
CREATE TABLE customer (
id INT(10) UNSIGNED AUTO_INCREMENT ,
customer_no VARCHAR(200),
customer_name VARCHAR(200),
PRIMARY KEY(id),
KEY (customer_name)
);
单独建单值索引:
CREATE INDEX idx_customer_name ON customer(customer_name);

唯一索引

概念:索引列的值必须唯一,但允许有空值
随表一起创建:
CREATE TABLE customer (
id INT(10) UNSIGNED AUTO_INCREMENT ,
customer_no VARCHAR(200),
customer_name VARCHAR(200),
PRIMARY KEY(id),
KEY (customer_name),
UNIQUE (customer_no)
);
单独建唯一索引:
CREATE UNIQUE INDEX idx_customer_no ON customer(customer_no);

主键索引

概念:设定为主键后数据库会自动建立索引,innodb为聚簇索引
随表一起建索引
CREATE TABLE customer (
id INT(10) UNSIGNED AUTO_INCREMENT ,
customer_no VARCHAR(200),
customer_name VARCHAR(200),
PRIMARY KEY(id)
);
单独建主键索引:
ALTER TABLE customer add PRIMARY KEY customer(customer_no);
删除建主键索引:
ALTER TABLE customer drop PRIMARY KEY ;
修改建主键索引:
必须先删除掉(drop)原索引,再新建(add)索引

复合索引

概念:即一个索引包含多个列
随表一起建索引:
CREATE TABLE customer (
id INT(10) UNSIGNED AUTO_INCREMENT ,
customer_no VARCHAR(200),
customer_name VARCHAR(200),
PRIMARY KEY(id),
KEY (customer_name),
UNIQUE (customer_name),
KEY (customer_no,customer_name)
);
单独建索引:
CREATE INDEX idx_no_name ON customer(customer_no,customer_name);

8.索引的基本语法

创建 CREATE [UNIQUE ] INDEX [indexName] ON table_name(column))
删除 DROP INDEX [indexName] ON mytable;
查看 SHOW INDEX FROM table_name\G
使用 Alter 命令
ALTER TABLE tbl_name ADD PRIMARY KEY (column_list) : 该语句添加一个主键,这意味着索引值必须是唯一的,且不能为 NULL。
ALTER TABLE tbl_name ADD PRIMARY KEY (column_list)
ALTER TABLE tbl_name ADD INDEX index_name (column_list): 添加普通索引,索引值可出现多次。
ALTER TABLE tbl_name ADD FULLTEXT index_name (column_list):该语句指定了索引为 FULLTEXT ,用于全文索引。

9.索引的创建时机

适合创建索引的情况
 主键自动建立唯一索引;
 频繁作为查询条件的字段应该创建索引
 查询中与其它表关联的字段,外键关系建立索引
 单键/组合索引的选择问题, 组合索引性价比更高
 查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度
 查询中统计或者分组字段

不适合创建索引的情况
 表记录太少
 经常增删改的表或者字段Where 条件里用不到的字段不创建索引
 过滤性不好的不适合建索引

十九、ExPlain性能分析

1.ExPlain关键字

使用 EXPLAIN 关键字可以模拟优化器执行 SQL 查询语句,从而知道 MySQL 是如何处理你的 SQL 语句的。分析你的查询语句或是表结构的性能瓶颈。
用法: Explain+SQL 语句。
Explain 执行后返回的信息:

2. Explain 准备工作

CREATE TABLE t1(id INT(10) AUTO_INCREMENT,content VARCHAR(100) NULL , PRIMARY KEY (id));
CREATE TABLE t2(id INT(10) AUTO_INCREMENT,content VARCHAR(100) NULL , PRIMARY KEY (id));
CREATE TABLE t3(id INT(10) AUTO_INCREMENT,content VARCHAR(100) NULL , PRIMARY KEY (id));
CREATE TABLE t4(id INT(10) AUTO_INCREMENT,content VARCHAR(100) NULL , PRIMARY KEY (id));
INSERT INTO t1(content) VALUES(CONCAT(‘t1_’,FLOOR(1+RAND()*1000)));
INSERT INTO t2(content) VALUES(CONCAT(‘t2_’,FLOOR(1+RAND()*1000)));
INSERT INTO t3(content) VALUES(CONCAT(‘t3_’,FLOOR(1+RAND()*1000)));
INSERT INTO t4(content) VALUES(CONCAT(‘t4_’,FLOOR(1+RAND()*1000)));

2.id

select 查询的序列号,包含一组数字,表示查询中执行 select 子句或操作表的顺序。
①id 相同,执行顺序由上至下

②id 不同,如果是子查询,id 的序号会递增,id 值越大优先级越高,越先被执行

③有相同也有不同

id 如果相同,可以认为是一组,从上往下顺序执行;
在所有组中,id 值越大,优先级越高,越先执行衍生 = DERIVED

关注点:id 号每个号码,表示一趟独立的查询。一个 sql 的查询趟数越少越好。

3.select_type

select_type 代表查询的类型,主要是用于区别普通查询、联合查询、子查询等的复杂查询。

select_type 属性
(1)SIMPLE 简单的 select 查询,查询中不包含子查询或者 UNION
SIMPLE 代表单表查询
(2)PRIMARY 查询中若包含任何复杂的子部分,最外层查询则被标记为 Primary
(3)DERIVED 在 FROM 列表中包含的子查询被标记为 DERIVED(衍生) MySQL 会递归执行这些子查询, 把结果放在临时表里。
(4)SUBQUERY 在SELECT或WHERE列表中包含了子查询
(5)DEPEDENT SUBQUERY 在SELECT或WHERE列表中包含了子查询,子查询基于外层
都是 where 后面的条件,subquery 是单个值,dependent subquery 是一组值
(6)UNCACHEABLE SUBQUERY 无法使用缓存的子查询
当使用了@@来引用系统变量的时候,不会使用缓存。
(7)UNION 若第二个SELECT出现在UNION之后,则被标记为UNION; 若UNION包含在FROM子句的子查询中,外层SELECT将被标记为:DERIVED
(8)UNION RESULT 从UNION表获取结果的SELECT

4.table

这个数据是基于哪张表的。

5.type

type 是查询的访问类型。是较为重要的一个指标,结果值从最好到最坏依次是:
system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
一般来说,得保证查询至少达到 range 级别,最好能达到 ref。
system :表只有一行记录(等于系统表),这是 const 类型的特列,平时不会出现,这个也可以忽略不计
const :表示通过索引一次就找到了,const 用于比较 primary key 或者 unique 索引。因为只匹配一行数据,所以很快
如将主键置于 where 列表中,MySQL 就能将该查询转换为一个常量。
eq_ref :唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描。
ref :非唯一性索引扫描,返回匹配某个单独值的所有行.本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体。
没用索引前:
建立索引后:
range :只检索给定范围的行,使用一个索引来选择行。key 列显示使用了哪个索引一般就是在你的 where 语句中出现了 between、<、>、in 等的查询这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,而结束语另一点,不用扫描全部索引。
index :出现index是sql使用了索引但是没用通过索引进行过滤,一般是使用了覆盖索引或者是利用索引进行了排序分组。
all :Full Table Scan,将遍历全表以找到匹配的行。
index_merge :在查询过程中需要多个索引组合使用,通常出现在有 or 的关键字的 sql 中。
ref_or_null :对于某个字段既需要关联条件,也需要 null 值得情况下。查询优化器会选择用 ref_or_null 连接查询。
index_subquery :利用索引来关联子查询,不再全表扫描。
unique_subquery :该联接类型类似于 index_subquery。 子查询中的唯一索引。

备注:一般来说,得保证查询至少达到range级别,最好能达到ref。

6.possible_keys

显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用。

7.key

实际使用的索引。如果为NULL,则没有使用索引。

查询中若使用了覆盖索引,则该索引出现在keyl列表中

8.key_len

表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。 key_len 字段能够帮你检查是否充分的利用上了索引。ken_len 越长,说明索引使用的越充分。
如何计算:
①先看索引上字段的类型+长度比如 int=4 ; varchar(20) =20 ; char(20) =20
②如果是 varchar 或者 char 这种字符串字段,视字符集要乘不同的值,比如 utf-8 要乘 3,GBK 要乘 2,
③varchar 这种动态字符串要加 2 个字节
④允许为空的字段要加 1 个字节
第一组:key_len=age 的字节长度+name 的字节长度=4+1 + ( 20*3+2)=5+62=67
第二组:key_len=age 的字节长度=4+1=5

9.ref

显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值。

10.rows

rows 列显示 MySQL 认为它执行查询时必须检查的行数。越少越好!

11. Extra

其他的额外重要的信息。
Using filesort
说明 mysql 会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL 中无法利用索引完成的排序操作称为“文件排序”。

出现 filesort 的情况:
优化后,不再出现 filesort 的情况:

查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度。

Using temporary
使了用临时表保存中间结果,MySQL 在对查询结果排序时使用临时表。常见于排序 order by 和分组查询 group by。
优化前:
优化后:

Using index
Using index 代表表示相应的 select 操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效率不错!
如果同时出现 using where,表明索引被用来执行索引键值的查找;如果没有同时出现 using where,表明索引只是用来读取数据而非利用索引执行查找。
利用索引进行了排序或分组。

Using where
表明使用了 where 过滤。
Using join buffer
使用了连接缓存。
impossible where
where 子句的值总是 false,不能用来获取任何元组。
select tables optimized away
在没有 GROUPBY 子句的情况下,基于索引优化 MIN/MAX 操作或者对于 MyISAM 存储引擎优化 COUNT(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。
在 innodb 中:
在 Myisam 中:

二十、批量数据脚本(插入数据)

1.建表语句

CREATE TABLE dept (
id INT(11) NOT NULL AUTO_INCREMENT,
deptName VARCHAR(30) DEFAULT NULL,
address VARCHAR(40) DEFAULT NULL,
ceo INT NULL ,
PRIMARY KEY (id)
) ENGINE=INNODB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

CREATE TABLE emp (
id INT(11) NOT NULL AUTO_INCREMENT,
empno INT NOT NULL ,
name VARCHAR(20) DEFAULT NULL,
age INT(3) DEFAULT NULL,
deptId INT(11) DEFAULT NULL,
PRIMARY KEY (id)
#CONSTRAINT fk_dept_id FOREIGN KEY (deptId) REFERENCES t_dept (id)
) ENGINE=INNODB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

2.设置参数

在执行创建函数之前,首先请保证 log_bin_trust_function_creators 参数为 1,即 on 开启状态。
否则会报错:错误代码1416
查询:show variables like ‘log_bin_trust_function_creators’;
设置:set global log_bin_trust_function_creators=1;
当然,如上设置只存在于当前操作,想要永久生效,需要写入到配置文件中:
在[mysqld]中加上 log_bin_trust_function_creators=1

3.编写随机函数

创建函数,保证每条数据都不同。

3.1 随机产生字符串

DELIMITER C R E A T E F U N C T I O N r a n d s t r i n g ( n I N T ) R E T U R N S V A R C H A R ( 255 ) B E G I N D E C L A R E c h a r s s t r V A R C H A R ( 100 ) D E F A U L T ′ a b c d e f g h i j k l m n o p q r s t u v w x y z A B C D E F J H I J K L M N O P Q R S T U V W X Y Z ′ ; D E C L A R E r e t u r n s t r V A R C H A R ( 255 ) D E F A U L T ′ ′ ; D E C L A R E i I N T D E F A U L T 0 ; W H I L E i < n D O S E T r e t u r n s t r = C O N C A T ( r e t u r n s t r , S U B S T R I N G ( c h a r s s t r , F L O O R ( 1 + R A N D ( ) ∗ 52 ) , 1 ) ) ; S E T i = i + 1 ; E N D W H I L E ; R E T U R N r e t u r n s t r ; E N D CREATE FUNCTION rand_string(n INT) RETURNS VARCHAR(255) BEGIN DECLARE chars_str VARCHAR(100) DEFAULT 'abcdefghijklmnopqrstuvwxyz ABCDEFJHIJKLMNOPQRSTUVWXYZ'; DECLARE return_str VARCHAR(255) DEFAULT ''; DECLARE i INT DEFAULT 0; WHILE i < n DO SET return_str =CONCAT(return_str,SUBSTRING(chars_str,FLOOR(1+RAND()*52),1)); SET i = i + 1; END WHILE; RETURN return_str; END CREATEFUNCTIONrandstring(nINT)RETURNSVARCHAR(255)BEGINDECLAREcharsstrVARCHAR(100)DEFAULTabcdefghijklmnopqrstuvwxyzABCDEFJHIJKLMNOPQRSTUVWXYZ;DECLAREreturnstrVARCHAR(255)DEFAULT;DECLAREiINTDEFAULT0;WHILEi<nDOSETreturnstr=CONCAT(returnstr,SUBSTRING(charsstr,FLOOR(1+RAND()52),1));SETi=i+1;ENDWHILE;RETURNreturnstr;END
如果要删除函数,则执行:drop function rand_string;

3.2 随机产生部门编号

#用于随机产生多少到多少的编号
DELIMITER C R E A T E F U N C T I O N r a n d n u m ( f r o m n u m I N T , t o n u m I N T ) R E T U R N S I N T ( 11 ) B E G I N D E C L A R E i I N T D E F A U L T 0 ; S E T i = F L O O R ( f r o m n u m + R A N D ( ) ∗ ( t o n u m − f r o m n u m + 1 ) ) ; R E T U R N i ; E N D CREATE FUNCTION rand_num (from_num INT ,to_num INT) RETURNS INT(11) BEGIN DECLARE i INT DEFAULT 0; SET i = FLOOR(from_num +RAND()*(to_num -from_num+1)) ; RETURN i; END CREATEFUNCTIONrandnum(fromnumINT,tonumINT)RETURNSINT(11)BEGINDECLAREiINTDEFAULT0;SETi=FLOOR(fromnum+RAND()(tonumfromnum+1));RETURNi;END
如果要删除函数:drop function rand_num;

4.创建存储过程

4.1 创建往 emp 表中插入数据的存储过程

DELIMITER KaTeX parse error: Expected 'EOF', got '#' at position 92: …NT DEFAULT 0; #̲set autocommit …
#删除
#DELIMITER ;
#drop PROCEDURE insert_emp;

4.2 创建往 dept 表中插入数据的存储过程

#执行存储过程,往 dept 表添加随机数据
DELIMITER C R E A T E P R O C E D U R E ‘ i n s e r t d e p t ‘ ( m a x n u m I N T ) B E G I N D E C L A R E i I N T D E F A U L T 0 ; S E T a u t o c o m m i t = 0 ; R E P E A T S E T i = i + 1 ; I N S E R T I N T O d e p t ( d e p t n a m e , a d d r e s s , c e o ) V A L U E S ( r a n d s t r i n g ( 8 ) , r a n d s t r i n g ( 10 ) , r a n d n u m ( 1 , 500000 ) ) ; U N T I L i = m a x n u m E N D R E P E A T ; C O M M I T ; E N D CREATE PROCEDURE `insert_dept`( max_num INT ) BEGIN DECLARE i INT DEFAULT 0; SET autocommit = 0; REPEAT SET i = i + 1; INSERT INTO dept ( deptname,address,ceo ) VALUES (rand_string(8),rand_string(10),rand_num(1,500000)); UNTIL i = max_num END REPEAT; COMMIT; END CREATEPROCEDUREinsertdept(maxnumINT)BEGINDECLAREiINTDEFAULT0;SETautocommit=0;REPEATSETi=i+1;INSERTINTOdept(deptname,address,ceo)VALUES(randstring(8),randstring(10),randnum(1,500000));UNTILi=maxnumENDREPEAT;COMMIT;ENDJAVAEE
#删除
#DELIMITER ;
#drop PROCEDURE insert_dept;

5.调用存储过程

1.5.1 添加数据到部门表
#执行存储过程,往 dept 表添加 1 万条数据
DELIMITER ;
CALL insert_dept(10000);
1.5.2 添加数据到员工表
#执行存储过程,往 emp 表添加 50 万条数据
DELIMITER ;
CALL insert_emp(100000,500000);

6.批量删除某个表上的所有索引

6.1 删除索引的存储过程

DELIMITER C R E A T E P R O C E D U R E ‘ p r o c d r o p i n d e x ‘ ( d b n a m e V A R C H A R ( 200 ) , t a b l e n a m e V A R C H A R ( 200 ) ) B E G I N D E C L A R E d o n e I N T D E F A U L T 0 ; D E C L A R E c t I N T D E F A U L T 0 ; D E C L A R E i n d e x V A R C H A R ( 200 ) D E F A U L T ′ ′ ; D E C L A R E c u r C U R S O R F O R S E L E C T i n d e x n a m e F R O M i n f o r m a t i o n s c h e m a . S T A T I S T I C S W H E R E t a b l e s c h e m a = d b n a m e A N D t a b l e n a m e = t a b l e n a m e A N D s e q i n i n d e x = 1 A N D i n d e x n a m e < > ′ P R I M A R Y ′ ; D E C L A R E C O N T I N U E H A N D L E R F O R N O T F O U N D s e t d o n e = 2 ; O P E N c u r ; F E T C H c u r I N T O i n d e x ; W H I L E i n d e x < > ′ ′ D O S E T @ s t r = C O N C A T ( " d r o p i n d e x " , i n d e x , " o n " , t a b l e n a m e ) ; P R E P A R E s q l s t r F R O M @ s t r ; E X E C U T E s q l s t r ; D E A L L O C A T E P R E P A R E s q l s t r ; S E T i n d e x = ′ ′ ; F E T C H c u r I N T O i n d e x ; E N D W H I L E ; C L O S E c u r ; E N D CREATE PROCEDURE `proc_drop_index`(dbname VARCHAR(200),tablename VARCHAR(200)) BEGIN DECLARE done INT DEFAULT 0; DECLARE ct INT DEFAULT 0; DECLARE _index VARCHAR(200) DEFAULT ''; DECLARE _cur CURSOR FOR SELECT index_name FROM information_schema.STATISTICS WHERE table_schema=dbname AND table_name=tablename AND seq_in_index=1 AND index_name <>'PRIMARY' ; DECLARE CONTINUE HANDLER FOR NOT FOUND set done=2 ; OPEN _cur; FETCH _cur INTO _index; WHILE _index<>'' DO SET @str = CONCAT("drop index ",_index," on ",tablename ); PREPARE sql_str FROM @str ; EXECUTE sql_str; DEALLOCATE PREPARE sql_str; SET _index=''; FETCH _cur INTO _index; END WHILE; CLOSE _cur; END CREATEPROCEDUREprocdropindex(dbnameVARCHAR(200),tablenameVARCHAR(200))BEGINDECLAREdoneINTDEFAULT0;DECLAREctINTDEFAULT0;DECLAREindexVARCHAR(200)DEFAULT;DECLAREcurCURSORFORSELECTindexnameFROMinformationschema.STATISTICSWHEREtableschema=dbnameANDtablename=tablenameANDseqinindex=1ANDindexname<>PRIMARY;DECLARECONTINUEHANDLERFORNOTFOUNDsetdone=2;OPENcur;FETCHcurINTOindex;WHILEindex<>DOSET@str=CONCAT("dropindex",index,"on",tablename);PREPAREsqlstrFROM@str;EXECUTEsqlstr;DEALLOCATEPREPAREsqlstr;SETindex=;FETCHcurINTOindex;ENDWHILE;CLOSEcur;END

6.2 执行存储过程

调用:CALL proc_drop_index(“dbname”,“tablename”);

二十一、表单使用索引——常见的索引失效

1.全值匹配我最爱

1.1 有以下 SQL 语句
EXPLAIN SELECT SQL_NO_CACHE * FROM emp WHERE emp.age=30
EXPLAIN SELECT SQL_NO_CACHE * FROM emp WHERE emp.age=30 and deptid=4
EXPLAIN SELECT SQL_NO_CACHE * FROM emp WHERE emp.age=30 and deptid=4 AND emp.name = ‘abcd’
1.2 建立索引
CREATE INDEX idx_age_deptid_name ON emp(age,deptid,NAME);
结论:全职匹配我最爱指的是,查询的字段按照顺序在索引中都可以匹配到!
SQL 中查询字段的顺序,跟使用索引中字段的顺序,没有关系。优化器会在不影响 SQL 执行结果的前提下,给你自动地优化。

2.最佳左前缀法则

查询字段与索引字段顺序的不同会导致,索引无法充分使用,甚至索引失效!
原因:使用复合索引,需要遵循最佳左前缀法则,即如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列。
结论:过滤条件要使用索引必须按照索引建立时的顺序,依次满足,一旦跳过某个字段,索引后面的字段都无法被使用。

3.不要在索引列上做任何计算

不在索引列上做任何操作(计算、函数、(自动 or 手动)类型转换),会导致索引失效而转向全表扫描。
3.1 在查询列上使用了函数
EXPLAIN SELECT SQL_NO_CACHE * FROM emp WHERE age=30;
EXPLAIN SELECT SQL_NO_CACHE * FROM emp WHERE LEFT(age,3)=30;
结论:等号左边无计算!
3.2 在查询列上做了转换
create index idx_name on emp(name);
explain select sql_no_cache * from emp where name=‘30000’;
explain select sql_no_cache * from emp where name=30000;
字符串不加单引号,则会在 name 列上做一次转换!
结论:等号右边无转换!

4.索引列上不能有范围查询

explain SELECT SQL_NO_CACHE * FROM emp WHERE emp.age=30 and deptid=5 AND emp.name = ‘abcd’;
explain SELECT SQL_NO_CACHE * FROM emp WHERE emp.age=30 and deptid<=5 AND emp.name = ‘abcd’;
建议:将可能做范围查询的字段的索引顺序放在最后

5.尽量使用覆盖索引

即查询列和索引列一致,不要写 select *!

explain SELECT SQL_NO_CACHE * FROM emp WHERE emp.age=30 and deptId=4 and name=‘XamgXt’;
explain SELECT SQL_NO_CACHE age,deptId,name FROM emp WHERE emp.age=30 and deptId=4 and name=‘XamgXt’;
6.使用不等于(!= 或者<>)的时候
mysql 在使用不等于(!= 或者<>)时,有时会无法使用索引会导致全表扫描。

7. 字段的 is not null 和 is null

当字段允许为 Null 的条件下:
is not null 用不到索引,is null 可以用到索引。

8. like 的前后模糊匹配

前缀不能出现模糊匹配!

9. 减少使用 or

使用 union all 或者 union 来替代:

10. 练习

假设 index(a,b,c);
Where 语句 索引是否被使用
where a = 3 Y,使用到 a
where a = 3 and b = 5 Y,使用到 a,b
where a = 3 and b = 5 and c = 4 Y,使用到 a,b,c
where b = 3 或者 where b = 3 and c = 4 或者
where c = 4
N
where a = 3 and c = 5 使用到 a, 但是 c 不可以,b 中间断了
where a = 3 and b > 4 and c = 5 使用到 a 和 b, c 不能用在范围之后,b 断了
where a is null and b is not null is null 支持索引 但是 is not null 不支持,所
以 a 可以使用索引,但是 b 不可以使用
where a <> 3 不能使用索引
where abs(a) =3 不能使用 索引
where a = 3 and b like ‘kk%’ and c = 4 Y,使用到 a,b,c
where a = 3 and b like ‘%kk’ and c = 4 Y,只用到 a
where a = 3 and b like ‘%kk%’ and c = 4 Y,只用到 a
where a = 3 and b like ‘k%kk%’ and c = 4 Y,使用到 a,b,c

11. 口诀

全职匹配我最爱,最左前缀要遵守;
带头大哥不能死,中间兄弟不能断;
索引列上少计算,范围之后全失效;
LIKE 百分写最右,覆盖索引不写*;
不等空值还有 OR,索引影响要注意;
VAR 引号不可丢,SQL 优化有诀窍。

二十二、关联查询优化

1.建表语句

CREATE TABLE IF NOT EXISTS class (
id INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,
card INT(10) UNSIGNED NOT NULL,
PRIMARY KEY (id)
);
CREATE TABLE IF NOT EXISTS book (
bookid INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,
card INT(10) UNSIGNED NOT NULL,
PRIMARY KEY (bookid)
);
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO class(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));
INSERT INTO book(card) VALUES(FLOOR(1 + (RAND() * 20)));

2.left join 优化

①EXPLAIN SELECT * FROM class LEFT JOIN book ON class.card = book.card;

②如何优化?在哪个表上建立索引?
ALTER TABLE book ADD INDEX idx_card( card);

③删除 book 表的索引:drop index idx_card on book;
在 class 表上建立索引:alter table class add index idx_card(card);

结论:

①在优化关联查询时,只有在被驱动表上建立索引才有效!
②left join 时,左侧的为驱动表,右侧为被驱动表!

3.inner join 优化

①EXPLAIN SELECT * FROM book inner join class on class.card=book.card;

②两个查询字段调换顺序,发现结果也是一样的!
③在 book 表中,删除 9 条记录
④结论:inner join 时,mysql 会自己帮你把小结果集的表选为驱动表。
⑤straight_join: 效果和 inner join 一样,但是会强制将左侧作为驱动表!

4.四个关联查询案例分析

EXPLAIN SELECT ed.name '人物',c.name '掌门' 
FROM (
SELECT e.name,d.ceo 
from t_emp e
LEFT JOIN t_dept d 
on e.deptid=d.id) ed 
LEFT JOIN t_emp c on ed.ceo= c.id; 

EXPLAIN SELECT e.name '人物',tmp.name '掌门' 
FROM t_emp e LEFT JOIN (
SELECT d.id did,e.name 
FROM t_dept d LEFT JOIN t_emp e 
ON d.ceo=e.id)
tmp ON e.deptId=tmp.did; 

上述两个案例,第一个查询效率较高,且有优化的余地。第二个案例中,子查询作为被驱动表,由于子查询是虚表,
无法建立索引,因此不能优化。

结论:

子查询尽量不要放在被驱动表,有可能使用不到索引;
left join时,尽量让实体表作为被驱动表。

EXPLAIN SELECT e1.name '人物',e2.name '掌门' 
FROM t_emp e1 
LEFT JOIN t_dept d on e1.deptid = d.id 
LEFT JOIN t_emp e2 on d.ceo = e2.id ; 

Explain SELECT e2.name '人物', 
(
SELECT e1.name 
FROM t_emp e1 
where e1.id= d.ceo) '掌门' 
from t_emp e2 LEFT JOIN t_dept d on e2.deptid=d.id; 

结论:能够直接多表关联的尽量直接关联,不用子查询!

二十三、子查询优化

  1. 案例
    取所有不为掌门人的员工,按年龄分组!
    select age as ‘年龄’, count() as ‘人数’ from t_emp where id not in
    (select ceo from t_dept where ceo is not null) group by age;
    如何优化?
    ①解决 dept 表的全表扫描,建立 ceo 字段的索引:此时,再次查询:
    ②进一步优化,替换 not in。
    上述 SQL 可以替换为:
    select age as ‘年龄’,count(
    ) as ‘人数’
    from emp e
    left join dept d
    on e.id=d.ceo
    where d.id is null
    group by age;
    结论: 在范围判断时,尽量不要使用 not in 和 not exists,使用 left join on xxx is null 代替。

二十四、排序分组优化

where 条件和 on 的判断这些过滤条件,作为优先优化的部门,是要被先考虑的!其次,如果有分组和排序,那么也要考虑 grouo by 和 order by。

1. 无过滤不索引

create index idx_age_deptid_name on emp (age,deptid,name);
explain select * from emp where age=40 order by deptid;
explain select * from emp order by age,deptid;
explain select * from emp order by age,deptid limit 10;
using filesort 说明进行了手工排序!原因在于没有 where 作为过滤条件!
结论: 无过滤,不索引。where,limt 都相当于一种过滤条件,所以才能使用上索引!

2. 顺序错,必排序

①explain select * from emp where age=45 order by deptid,name;
②explain select * from emp where age=45 order by deptid,empno;
empno 字段并没有建立索引,因此也无法用到索引,此字段需要排序!
③explain select * from emp where age=45 order by name,deptid;
where 两侧列的顺序可以变换,效果相同,但是 order by 列的顺序不能随便变换!
④explain select * from emp where deptid=45 order by age;
deptid 作为过滤条件的字段,无法使用索引,因此排序没法用上索引

3. 方向反,必排序

①explain select * from emp where age=45 order by deptid desc, name desc ;
如果可以用上索引的字段都使用正序或者逆序,实际上是没有任何影响的,无非将结果集调换顺序。
②explain select * from emp where age=45 order by deptid asc, name desc ;
如果排序的字段,顺序有差异,就需要将差异的部分,进行一次倒置顺序,因此还是需要手动排序的!

4. 索引的选择

①首先,清除 emp 上面的所有索引,只保留主键索引!
drop index idx_age_deptid_name on emp;
②查询:年龄为 30 岁的,且员工编号小于 101000 的用户,按用户名称排序
explain SELECT SQL_NO_CACHE * FROM emp WHERE age =30 AND empno <101000 ORDER BY NAME ;
③全表扫描肯定是不被允许的,因此我们要考虑优化。
思路:首先需要让 where 的过滤条件,用上索引;
查询中,age.empno 是查询的过滤条件,而 name 则是排序的字段,因此我们来创建一个此三个字段的复合索引:
create index idx_age_empno_name on emp(age,empno,name);
再次查询,发现 using filesort 依然存在。
原因: empno 是范围查询,因此导致了索引失效,所以 name 字段无法使用索引排序。
所以,三个字段的符合索引,没有意义,因为 empno 和 name 字段只能选择其一!
④解决: 鱼与熊掌不可兼得,因此,要么选择 empno,要么选择 name
drop index idx_age_empno_name on emp;
create index idx_age_name on emp(age,name);
create index idx_age_empno on emp(age,empno);
两个索引同时存在,mysql 会选择哪个?
explain SELECT SQL_NO_CACHE * FROM emp use index(idx_age_name) WHERE age =30 AND empno <101000 ORDER BY NAME ;
原因:所有的排序都是在条件过滤之后才执行的,所以如果条件过滤了大部分数据的话,几百几千条数据进行排序其实并不是很消耗性能,即使索引优化了排序但实际提升性能很有限。 相对的 empno<101000 这个条件如果没
有用到索引的话,要对几万条的数据进行扫描,这是非常消耗性能的,使用 empno 字段的范围查询,过滤性更好(empno 从 100000 开始)!
结论: 当范围条件和 group by 或者 order by 的字段出现二选一时 ,优先观察条件字段的过滤数量,如果过滤的数据足够多,而需要排序的数据并不多时,优先把索引放在范围字段上。反之,亦然。

5. using filesort

5.1 mysql 的排序算法

①双路排序
MySQL 4.1 之前是使用双路排序,字面意思就是两次扫描磁盘,最终得到数据,读取行指针和 orderby 列,对他 们进行排序,然后扫描已经排序好的列表,按照列表中的值重新从列表中读取对应的数据输出。
从磁盘取排序字段,在 buffer 进行排序,再从磁盘取其他字段。
简单来说,取一批数据,要对磁盘进行了两次扫描,众所周知,I\O 是很耗时的,所以在 mysql4.1 之后,出现了第二种改进的算法,就是单路排序。
②单路排序
从磁盘读取查询需要的所有列,按照 order by 列在 buffer 对它们进行排序,然后扫描排序后的列表进行输出,它的效率更快一些,避免了第二次读取数据。并且把随机 IO 变成了顺序 IO,但是它会使用更多的空间,因为它把每一行都保存在内存中了。
③单路排序的问题
由于单路是后出的,总体而言好过双路。但是存在以下问题:
在 sort_buffer 中,方法 B 比方法 A 要多占用很多空间,因为方法 B 是把所有字段都取出, 所以有可能取出的数据的总大小超出了 sort_buffer 的容量,导致每次只能取 sort_buffer 容量大小的数据,进行排序(创建 tmp 文件,多路合并),排完再取取 sort_buffer 容量大小,再排……从而多次 I/O。
结论:本来想省一次 I/O 操作,反而导致了大量的 I/O 操作,反而得不偿失。

5.2 如何优化

①增大 sort_butter_size 参数的设置
不管用哪种算法,提高这个参数都会提高效率,当然,要根据系统的能力去提高,因为这个参数是针对每个进程的 1M-8M 之间调整。
②增大 max_length_for_sort_data 参数的设置
mysql 使用单路排序的前提是排序的字段大小要小于 max_length_for_sort_data。
提高这个参数,会增加用改进算法的概率。但是如果设的太高,数据总容量超出 sort_buffer_size 的概率就增大,明显症状是高的磁盘 I/O 活动和低的处理器使用率。(1024-8192 之间调整)。
③减少 select 后面的查询的字段。
当 Query 的字段大小总和小于 max_length_for_sort_data 而且排序字段不是 TEXT|BLOB 类型时,会用改进后的算法——单路排序, 否则用老算法——多路排序。
两种算法的数据都有可能超出 sort_buffer 的容量,超出之后,会创建 tmp 文件进行合并排序,导致多次 I/O,
但是用单路排序算法的风险会更大一些,所以要提高 sort_buffer_size。

6. 使用覆盖索引

覆盖索引:SQL 只需要通过索引就可以返回查询所需要的数据,而不必通过二级索引查到主键之后再去查询数据。

7. group by

group by 使用索引的原则几乎跟 order by 一致 ,唯一区别是 groupby 即使没有过滤条件用到索引,也可以直接使用索引。

二十五、练习

1. 案例一

列出自己的掌门比自己年龄小的人员

select e1.name empname,e1.age empage,e2.name ceoname,e2.age ceoage
from t_emp e1 inner join t_dept d on e1.deptid=d.id
inner join t_emp e2 on d.ceo=e2.id
where e1.age>e2.age;
更换为大表,进行分析:
explain select e1.name empname,e1.age empage,e2.name ceoname,e2.age ceoage from emp e1 inner join dept d on e1.deptid=d.id
inner join emp e2 on d.ceo=e2.id
where e1.age>e2.age;
两次 inner join 的被驱动表都已经用上了索引。

2. 案例二

列出所有年龄低于自己门派平均年龄的人员
思路: 先取门派的平均年龄,再跟自己的年龄做对比!
select e1.name from t_emp e1
inner join
(select deptid,AVG(age) avgage from t_emp group by deptid) tmp
on e1.deptid=tmp.deptid
where e1.age 更换为大表:
explain select e1.name from emp e1
inner join
(select deptid,AVG(age) avgage from emp
group by deptid) tmp
on e1.deptid=tmp.deptid
where e1.age 在没有索引的前提下:
如何优化:
①首先在子查询中,需要根据 deptid 做 groupby 操作,因此,需要在 deptid 上面建 立索引;
②因为是 inner join,因此会自动将小表作为驱动表,也就是说,分组后的 tmp 是驱动 表,而 e1 是被驱动表;
③而在 e1 中,需要查询 deptid 和 age 两个字段,因此这两个字段也需要建立索引
结果:创建 deptid 和 age 的符合索引: create index idx_deptid_age on emp(deptid,age);

3. 案例三

列出至少有 2 个年龄大于 40 岁的成员的门派
思路: 先查询大于 40 岁的成员,然后按照门派分组,然后再判断至少有 2 个的门派!
select d.deptName,count()
from t_emp e inner join t_dept d
on e.deptid=d.id
where e.age>40
group by d.id,d.deptName
having count(
)>=2
大表优化:
explain select d.deptName,count()
from emp e inner join dept d
on e.deptid=d.id
where e.age>40
group by d.id,d.deptName
having count(
)>=2;
优化:
①两表关联,我们可以考虑将小表作为驱动表。
②group by 的字段 id,deptName 还可以建立索引: create index idx_id_deptName on dept(id,deptName);
③被驱动表的 deptid 作为关联字段,可以建立索引:create index idx_deptid on emp(deptid);
create index idx_id_deptname on dept(id,deptName);

4. 案例四

至少有 2 位非掌门人成员的门派
select d2.deptName from t_emp e inner join t_dept d2 on e.deptid=d2.id
left join t_dept d on e.id=d.ceo
where d.id is null and e.deptid is not null
group by d2.deptName,d2.id
having count()>=2;
切换大表:
explain select d2.deptName from emp e inner join dept d2 on e.deptid=d2.id
left join dept d on e.id=d.ceo
where d.id is null and e.deptid is not null
group by d2.deptName,d2.id
having count(
)>=2;
没有索引的情况下:
优化分析: 三个表关联,然后做 group by 分组!
①group by 的字段,可以加上索引:create index idx_deptname_id on dept(deptName,id);
②可以将部门表作为驱动表
③第一次 join 时,e 表作为被驱动表,可以将 deptid 设置索引:create index idx_deptid on emp(deptid);
④最有一次 join 中,使用了 dept 表作为被驱动表,查询 ceo 字段,因此可以在 ceo 上面建立索引
create index idx_ceo on dept(ceo);

5. 案例五

列出全部人员,并增加一列备注“是否为掌门”,如果是掌门人显示是,不是掌门人显示否
select e.name,case when d.id is null then ‘否’ else ‘是’ end ‘是否为掌门’ from t_emp e
left join t_dept d
on e.id=d.ceo;
大表关联:
explain select e.name,case when d.id is null then ‘否’ else ‘是’ end ‘是否为掌门’ from emp e
left join dept d
on e.id=d.ceo;
优化:在 d 表的 ceo 字段建立索引即可!

6. 案例六

列出全部门派,并增加一列备注“老鸟 or 菜鸟”,若门派的平均值年龄>40 显示“老鸟”,否则显示“菜鸟”
思路: 先从 emp 表求出,各门派的平均年龄,分组,然后在关联 dept 表,使用 if 函数进行判断!
select d.deptName,if(avg(age)>40,‘老鸟’,‘菜鸟’) from t_emp e inner join t_dept d
on d.id=e.deptid
group by d.deptName,d.id
切换大表:
explain select d.deptName,if(avg(age)>40,‘老鸟’,‘菜鸟’) from dept d inner join emp e
on d.id=e.deptid
group by d.deptName,d.id
优化:
①使用 dept 作为驱动表
②在 dept 上建立 deptName 和 id 的索引:create index idx_deptName_id on dept(deptName,id);
③在 emp 上建立 deptid 字段的索引: create index index_deptid on emp(deptid);

7. 案例七

显示每个门派年龄最大的人
思路:先查询 emp 表,求出每个门派年龄最大的人,并按照 deptid 分组;然后再次关联 emp 表,关联其他的信息!
select * from t_emp e
inner join
(select deptid,max(age) maxage
from t_emp
group by deptid) tmp
on tmp.deptid=e.deptid and tmp.maxage=e.age;
大表优化:
explain select * from emp e
inner join
(select deptid,max(age) maxage
from emp
group by deptid) tmp
on tmp.deptid=e.deptid and tmp.maxage=e.age;
优化前:
优化思路:
①子查询中,emp 表根据 deptid 进行分组,因此可以建立 deptid 字段的索引;
②inner join 查询中,关联了 age 和 deptid,因此可以在 deptid,age 字段建立索引
create index idx_deptid_age on emp(deptid,age);

二十六、截取查询分析

1.慢查询日志

(1)MySQL的慢查询日志是MySQL提供的一种日志记录,它用来记录在MySQL中响应时间超过阀值的语句,具体指运行时间超过long_query_time值的SQL,则会被记录到慢查询日志中。
(2)具体指运行时间超过long_query_time值的SQL,则会被记录到慢查询日志中。long_query_time的默认值为10,意思是运行10秒以上的语句。
(3)由他来查看哪些SQL超出了我们的最大忍耐时间值,比如一条sql执行超过5秒钟,我们就算慢SQL,希望能 收集超过5秒的sql,结合之前explain进行全面分析。

2.慢查询日志怎么用

默认情况下,MySQL 数据库没有开启慢查询日志,需要我们手动来设置这个参数。
当然,如果不是调优需要的话,一般不建议启动该参数,因为开启慢查询日志会或多或少带来一定的性能影响。慢查询日志支持将日志记录写入文件。
(1) 开启设置
SHOW VARIABLES LIKE ‘%slow_query_log%’;
查看慢查询日志是否开启 默认情况下 slow_query_log 的值为 OFF,表示慢查询日志是禁用的
set global slow_query_log=1;
开启慢查询日志
SHOW VARIABLES LIKE ‘long_query_time%’;
查看慢查询设定阈值 单位秒
set long_query_time=1
设定慢查询阈值 单位秒
(2) 如永久生效需要修改配置文件 my.cnf 中[mysqld]下配置
[mysqld]
slow_query_log=1
slow_query_log_file=/var/lib/mysql/atguigu-slow.log
long_query_time=3
log_output=FILE
(3) 运行查询时间长的 sql,打开慢查询日志查看

3.日志分析工具 mysqldumpslow

(1) 查看mysqldumpslow的帮助信息
命令:[root@cocoon ~]# mysqldumpslow --help
参数:
-s 是表示按照何种方式排序
c 访问次数
l 锁定时间
r 返回记录
t 查询时间
al 平均锁定时间
ar 平均返回记录数
at 平均查询时间
-t 即为返回前面多少条的数据
-g 后边搭配一个正则匹配模式,大小写不敏感的
(2) 查看mysqldumpslow的帮助信息
得到返回记录集最多的 10 个 SQL
mysqldumpslow -s r -t 10 /var/lib/mysql/atguigu-slow.log
得到访问次数最多的 10 个 SQL
mysqldumpslow -s c -t 10 /var/lib/mysql/atguigu-slow.log
得到按照时间排序的前 10 条里面含有左连接的查询语句
mysqldumpslow -s t -t 10 -g “left join” /var/lib/mysql/atguigu-slow.log
另外建议在使用这些命令时结合 | 和 more 使用 ,否则有可能出现爆屏情况
mysqldumpslow -s r -t 10 /var/lib/mysql/atguigu-slow.log | moreJAVAEE

4. SHOW PROCESSLIST

查询 mysql 进程列表,可以杀掉故障进程

二十七、工具和技巧拾遗

二十八、主从复制

1.复制的基本原理

(1)slave 会从 master 读取 binlog 来进行数据同步
(2)三步骤+原理图
Mysql详解_第30张图片

MySQL 复制过程分成三步:

master 将改变记录到二进制日志(binary log)。这些记录过程叫做二进制日志事件,binary log events;
slave 将 master 的 binary log events 拷贝到它的中继日志(relay log);
slave 重做中继日志中的事件,将改变应用到自己的数据库中。

MySQL 复制是异步的且串行化的

2.复制的基本原则

(1)每个 slave 只有一个 master
(2)每个 slave 只能有一个唯一的服务器 ID
(3)每个 master 可以有多个 salve

3. 复制的最大问题

因为发生多次 IO,存在延时问题

4.一主一从常见配置

(1) mysql 版本一致且后台以服务运行
(2) 主从都配置在[mysqld]结点下,都是小写
主机修改 my.ini 配置文件
主服务器唯一 ID :server-id=1
启用二进制日志:log-bin=自己本地的路径/data/mysqlbin
log-bin=D:/devSoft/MySQLServer5.5/data/mysqlbin
设置不要复制的数据库 :binlog-ignore-db=mysql
设置需要复制的数据库 :binlog-do-db=需要复制的主数据库名字
设置 logbin 格式 :binlog_format=STATEMENT(默认)
mysql 主从复制起始时,从机不继承主机数据
(3) logbin 格式
binlog_format=STATEMENT(默认)
binlog_format=ROW
binlog_format=MIXED
(4) 从机配置文件修改 my.cnf 的[mysqld]栏位下
#从机服务 id
server-id = 2
#注意 my.cnf 中有 server-id = 1
#设置中继日志
relay-log=mysql-relay
(5) 因修改过配置文件,请主机+从机都重启后台 mysql 服务
(6) 主机从机都关闭防火墙、安全工具(腾讯管家等)
(7) 在 Windows 主机上建立帐户并授权 slave
#创建用户,并授权
GRANT REPLICATION SLAVE ON .
TO ‘备份账号’@‘从机器数据库 IP’
IDENTIFIED BY ‘123456’;
(8) 查询 master 的状态,并记录下 File 和 Position 的值
#查询 master 的状态
show master status;
执行完此步骤后不要再操作主服务器 MYSQL,防止主服务器状态值变化
(9) 在 Linux 从机上配置需要复制的主机
#查询 master 的状态
CHANGE MASTER TO MASTER_HOST=‘主机 IP’,
MASTER_USER=‘创建用户名’,MASTER_PASSWORD=‘创建的密码’,
MASTER_LOG_FILE=‘File 名字’,MASTER_LOG_POS=Position 数字;
(10) 启动从服务器复制功能
start slave;
show slave status\G;
下面两个参数都是 Yes,则说明主从配置成功!
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
(11) 主机新建库、新建表、insert 记录,从机复制
(12) 如何停止从服务复制功能
stop slave;

二十九、MYCAT

1. MYCAT是什么

数据库中间件,前身是阿里的 cobar

2.MYCAT做什么

(1) 读写分离
(2) 数据分片:
垂直拆分、水平拆分
垂直+水平拆分
(3) 多数据源整合

3.MYCAT 原理

“拦截”:Mycat 的原理中最重要的一个动词是“拦截”,它拦截了用户发送过来的 SQL 语句。
首先对 SQL 语 句做了一些特定的分析:如分片分析、路由分析、读写分离分析、缓存分析等。
然后将此 SQL 发往后端的真实数据库,并将返回的结果做适当的处理,最终再返回给用户。
这种方式把数据库的分布式从代码中解耦出来,程序员察觉不出来后台使用 mycat 还是 mysql。

4.MYCAT的安装启动

(1) 解压缩文件拷贝到 linux 下 /usr/local/
(2) 三个配置文件
schema.xml 定义逻辑库,表、分片节点等内容
rule.xml 定义分片规则
server.xml 定义用户以及系统相关变量,如端口等.
(3) 启动前先修改 schema.xml

select user() (4) 再修改 server.xml 654321 TESTDB (5) 启动程序 控制台启动 :去 mycat/bin 目录下 mycat console 后台启动 :去 mycat/bin 目录下 mycat start (6) 启动时可能出现报错 域名解析失败 用 vim 修改 /etc/hosts 文件,在 127.0.0.1 后面增加你的机器名 修改后重新启动网络服务 (7) 后台管理窗口登录 mysql -u 用户名(mycat) -p 密码 -P9066 -h 主机 ip #命令: show database; show @@help (8) 数据窗口登录 mysql -u 用户名(mycat) -p 密码 -P8066 -h 主机 ip ## 5.读写分离 (1) 修改配置文件 schema.xml
<?xml version="1.0"?> 
<!DOCTYPE mycat:schema SYSTEM "schema.dtd"> 
<mycat:schema xmlns:mycat="http://io.mycat/"> 
<schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100" dataNode="dn1">
</schema> 
<dataNode name="dn1" dataHost="host1" database="atguigu_mc" /> 
<dataHost name="host1" maxCon="1000" minCon="10" balance="2" 
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100"> 
<heartbeat>select user()</heartbeat> 
<writeHost host="hostm1" url="192.168.67.1:3306" user="root" 
password="123123"> 
<!--读库(从库)的配置 -->
<readHost host="hosts1" url="192.168.67.131:3306" user="root" 
password="123123"> 
</readHost> 
</writeHost> 
</dataHost> 
</mycat:schema> 

(2) Balance
负载均衡类型,目前的取值有 4 种:
balance=“0”, 不开启读写分离机制,所有读操作都发送到当前可用的 writeHost 上。
balance=“1”,全部的 readHost 与 stand by writeHost 参与 select 语句的负载均衡,简单的说,当双主双从模式(M1->S1,M2->S2,并且 M1 与 M2 互为主备),正常情况下,M2,S1,S2 都参与 select 语句的负载均衡。
balance=“2”,所有读操作都随机的在 writeHost、readhost 上分发。
balance=“3”,所有读请求随机的分发到 readhost 执行,writerHost 不负担读压力
(3) 验证读写分离

#创建表 
create table t_replica 
( 
id int auto_increment , 
name varchar(200) 
);
#分别在两个库下插入数据 
insert into t_replica(name) values (@@hostname); 
#然后再 mycat 下执行,可以查看读写情况 
select * from t_replica 

6.分库

(1) 如何选择分库表

#客户表 rows:20 万 
CREATE TABLE customer( 
id INT AUTO_INCREMENT, 
NAME VARCHAR(200), 
PRIMARY KEY(id) 
);
#订单表 rows:600 万 
CREATE TABLE orders( 
id INT AUTO_INCREMENT, 
order_type INT, 
customer_id INT, 
amount DECIMAL(10,2), 
PRIMARY KEY(id
#订单详细表 rows:600 万 
CREATE TABLE orders_detail( 
id INT AUTO_INCREMENT, 
detail VARCHAR(2000), 
order_id INT, 
PRIMARY KEY(id) 
);
#订单状态字典表 rows:20 
CREATE TABLE dict_order_type( 
id INT AUTO_INCREMENT, 
order_type VARCHAR(200), 
PRIMARY KEY(id) 
);
select o.*,od.detail,d.order_type 
from orders o 
inner join orders_detail od on o.id =od.order_id 
inner join dict_order_type d on o.order_type=d.id 
where o.customer_id=xxxx 

(2) 修改配置文件 schema.xml

<mycat:schema xmlns:mycat="http://io.mycat/"> 
<schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100" dataNode="dn1"> 
<table name="customer" dataNode="dn2" ></table>
</schema> 
<dataNode name="dn1" dataHost="host1" database="atguigu_mc" /> 
<dataNode name="dn2" dataHost="host2" database="atguigu_sm" /> 
<dataHost name="host1" maxCon="1000" minCon="10" balance="2" 
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100"> 
<heartbeat>select user()</heartbeat> 
<writeHost host="hostm1" url="192.168.67.1:3306" user="root" 
password="123123"> 
<readHost host="hosts1" url="192.168.67.131:3306" user="root" 
password="123123"> 
</readHost> 
</writeHost> 
</dataHost> 
<dataHost name="host2" maxCon="1000" minCon="10" balance="0" 
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100"> 
<heartbeat>select user()</heartbeat> 
<writeHost host="hostm2" url="192.168.67.1:3306" user="root" 
password="123123"> 
</writeHost> 
</dataHost> 
</mycat:schema> 

7.水平分表

(1) 修改配置文件 schema.xml


…… (2) 修改配置文件 rule.xml customer_id mod-long 2 (3) 跨库 join ER 表 为了相关联的表的行尽量分在一个库下 修改配置文件 schema.xml
…… (4) 全局表 设定为全局的表,会直接复制给每个数据库一份,所有写操作也会同步给多个库。 所以全局表一般不能是大数据表或者更新频繁的表。一般是字典表或者系统表为宜。
…… (5) 建相关表 ## 8. 全局序列 1.8.1 本地文件 不推荐,存在宕机序列丢失问题。 1.8.2 数据库方式 (1) 数据库序列方式原理 利用数据库一个表 来进行计数累加。但是并不是每次生成序列都读写数据库,这样效率太低。 mycat 会预加载一部分号段到 mycat 的内存中,这样大部分读写序列都是在内存中完成的。如果内存中的号 段用完了 mycat 会再向数据库要一次。 如果 mycat 崩溃了 ,内存中的序列都没了,那么 mycat 启动后会向数据库申请新的号段,原有号段会弃用。 也就是说如果 mycat 重启,那么损失是当前的号段没用完的号码,但是不会因此出现主键重复。 (2) 建库序列脚本 在 win10 的 mysql 库里创建
CREATE TABLE MYCAT_SEQUENCE (NAME VARCHAR(50) NOT NULL,current_value INT NOT 
NULL,increment INT NOT NULL DEFAULT 100, PRIMARY KEY(NAME)) ENGINE=INNODB; 
DELIMITER $$ 

CREATE FUNCTION mycat_seq_currval(seq_name VARCHAR(50)) RETURNS VARCHAR(64)
DETERMINISTIC 

BEGIN 
DECLARE retval VARCHAR(64); 
SET retval="-999999999,null"; 
SELECT CONCAT(CAST(current_value AS CHAR),",",CAST(increment AS CHAR)) INTO retval FROM 
MYCAT_SEQUENCE WHERE NAME = seq_name; 
RETURN retval; 
END $$ 

DELIMITER; 
DELIMITER $$ 
CREATE FUNCTION mycat_seq_setval(seq_name VARCHAR(50),VALUE INTEGER) RETURNS VARCHAR(64) 
DETERMINISTIC 
BEGIN 
UPDATE MYCAT_SEQUENCE 
SET current_value = VALUE 
WHERE NAME = seq_name; 
RETURN mycat_seq_currval(seq_name); 
END $$ 

DELIMITER ; 
DELIMITER $$ 
CREATE FUNCTION mycat_seq_nextval(seq_name VARCHAR(50)) RETURNS VARCHAR(64) 
DETERMINISTIC 
BEGIN 
UPDATE MYCAT_SEQUENCE 
SET current_value = current_value + increment WHERE NAME = seq_name; 
RETURN mycat_seq_currval(seq_name); 
END $$ 

DELIMITER; 
SELECT * FROM MYCAT_SEQUENCE 
TRUNCATE TABLE MYCAT_SEQUENCE 
##增加要用的序列 
INSERT INTO MYCAT_SEQUENCE(NAME,current_value,increment) VALUES ('ORDERS', 400000, 
100); 

(3) 修改 mycat 配置
sequence_db_conf.properties
vim sequence_db_conf.properties
意思是 ORDERS 这个序列在 dn1 这个节点上,具体 dn1 节点是哪台机子,请参考 schema.xml
(4) 修改 mycat 配置 server.xml
vim server.xml
(5) 重启 mycat
(6) 插入语句JAVAEE 课程系列
insert into orders(id,amount,customer_id,order_type)
values( 1746161033770307584,1000,101,102);
1.8.3 时间戳方式
需要 18 位字段,比较长。
1.8.4 自主生成
(1) 根据业务逻辑组合
(2) 可以利用 redis 的单线程原子性 incr

你可能感兴趣的:(数据库,mysql,mysql,数据库)