数据库(MySQL) 入门实践

1 数据库

存放数据的仓库。例如你的账号信息，订单记录等。

2 SQL

Structured Query Language，用于访问和处理关系数据库的标准的计算机语言。

按照功能又可分为四大类；

DQL
查询语言，基本语句 SELECT；
DML
操纵语言，主要有三种形式，INSERT、UPDATE 和 DELETE；
DDL
定义语言，创建表、视图、索引等，CREATE TABLE；
DCL
控制语言，用来授权或回收某种特权，基本形式有 GRANT、 COMMIT 和 ROLLBACK；

3 NoSQL

Not Only SQL，泛指非关系型的数据库，通常以键值对或者文档形式存储。例如 Redis、MongoDB。

关系型数据库（MySQL）能通过外键建立表之间的联系，且相比 NoSQL 而言，还具备 ACID 特性。

但 NoSQL 操作无须 SQL 解析，读写性能较高，相比关系型数据库来说，不用预设存储结构，且天然支持分布式存储。

4 范式

数据库满足一定要求的条件称为数据库范式。又能根据程度的不同，简称为第 N 范式。

第一范式 1NF
所有属性不可再分，例如属性 product 就不能分为 title 和 price，可以单独设置两个属性 productTitle、productPrice；
第二范式 2NF
每张表都有一个属性作为唯一标识，其他属性完全依赖该标识，例如自增主键ID；
第三范式 3NF
所有的非主属性不依赖于其他的非主属性。例如订单表中可以关联商品ID，但不应该关联商品非主属性 title 和 price 等；

为了提高查询效率，通常会添加冗余字段，这也就违背了 3NF，也称之为反三范式。

5 MySQL

MySQL 是一个 Oracle 旗下的关系型数据库，使用 SQL 语言进行增删改查操作。

开源免费，性能也比较好，和 PHP、Java 等 Web 开发语言完美配合，在中小型企业应用非常广泛。

后续内容都是基于 MySQL 数据库的前提下。

6 存储引擎

常见的有 MyISAM 和 InnoDB 引擎；

引擎	默认版本	外键	锁粒度	count(*)	事务
MyISAM	< 5.5	不支持	表锁	变量存储	不支持
InnoDB	>= 5.5	支持	行锁	全表扫描	支持

7 事务

一条或多条 SQL 组成一个事务（transaction），具备 ACID 四个特性；

Atomicity 原子性
一个事务内的所有操作，要么全部完成，要么全部失败；
Consistency 一致性
事务开始前后结束后不会破坏数据库的完整性，也就是说写入或修改的结构需要符合预设的规则；
Isolation 隔离性
防止事务交叉执行时导致数据的不一致。根据隔离程度分为 read uncommitted、read committed、repeatable read 和 serializable；
Durability 持久性
事务结束后，对数据的修改是永久的；

事务交叉执行可能会造成“脏读”、“幻读” 和 “不可重复读”；

脏读
一个事务读取到另外一个事务还未提交的数据；
不可重复读
一个事务内，多次读取同一数据返回结果不同；由于在此期间在数据被其他事务修改并已提交；
幻读
一个事务内，多次读取，返回不存在的记录；由于在此期间有其他事务写入数据；

	read uncommitted	read committed	repeatable read	serializable
脏读	√	×	×	×
不可重复读	√	√	×	×
幻读	√	√	√	×

8 索引

数据库的“目录”，在数据量较大的情况下，可以极大地提高查询效率。

常见的索引数据结构有 B+ 树、Hash。以最常用的 B+ 树为例；

按照 B+ 树存储方式可以把索引分为两大类；

聚簇索引；
叶子节点存放了一整行的信息；
非聚簇索引；
叶子节点存放的是对应那行数据的主键，和该索引的值；

为什么是 B+ 树？

磁盘代价低；

查询更加稳定；

便于遍历；

支持范围查询；

一张结构为 id，groupId，name 的 t_user 表，id 为主键（聚簇索引），groupId 为普通索引（非聚簇索引）。

select name from t_user where groupId = 123;

先在叶子节点上得到对应的主键 id，然后再根据主键 id 得到 name 的值，这种行为称之为回表。

select groupId from t_user where groupId = 123;

直接在叶子节点上就能得到 groupId 的值，不用回表操作，这种索引也被称为覆盖索引。

按照功能类型又可以把索引分为三大类；

普通索引；
最基本的索引类型，没有限制条件；
唯一索引；
保证索引字段的值唯一，允许有 NULL；主键是一种特殊的唯一索引，不允许有 NULL；
联合索引；
多个字段组成一个索引，具有“最左前缀”的原则；

什么是最左前缀？
a、b、c 三个字段组成联合索引，那么生效的列为 a、ab、abc、ac。（等值判断时顺序可交换，范围查询时会停止匹配）

9 锁

宏观来看，锁分为两种；行锁可归纳为两类；

共享锁（S）
share，又称为读锁，已有 S 锁，可以加其他 S 锁，但不能加 X 锁；
排他锁（X）
exclusive，又称为写锁，X 与其他任何锁互斥；

InnoDB 是通过给索引项加锁实现的行锁，可分为三种类型；

record lock
行级锁，锁定对应索引项；
gap lock
间隙锁，锁定索引项之间的间隙，左开右闭；
next-key lock
前两种的结合；

如果不通过索引项检索数据，会锁住整个表。

InnoDB 加锁方法：

对于 UPDATE、DELETE、INSERT 自动加 X 锁；
对于普通 SELECT 不会加任何锁；
SELECT ... LOCK IN SHARE MODE 显示加 S 锁；
SELECT ... FOR UPDATE 显示加 X 锁；

查询当前数据库锁状态；

select * from information_schema.innodb_locks;

对于不同类型的索引，加锁的方式也不一样；

普通索引
加 next-key lock；
唯一索引
加 record lock；

由于普通索引叶子节点存储了主键，所以加锁的字段是：普通索引 + 主键索引；

假设有如下数据表 t_ lock，其中 id 为主键，xid 为普通索引；

+-----+----+
| xid | id |
+-----+----+
|   1 | 10 |
|   3 | 20 |
|   5 | 30 |
|   8 | 40 |
|  11 | 50 |
+-----+----+

给 (8, 40) 这条记录加 X 锁；

select * from t_lock where xid = 8 for update;

那么根据 next-key lock 的定义，锁住区间为 (5, 30) 到 (8, 40)，(8, 40) 到 (11, 50) 这两个区间；

便于理解我会合并为一个区间 (5, 30) 到 (11, 50)。

按照所以排序规则，假设另插入 (xid, id) 记录，那么总是满足以下条件；

xid < 5；id 无限制；（正常）
xid = 5；id < 30；（正常）
xid = 5；id > 30；（阻塞）
xid > 5 && xid < 11；id 无限制；（阻塞）
xid = 11；id < 50；（阻塞）
xid = 11；id > 50；（正常）
xid > 11；id 无限制；（正常）

简单图示，当插入的数据落在这个区间则会阻塞，反之亦然；

10 RR 幻读

上面事务章节描述 RR 会导致幻读，MySQL 在 RR 下通过如下两点规避掉了；

MVCC
Multi-Version Concurrency Control，多版本并发控制。在普通 SELECT （快照度）时引入版本，同一个事务中只能读取不大于当前版本的数据快照；
next-key lock
需要加 X 锁的操作（当前读），加 next-key lock 可以有效避免产生幻读；

11 SQL 执行顺序

根据创建时间升序，查找支付成功超过 3 单的用户，需要去重；

select distinct t1.nickname
from t1 inner join t2
on t1.uid = t2.uid
where t2.pay_time > 0
group by t1.uid, t1.nickname
having count(*) > 3
order by t2.create_time
limit 10

from
on
join
where
group
having
order
select
distinct
limit

12 binlog

binlog 是 MySQL 最重要的日志，记录了所有的 DDL 和 DML 语句，主要目的是；

主从复制；
在 Master 开启 binlog，并传递到 Slave 节点来达到 Master-Slave 数据一致性；
数据恢复；
通过 mysqlbinlog 恢复数据；

检查 binlog 是否开启；

show variables like 'log_bin';

编辑 mysql 配置文件/etc/mysql/mysql.conf.d/mysqld.cnf，开启 binlog 功能；

[mysqld]
server-id=1
log-bin=/var/lib/mysql/mysql-bin

常用几个命令；

show master status;
show binary logs;
mysqlbinlog -v --start-position 2755 --stop-position 3076 mysql-bin.000003；

例如误删除了某条记录；

通过 mysqlbinlog 定位到误操作的 position；
通过 mysqlbinlog 定位到误删之前最早入库的 position；
截取中间 binlog 日志， echo > db.sql 输出到可执行 SQL 文件中；
执行恢复数据即可；

可直接流式执行：mysqlbinlog -v --start-position 2432 --stop-position 2533 mysql-bin.000003 | mysql -uroot -p

mysqldump 是用来备份数据库的，例如备份 db_test 数据库；

mysqldump -h127.0.0.1 -uroot -p123456 db_test > db.sql

13 性能优化

索引；
给经常用作查询条件，且区分度较高的字段建立索引；
分页查询；
where id > ${lastId} order by id limit ${size}，提高大表分页效率；
批量操作；
批量插入用 insert into xxx values (xxx...), (xxx...)，批量更新用 case when id；
not null；
null 会额外占用空间，且 count(xxx) 不会参与统计，若是索引列 is not null 也会失效；