1.基础架构:一条sql查询语句是如何执行的?
mysql> select * from T where ID=10;
2.基础架构:一条sql更新语句是如何执行的?
mysql> update T set c=c+1 where ID=2;
redo log
(1)存储引擎的日志,InnoDB特有的;
(2)物理日志
(3)循环写,空间固定会用完;
binlog
(1)server端日志,所有引擎都有;
(2)逻辑日志
(3)追加写,文件写到一定大小,切换下一个,并不会覆盖之前的日志;
redolog的写入拆分成两个步骤:prepare和commit
redo log 和binlog都可以用于表示事务的提交状态,两阶段提交是为了维持这两个状态一致。
恢复:
注:正常执行redolog commit;崩溃恢复的时候可以接受redolog prepare并且binglog完整
3.事务隔离
MyISAM不支持事务,InnoDB 支持事务
读未提交:别人改数据的事务尚未提交,我在我的事务中也能读到。
读已提交:别人改数据的事务已经提交,我在我的事务中才能读到。
可重复读:别人改数据的事务已经提交,我在我的事务中也不去读。(对账的例子)
串行:我的事务尚未提交,别人就别想改数据。
https://blog.csdn.net/changhenshui1990/article/details/77161401
案例:http://www.javaseo.cn/article/88/
4.索引(上)
索引---目录:提供数据查询的效率
(1)哈希表:适合等值查询的场景
缺点:范围查找比较麻烦
哈希冲突:链表(两个key生成的N一样)
(2)有序数组:等值查找,范围查询性能都很好、只适合静态存储引擎
缺点:更新比较麻烦
(3)二叉搜索树:每个节点的左儿子小于父节点,父节点又小于右儿子
InnoDB的索引模型
B+树索引模型
mysql> create table T(
id int primary key,
k int not null,
name varchar(16),
index (k))engine=InnoDB;
索引类型:主建索引、非主建索引
主建索引的叶子节点存储:整行数据(聚簇索引),主建索引只要搜索id这个B+ Tree就可以拿到数据
非主建索引叶子节点:主建的值(二级索引),普通索引先搜索索引拿到主建值,再到主建索引搜索一次(回表)
索引维护:
一个数据页满了,按照B+Tree算法,新增加一个数据页,叫做页分裂,会导致性能下降。空间利用率降低大概50%。当相邻的两个数据页利用率很低的时候会做数据页合并,合并的过程是分裂过程的逆过程。
性能和存储上来考虑,自增主建往往是更合理的选择;递增插入,追加,不会触发叶子节点分裂。
业务字段用作主建:(1)只有一个索引(2)该索引必须唯一索引。-------------------------直接将这个索引设置成主建,避免每次查询搜索两棵树。
5.索引(下)
(1)覆盖索引:select ID from T where k betwe 3 and 5 不需要回表(回到主键索引树搜索的过程,成为回表)
(2)前缀索引
(3)索引下推
总结:
1、覆盖索引:如果查询条件使用的是普通索引(或是联合索引的最左原则字段),查询结果是联合索引的字段或是主键,不用回表操作,直接返回结果,减少IO磁盘读写读取正行数据
2、最左前缀:联合索引的最左 N 个字段,也可以是字符串索引的最左 M 个字符
3、联合索引:根据创建联合索引的顺序,以最左原则进行where检索,比如(age,name)以age=1 或 age= 1 and name=‘张三’可以使用索引,单以name=‘张三’ 不会使用索引,考虑到存储空间的问题,还请根据业务需求,将查找频繁的数据进行靠左创建索引。
4、索引下推:like 'hello%’and age >10 检索,MySQL5.6版本之前,会对匹配的数据进行回表查询。5.6版本后,会先过滤掉age<10的数据,再进行回表查询,减少回表率,提升检索速度
6.数据库锁——行锁,表锁
锁:并发
(1)全局锁:对整个数据库实例加锁,全库数据备份的时候用;(InnoDB采用事务,可重复读可以支持;不支持事务的引擎不能够实现,采用FTWRL) FTWRL——保证只读
(2)表级锁:表锁、元数据锁;
(3)行级锁:InnoDB(行锁)、MyIsAM(不支持行锁)
7.索引选择——唯一索引,普通索引
8.给字符串字段加索引
前缀索引
mysql> alter table SUser add index index1(email);
或
mysql> alter table SUser add index index2(email(6));
使用前缀索引,定义好长度,就可以做到既节省空间,又不用额外增加太多的查询成本
前缀索引对覆盖索引的影响:
其他方式: 倒序存储、hash字段
9.mysql "抖"了一下
WAL:先写日志,再写磁盘
刷脏页(flush)
(1)InnoDB的redo log满了的时候
(2)内存不够用了,先将脏页写到磁盘
(3)mysql系统空闲的时候
(4)mysql正常关闭的时候
10.数据删除,表文件大小不变
InnoDB:表结构(.frm)定义和数据(.ibd)。
delete 命令其实只是把记录的位置,或者数据页标记为“可复用”,但磁盘文件的大小是不会变的。----空洞
重建表可以收缩空间
11.count(*)的实现
MyISAM:一个表的总行数存在了磁盘上
InnoDB:把数据一行一行地从引擎里面读出来,然后累加
count(字段) 12.order by的原理 (1)全字段排序: 缺点: (2)rowId排序 优点:更好的利用内存的sort_buffer进行排序操作,尽量减少对磁盘的访问 13.mysql随机消息 mysql> select word from words order by rand() limit 3; 14.逻辑相同的sql语句性能相差很大 (1)条件字段函数 mysql> select count(*) from tradelog where month(t_modified)=7; 如果对字段做了函数计算,就用不上索引了,这是 MySQL 的规定。 对索引字段做函数操作,可能会破坏索引值的有序性,因此优化器就决定放弃走树搜索功能。 mysql> select count(*) from tradelog where (2)隐式类型转换 mysql> select * from tradelog where tradeid=110717; 相当于 mysql> select * from tradelog where CAST(tradid AS signed int) = 110717; 对索引字段做函数操作,优化器会放弃走树搜索功能。 (3)隐式字符串编码转换 15.查一行数据也很慢 (1)查询长时间不返回:等MDL锁、等flush、等行锁 (2)查询慢:没有加索引,需要全表扫描; 16.幻读 间隙锁 17.mysql如何保证数据不丢失 18.mysql主备一致:binlog归档 binlog的格式: (1)statement (2)row (3)mixed 19.mysql如何保证高可用 主备(写数据)、主从(读数据)------一主多从 20.mysql读写分离 21.join select * from t1 straight_join t2 on (t1.b=t2.b) where t2.id<=50; 第二条语句更好,小表作为驱动表; 22.分区表 CREATE TABLE `t` ( 索引参考:https://blog.csdn.net/tongdanping/article/details/79878302 https://www.cnblogs.com/yuyue2014/p/3662005.html http://blog.codinglabs.org/articles/theory-of-mysql-index.html https://www.cnblogs.com/liqiangchn/p/9066686.html posted @ 2019-03-12 13:04 诸葛子房 阅读(...) 评论(...) 编辑 收藏
1.造成sort_buffer中存放不下很多数据,因为除了排序字段还存放其他字段,对sort_buffer的利用效率不高
2.当所需排序数据量很大时,会有很多的临时文件,排序性能也会很差
优点:MySQL认为内存足够大时会优先选择全字段排序,因为这种方式比rowid 排序避免了一次回表操作
缺点:回表的操作是随机IO,会造成大量的随机读,不一定就比全字段排序减少对磁盘的访问
-> (t_modified >= '2016-7-1' and t_modified<'2016-8-1') or
-> (t_modified >= '2017-7-1' and t_modified<'2017-8-1') or
-> (t_modified >= '2018-7-1' and t_modified<'2018-8-1');
select * from t2 straight_join t1 on (t1.b=t2.b) where t2.id<=50;
`ftime` datetime NOT NULL,
`c` int(11) DEFAULT NULL,
KEY (`ftime`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1
PARTITION BY RANGE (YEAR(ftime))
(PARTITION p_2017 VALUES LESS THAN (2017) ENGINE = InnoDB,
PARTITION p_2018 VALUES LESS THAN (2018) ENGINE = InnoDB,
PARTITION p_2019 VALUES LESS THAN (2019) ENGINE = InnoDB,
PARTITION p_others VALUES LESS THAN MAXVALUE ENGINE = InnoDB);
insert into t values('2017-4-1',1),('2018-4-1',1);