一缕情丝一生珍藏

【MYSQL高级篇】

第一章、MYSQL整体架构

mysql是一个典型的cs架构软件，它是基于c与c++开发的，性能强大；

比如我们平时写的web应用，就是作为mysql的客户端去连接mysql server端，我们熟知的navicat其实也是作为mysql客户端来连接mysql server的；

下面是mysql的架构图

首先：客户端通过tcp协议连接到mysql server端

连接器：连接首先会到达连接器，因为mysql需要一个认证模块来校验所有连接是否合法，是否具有权限，密码是否正确等，同时这个连接还会管理所有连接进行来的连接；

query cache：在连接器处认证通过后，假如客户端传过来的是一个查询语句，并且 mysql server也开启了查询缓存的话，它会优先到查询缓存中去找是否有结果，如果找到了就返回这句sql的结果，但通常来说：我们不会开启mysql的查询缓存功能，因为它非常的鸡肋！甚至在mysql 8.0时就完全的抛弃了查询缓存功能；

为什么mysql要在8.0抛弃查询缓存功能？

答：如果让我做查询sql的缓存功能，我会以sql语句为key，sql语句查出来的结果为值存入一个线程安全的map中，事实上，mysql也是这样做的，只不过它是将其存入hash表中，但这样会带来更多问题：①每个人写的查询语句都可能不同，并且绝大部分的查询sql都是不相同的，你要做查询sql的缓存的话，你就要将这些查询sql每一个都作为key存到hash表中，显然这个数量级就比较大了；②同一句查询sql，比如select * from t_user,如果换成大写SELECT * FROM t_user，或者中间多一个空格，就会导致mysql server认为它不是同一个sql，也会导致存储很多重复的key-value到查询缓存中；这就导致查询缓存中可能只有不到10%的sql是真正能够起到缓存作用的，剩下的90%存到内存中完全是浪费；

综上所述：如果开启了查询缓存功能，会导致mysql server端浪费掉大量的内存来存储不必要的sql-数据键值对；所以mysql在8.0干掉了它；

3. 词法分析器：你的sql语句经过查询缓存后（如果是非查询语句则不会经过缓存），就会到达词法分析器，它的作用分析你的sql语法是否有误，如果有误就驳回；

4.优化器：语法分析无误后，会经过优化器，优化器会将你的sql语句进行优化，因为mysql并不信任人写的sql；同时在这一步：优化器还会分析你这一句sql在有多个索引时该走哪一个索引，以及怎么走等等，最后生成一个最优的执行计划；只要按着这个执行计划走，就可以是最快的执行速度；

5. 执行器：优化器生成执行计划后，就会拿着这个执行计划去调用存储引擎的接口，存储做出对应的操作，如增删改、返回查询结果等；

第二章：binlog日志详解

binlog是一个二进制文件，它记录了Mysql所有数据的变更，并以二进制的方式存储到了磁盘上；

binlog的三种模式：行模式，statement模式，混合模式

① 行模式：

id	name
1	许海

比如：行模式下，我现在往上面这个表中加入了id=1，name=许海这样的一行；

那么在binlog中就会记录为

id	name
1	许海

如果我将许海修改为了刘丹，那么binlog中就会记录为

id	name
1	许海
1	刘丹

最后再将其转为二进制文件，就成了行模式下的binlog；

② statement模式：

statement模式中：binlog会记录增删改的sql语句，假如你的sql是批量修改，最终也只会记录这一条sql，这样的好处就是节省空间，行模式就不行，假如你影响到了多行，行模式就会记录多行；

③ 混合模式：

混合模式下：由mysql自己去判断你这一次sql到底适合记录statement还是记录行，这是后来才出的功能；

通常来说：如果没有混合模式，我们会选用statement模式多一点，因为更节省空间；

开启binlog

① 在mysql 8.0 中默认是开启binlog的

② mysql 8.0 以前需要我们到/etc目录下的my.cnf中添加几行配置：

log-bin = mysql-bin     #开启binlog
binlog-format = ROW     #选择行模式
server_id = 12345       #指定server实例的id,在mysql主从架构中,
                        #就是通过这个server_id来区分不同的机器的,你保证这个id唯一即可
binlog-do-db = online-document1 #对指定的某个库开启binlog日志，online-document1：库名

补充：① log-bin ：log-bin你还可以写成log-bin = /usr/local/mysql/log-bin/mysql-bin，表示给你的binlog日志文件指定一个存放位置，如果你不指定，就会存在默认的位置上(默认位置在哪里我暂时还没去测试，但这不重要)；mysq-bin表示给你的binlog日志文件取名叫mysql-bin，并且会立即生成第一个binlog日志文件，mysql会自动在你取的binlog文件名后面加上.000001，如果后面binlog大小满了，还会自动生成mysql-bin.000002依次往后；

② server_id：你一定要设置server_id，否则会导致mysql无法启动

③ binlog-do-db：如果你要开启对多个库的binlog日志，那么你把binlog-do-db多复制几行即可；

binlog-do-db = online-document1
binlog-do-db = online-document2
binlog-do-db = online-document3

如果你不配置binlog-do-db，那么就是对mysql中所有的库都开启binlog日志。

④ binlog-igonre-db：这个配置是配置不对哪些库开启binlog日志的，用法跟binlog-do-db一致，不做赘述。

SQL命令检查binlog是否开启

show variables like 'log_bin'           #查看binlog开启状态
show variables like 'binlong_format'    #查看binlog的模式

SQL查看当前正在写入的binlog文件

由于binlog日志越来越多，binlog文件可能会有多个，mysql提供了一个命令来查看当前正在写入的，也就是最新的binlog文件：

show matser status #不要把它误以为是查看主节点状态了，它确实是查询最新binlog文件的

结果就是这样：

显然我的binlog日志文件已经写到第五份了，

并且我没有在my.cnf中配置binlog-do-db与binlog-igonre-db，所以这里这两项是空的；

查看master上所有的binlog日志文件

show master logs;

结果：

查看指定binlog文件的内容

show binlog enevts in 'mysql-bin.000001';

结果：

注意：① binlog是以二进制文件进行存储的，但你通过show binlog events in 这个命令查看binlog时，mysql server会以将二进制转换为表格展示出来。

② 为什么这个sql语句是show binlog events，而不是show binlog 其他？如果你了解过canal的底层机制mysql-binlog-connector-java这个开原框架的话，你就会知道在mysql中是以事件的方式往binlog中写入的，所以你在这个结果里能看到Event_type字段；

通过binlog恢复被删除的数据

① 将指定binlog文件中的数据全部恢复到指定的数据库中

mysqlbinlog --no-defaults /var/lib/binlog文件名称 |mysql -uroot -p 数据库名

② 按binlog的指定位置来恢复数据,下面这句话的意思就是截取你指定的binlog文件中的第一行到第十行来进行恢复

mysqlbinlog --no-defaults /var/lib/binlog文件名称 --start-position="1" --stop-position="10" |mysql -uroot -p 数据库名

③ 按时间进行恢复

mysqlbinlog --no-defaults /var/lib/binlog文件名称 --start-datetime="2022-05-10 15:25:00" --stop-datetime="2022-05-10 18:25:00" |mysql -uroot -p 数据库名

实战：

我现在有一张test_table表如下：

再查看当前正在写入的binlog文件

：show master status

我们查看到当前正在写入的binlog文件名叫mysql-bin.000005

再查看当前binlog文件的详细内容

：show binlog events in 'mysql-bin.000005'

再使用truncate命令将该表的所有行进行了清空。

：truncate table test_table

我们再看binlog确实有truncate的记录

先使用指定位置的方式来恢复：

mysqlbinlog --no-defaults mysql-bin.000005 --start-position="4" --stop-position="1174" |mysql -uroot -p online-document

第三章、mysql索引

一、二叉树

二、B树

三、B+树

四、索引

Innodb的索引结构

innodb的索引是基于B+树实现的，

2. 聚集索引，非聚集索引

第二章、索引

一、对MYSQL而言，数据是存储在文件系统中的，不同的存储引擎在存储这些数据时，会有不同的文件格式和组织形式,主要的存储引擎分为Innodb，Myisam，

页、以及为什么mysql需要索引？

在innodb引擎中，数据的最小存储单位称为页，一个页的大小为16kb。

请看下图：

当你表中一行数据所占的空间并不大时，那么一页就能存放多行数据，页是一个逻辑概念并不是一个物理概念，一页中的每一行数据在硬盘中都是通过指针逻辑相连，而不是在物理上紧挨在一起；所以你表中的数据绝大多数情况都是分散存储在很多个页中。（页跟页之间也是通过指针逻辑相连）

假如你这个表的主键是自增的，你通过where id = ？去查询某条数据，此时mysql就可以通过二分法等一系列算法来增加查询效率；

但如果你这个表的主键不是自增，你再用where id = ？，或者用了一个不自增的某字段当做查询条件，mysql在底层就只能一个页一个页的遍历，先遍历第一个页，把第一个页中的所有行数据都遍历完，再遍历第二个页，直到将所有的页都遍历完，才能找出所有复合条件的行，很明显这种一直遍历的效率非常低，所以需要一套能高效查询的数据结构与索引来定位数据；

innodb索引B+树结构的推演过程（非常重要）

①行格式（先了解一下，才能推演）

MySQL表中的数据我们肉眼看到是一行行存储的，里面只有id，name，age这三个字段的值，如下：

但实际上，MySQL在存储每一行数据时都遵循几种格式，称为行格式，其中InnoDB中最有名的行格式就是COMPACT(行格式之一，后面还会详细讲行格式，这里只是为了学习索引而预先了解一部分）。

简化版COMPACT：

比如我现在一行记录有C1，C2，C3三列，mysql在底层存储时，除了会记录C1，C2，C3的真实数据以外，还会记录record_type字段，next_record字段，以及其他信息(其他信息这里先不管，后面专门学行格式再说)

record_type字段：这个字段记录的是当前记录的类型；

0表示普通记录。

2表示最小记录

3表示最大记录

next_record字段：这个字段记录的是下一行记录的地址，相当于指针；

②页的基本模型：

看到上面的行格式可能你不太理解，但根据上面的知识，我们可以得到页的基本模型,再看下图你就理解了：

3.聚簇索引

① 概念：

针对主键构建的索引就叫聚簇索引，非聚簇索引就是不针对主键构建的索引，也叫二级索引，辅助索引。

② 深入：

在上面的索引结构的推演过程中，最终建立起来的B+树的索引结构，你一定要理解：这整颗B+树就是一个索引，索引并不是数据页中的主键，而是这整体的一个B+树就是索引；

只要你理解到位了，你就会明白：

>>>>> 聚簇索引并不是一个索引类型，而是一个存储数据的结构。

>>>>> 为什么InnoDB会默认给主键建立索引？

答：因为我们刚才学过，InnoDB中存储数据默认就是按照B+树的结构来存储的，一张表就是一颗B+树，它要创建B+树，要提升效率，肯定就要以默认的主键来创建索引，因为此时根本就还没有其他字段建立索引，只能拿主键来建立索引，这颗B+树才能搭的起来，否则最下面一层的数据页中的行数据根本就不知道以哪个字段进行排序，所以只要你往表中插入数据，InnoDB就会帮你以主键为基础把索引建立起来；

>>>>> 为什么InnoDB的主键禁止更改？

答：因为我们刚才学过，InnoDB的每一个表都会默认以主键为基础来建立聚簇索引，如果你把主键都改了，那么最下面一层数据页中的排好序的主键要全部换掉，虽然确实能换，但是成本太大，它要按照新主键的大小重新排一次顺序，并按顺序放入不同的数据页中，整个下面一层的数据页中的数据全部打乱了，所以InnoDB直接就禁止我们修改主键了；

>>>>> 为什么叫聚簇索引？如何理解聚簇两个字？

答：聚簇的意思是：索引和行数据是在一起的，我们刚才学过，聚簇索引结构下的索引确实是跟行数据在一起的，Innodb中存放表数据的文件格式是ibd，每个表都有自己的ibd文件，这个表的索引跟行数据都是存放在这个文件中的，所以叫聚簇索引；

像非聚簇索引的最下面一层就不是存的行数据了，而是存的数据的地址，比如MyISAM中就有两个文件格式，myi格式就是用来存索引的，myd就是来存行数据的（记忆技巧，i就是index，d就是data，my就是MyISAM）；

③ 聚簇索引的缺点：

经过上面的学习，我们知道聚簇索引的查询效率是很高的，但是你不知道它的插入效率并不高；

为什么聚簇索引的插入效率不高？

答：以上图中的页9，页20为例，假如现在我新插入了一条主键id为200的数据，由于页20已经满了，所以200这行数据要插入页20，就会导致页20中的数据整体向后挪一位，页31也会跟着向后挪一位，再后面的页也会向后挪，只要在200这个id后面的行数据都会向后挪一位，显然这个成本比较高；

④ 聚簇索引的补充：

>>>>> 只有InnoDB支持聚簇索引，MyISAM不支持聚簇索引。

>>>>> 一个表只能有一个聚簇索引，MyISAM的表还没有聚簇索引，为什么只能有一个聚簇索引？我们刚才学了聚簇索引最下一层就是按照主键来排序的，你不能给它两个主键，两个主键如何来排序？

>>>>> 如果你的表没有定义主键，那么InnoDB会帮你选一个非空且唯一的字段作为隐式的主键来创建聚簇索引。

>>>>>为了有效的利用聚簇索引的特性，所以当你在建表时，可以尽量让主键id有序，不要使用UUID，MD5加密字符串，纯字符串等无法保证有序的数据作为主键，如果是这些无序的数据作为主键，那么mysql在维护聚簇索引时是非常困难的，可能查询效率并不会很高；

4.二级索引（也叫非聚簇索引、辅助索引）

在一个表中只能有一个聚簇索引，但是可以有多个二级索引；

① 注意：聚簇索引、二级索引的使用场景：（非常重要，有助于你理解索引）

当你要以主键作为查询条件时，InnoDB就会以聚簇索引来进行查询，这样效率最高，当你要以其他字段来查询时，你再使用聚簇索引来查询就没有任何意义了，所以就有了二级索引，你可以对这个字段建立二级索引，新建的二级索引也是一颗单独的B+树。

② 它跟聚簇索引的区别：

最底下一层数据页不是以主键来进行排序的，而是以你新建索引的字段的值进行排序。

数据页中存的不是完全的数据行，而聚簇索引把完整的数据行都存到里面了，二级索引最下层的数据页中只存了主键值与二级索引字段的值（还存了行格式），这也进一步体现了聚簇索引的值跟索引不在同一个地方；当你要以二级索引字段为条件进行查询时，比如你查到值为2，那么你就会找到主键的值为20，此时你就可以拿着20这个主键到聚簇索引中再去查，就能找到真正的行数据了----> 这个操作叫做回表；

所以在索引优化中有一个技巧：当你只需要查询某个字段A的值时，你就不要写select *，而是select A ，这样就能省去回表的操作，减少IO次数；

下图就是二级索引的示意图

③ 问：为什么二级索引不把完整的行数据记录到数据页中呢？这样不就省去了回表操作吗？

答：一个表中可以有多个二级索引，假如你除开主键有10个字段，你将这个10个字段都建立二级索引，那么每个二级索引B+树的叶子节点中都包含了整表的数据，假如你有1000w行数据，你10个二级索引，那么总共你光二级索引就存了10x1000w条数据，显然这个成本就太高，不如只在聚簇索引中存一份，其他二级索引要用的时候就回表即可；

5.联合索引

顾名思义：联合索引就是你可以让多个列共同建立一个非聚簇索引，这个就是联合索引，所以联合索引严格来说就是非聚簇索引，比如你可以对A列和B列建立联合索引。

① 非聚簇索引示意图:

6.Innodb索引的补充（非常重要）

三、MyISAM的索引

1.MyISAM跟InnoDB的区别

① MyISAM跟InnoDB一样，它的默认索引也是B+树结构，MyISAM中索引的叶子节点的data域中存放的是数据记录的地址，而InnoDB中非聚簇索引的叶子节点存放的是索引字段的值与主键的值，由于MyISAM是直接拿着地址去找行数据，所以MyISAM的回表操作是十分快速的，而InnoDB是拿着主键值去回表，会相对慢一点

② My ISAM中是没有聚簇索引的，它全部都是二级索引（近似看做二级索引）；

③ InnoDB强制要求表中必须有主键，MyISAM中可以没有主键，但是有主键显然是更好的，因为主键在MyISAM中可以构建B+树索引（只不过构建出来的是非聚簇索引）；如果你没有给InnoDB指定一个主键，InnoDB则会自动选一个唯一不重复的列作为主键，如果不存在这种列，它还会自己生成一个隐式的字段作为主键，这个字段的大小为6个字节，类型为长整型；而MyISAM则不会自动构建主键列；

四、小结

索引的代价

① 空间上的代价

会牺牲一定的空间来存储索引，并且一个表中的索引字段越多，索引占用的空间越大；

② 时间上的代价

建立索引后，查询效率大大提高，但是增、删、改时都需要去重新维护各个索引的B+树，因为原来的页可能会分裂，页里面的数据可能会往后移，等等这些维护操作都让性能降低；

所以：索引并不是建的越多越好，索引越多，B+树就越多，增删改时要维护的B+树就越多，所以在建立索引时一定要在恰当的字段上建索引，这就涉及到索引的优化了；

第三章、InnoDB的数据结构

磁盘与内存交互的基本单位：页

由于磁盘与内存交互的最小单位是页，所以InnoDB也把MYSQL中的数据分成了若干个页，InnoDB中页的大小默认是16kb；

你可以通过SQL命令查看InnoDB中页的大小:

show variables like '%innodb_page_size%'

不同的数据库页的大小也不同，SQL SERVER中页的大小为8KB，而ORACLE中是用了一个'块' Block 的概念来替代页，支持的块的大小有2KB，4KB，16KB，32KB，和64KB；

加深理解：页是磁盘与内存交互的最小单位，对这句话深入理解一下

① 内存从磁盘读取数据，它会把目标数据附近的数据也读出来，总计读取一个页的大小，就算本来这个数据没有一页这么大，它也会读这么大。且把目标附近的数据也读出来的原因是：它会认为通常你读一个数据时，它附近的数据也是极有可能会被使用到的，这是为了节省效率；（注意：这个附近并不是物理上的附近，而是逻辑上靠指针相连的附近）

② 刷盘：把内存中的数据写到磁盘中，这个操作称为刷盘，举个例子：假如你修改了一行数据，这个数据的大小并没有一页，在刷盘时，它也会把一页的数据刷到磁盘上，目的是为了减少io操作，如果你每修改一行就单独刷一次盘，那样io次数太多，还不如一次性刷一页，当然，如果数据操作一页了，就会一次性刷多页；

页的上层结构

什么叫页的上层结构，就是由页组成的那些结构，页的上面有区、段、表空间等；

页的内部结构

① 结构总览：

页的内部空间被划分为7个部分，总共加起来16KB

第一部分：文件头，文件尾

File Header(文件头)：记录页的各种通用信息的，如上一页，下一页的是谁，页号等等，

Header总共占用38个字节，里面包含8个属性，记不住，我们挑4个重点属性进行讲解

FIL_PAGE_OFFSET：这个表示页号，

我们之前讲索引结构时，就能看到页上面有一个页号：

FIL_PAGE_TYPE：表示页的类型，我们学习索引结构时，就知道一个聚簇索引中除了有数据页，还目录页，所以页是有类型的，同时还不止这两种，还有Undo页，系统页等等，Undo页在后面我们会学到，它是跟mysql的事务有关；

FIL_PAGE_PREV和FIL_PAGE_NEXT：这两个就是记录的上一页和下一页的指针，页跟页之间是通过双向链表连接的；

FIL_PAGE_SPACE_OR_CHKSUM：数据和

FIL_PAGE_LSN：日志序列号

File Trailer 文件尾：里面只有两部分，1：数据和，2.日志序列号

内存在和硬盘交互时，默认最小单位是页，但是假如我在传输了一半，整个页只传了一半到磁盘上，就直接断电了，此时我们是不是应该等电脑重启后自动将刷过来的一半给删掉，或者等服务重启后把剩下的一半再刷盘啊，否则你说页是最小基本单位就没有意义，必须保证以页的整数倍进行传输，那开发者们到底是如何保证页的完整传输的呢？

答：这里就必须使用到数据和与日志序列号，主要是数据和，日志序列号打辅助，

举例：我现在要将内存中某页的数据刷盘，内存中这个页，我们刚学了页的基本结构，它肯定有文件头和文件尾，假如我内存中这个页文件头的数据和是123，文件尾的数据和也是123,当我把数据刷盘时，磁盘中肯定也有一个页来接收你的数据，磁盘中这个页文件头、文件尾的数据和都是456，我前半部分刷盘成功的话，我就会把磁盘中页文件头的数据和改成123，后半部分再刷盘成功的话，就会把文件尾的数据和改成123，如果某一天我只刷了一半，此时磁盘中这个页的文件头数据和就是123,文件尾数据和是456，两者不相等，就会触发系统的回滚操作，只要检测到文件头文件尾数据和不相等，就会回滚当前页的数据；其中日志序列号也有类似的作用，但是太底层了，我就没必要深究了；

第二部分：Free Space（空闲空间），User Records（用户记录），Infimum+Supremum（最大最小记录）

第二部分只要是用来存储记录的（此时你应该转变思想，我们把数据叫做记录，而不叫数据），

空闲空间：页中整整有16kb，它就相当于是一个箱子，箱子里没有装记录时，肯定有很多空闲的地方，页中统一把空闲的地方叫做空闲空间

最大最小记录：这两个记录并不是真正的记录，我们在前面学习索引数据结构时，会发现无论是数据页还是目录页，页里面的记录都维护了一个从小到大的顺序，维护这个顺序的目的是为了快速查找，但是在页中，你的记录都是通过一个个的单向链表连接起来，并且每页与每页之间的记录也会通过单向链表连接，相当于说你根本就不知道哪一个记录在你的页中是最小的，哪个是最大的，所以需要在每页中单独加两个标识：一个标识记录着当页中最小记录的指针，另一个标识记录着当页最大记录的指针，当两页相连时，页A的最大记录标识就会记录下一页页B的最小记录的指针，这样页跟页之间就相连起来了；

当一个页中没有插入记录时，空闲空间里面啥也没有，最小记录，最大记录也没有记录指针，

当插入一个记录时，最小记录的指针指向它，最大记录的指针也指向它，

当插入第二个记录时，最小记录的指针指向小的那个记录，最大记录的指针指向大的那个记录，

当空闲空间被占满时，就会开辟一个新的页；（这些真正的记录/数据也被称为user record 用户记录，因为站在mysql的角度来说，我们是使用它的用户，我们存储的记录就叫用户记录，用户记录在页中存储时是按照行格式来进行排列的）。

记录头信息：

我们现在使用create table语法创建一个page_demo表，里面c1，c2，c3列，指定c1为主键，字符集为ascii，同时指定行格式为Compact：

在我们肉眼看起来，一行记录中只有c1，c2，c3，其实并不是，里面有很多东西，一行记录是按照指定的行格式进行排列的，以下是一个完整行格式的示意图：

我们看到行格式主要分为两部分：

一部分记录的是真实数据：

这里面就有c1，c2，c3的值，同时Compact还会给我们新增两个隐藏列；

另一部分是记录的额外信息：主要有三部分

第一部分：变长字段长度列表

第二部分：NULL值列表

第二部分：记录头信息

其中记录头信息中又分为：以下部分：

预留位1，预留位2：这个暂时不解释

delete_mask：用来表示该条记录是否被删除，占1个二进制位，用1个bit表示，1表示删除，0表示未删除；

min_rec_mask：

record_type：用来表示记录类型，0表示这是一条普通的用户记录，1表示这是B+树非叶子节点的记录，比如目录页中的记录就用1表示，2表示最小记录，3表示最大记录；

heap_no：表示当前记录在本页中的位置

比如我现在往表中插入了四条记录，那么第一条记录的heap_no就是2，第二条就是3，依次递增，

那为什么这个heap_no不从0开始呢,却从2开始？这就跟我们前面将的最大最小记录呼应了，每个页中都有一个默认的最大记录跟最小记录，它们的heap_no为0跟1，所以你真实的用户记录就只能从2开始了，也就是说最小记录在页中最靠前，最大记录次之，真实用户记录都在他们后面；

next_record：用来记录下一个记录的指针；

n_owned：

第三部分：页目录Page Directory 与页头Page Header

1.页目录Page Directory

①为什么需要页目录？

假设一个页中有1000条记录，每个用户记录之间都采用单链表的方式进行连接，单链表的特点就是查询慢，删除跟增加快，

题外话：为什么单链表的删除跟增加快啊？

答：因为它删除跟增加都不用移动后面的节点的位置，只需要改变一下指针的指向即可，而数组的增删就非常慢，因为数组在内存中是连续的空间，所以它要改变后面所有元素的位置；

如果我们定位到一条数据在某个页中，拿到这1000条行记录，我们该如何找到我们想要的那一条数据呢？

方式一：采用遍历的方式进行查找，显然效率较低，刚刚才说单链表的遍历非常慢，这种方式显然不靠谱，所以设计者们就设计出了页目录Page Directory

方式二：将页中所有的用户记录按顺序分成一个个组，后一个组中的所有元素一定比前一个组中的所有元素大，将每一个组中最大的元素放入一个集合中，每个位置都称为一个槽slot，这个集合就成为Page Directory，得到这样一个槽的集合后，再通过二分法进行查找，先找到槽，再通过槽去找组，这样效率就高多了：

注意：在聚簇索引中，是将每组中最大的主键放入槽中，而在非聚簇索引中，由于并不是按照主键排序，而是按照索引列的值进行排序，所以它会把每个组中索引列的最大值放入槽中；

②注意：在维护槽的时候，为什么不直接把每一个用户记录的主键作为槽的值记录下来，这样不是更简单吗，还不用将所有用户记录分组：

请求思考一下：一页总共的大小才16KB，如果你将用户记录的主键作为槽的值进行记录，你这个页中有多少用户记录，那么就会有多少个槽，聚簇索引还好，聚簇索引的用户记录会包含完整数据，主键占完整数据的比例并不会太大，但是如果你是非聚簇索引，非聚簇索引的用户记录记录的是索引列的值跟主键，此时你槽中就不是记录主键，而是记录索引列的值了，因为非聚簇索引是按照索引列的值进行排序的，你仔细想想，本身我用户记录就差不多只有索引列的值跟主键值，你再加一个槽，这个操作就占了一个索引列值的大小，基本需要多出50%的空间来存储Page Directory，这很划不来，所以处于空间的考虑，才对用户记录进行分组，同时只将最大值存入槽中；

③关于组的细节：

在对用户记录分组时，最大最小记录也会参与分组

第一组：是由最小记录一个人组成的组

最后一组：是最大记录所在的组，里面除了最大记录，还有最靠后的用户记录

在每个组的最后一条用户记录中，会将本组一共有多少条记录存储到本组最后一条用户记录的记录头信息中的n_owned字段中；

特别的：在最后一组中，由于最后一条记录是最大记录，所以此时是由最大记录的记录头信息中的n_owned字段来存储本组中用户记录的数量。（注意，最大记录，最小记录，也是记录，只不过不是真正的用户记录，它们跟用户记录都遵循同样的行格式）

被删除的用户记录，是不参与分组的

2. Page Header 页头

设计们为了能快速的得到一个数据页的基本状态信息，单独设计了一个Page Header，它们用Page Header来存储：

当前页还剩多少空闲空间

本页中记录的数量（包含最大最小记录，以及被删除的记录）

本页中纯用户记录的数量（不包含最大最小记录，以及被删除的记录）

垃圾链表中第一个被删除的用户记录的地址

当前页在B+树中所在的层级

当前页所在的索引ID

以及其他等等。。。。。

面试题：

普通索引和唯一索引在查询效率上有什么不同？

唯一索引更快，但是也不会快很多，因为首先是先将页读到内存再进行查询，cpu进行操作时，速度非常之快，所以可以说效率相差无几；

行格式

Mysql5.7和8.0的默认行格式是Dynamic

①创建表时指定行格式

Create table 表名（

c1 varchar（10），

c2 varchar（10），

c3 varchar（8），

）charset = ascii ROW_FORMAT = Compact

②Compact行格式（翻译过来是紧凑的意思）

在上面讲记录头信息时，我们提前将Compact行格式的结构图进行了讲解，现在就接着这个图讲：

变长字段长度列表：什么叫变长字段？varchar，text，Blob等这些类型的字段就是变长字段，char类型不是变长字段。

比如:

我在表中创建了两个字段

varchar字段 c1，长度指定为了10，

varchar字段c2，长度指定为了8，

我将c1字段的值赋为'abcd',

c2字段的值赋为'ab',

此时实际上c1字段的长度为4（因为是4个字节），c2字段的长度为2，那么变长字段长度列表中就会记录下这两个字段的实际长度，记录为0204（倒序记录的，将靠后字段的实际长度放在前面，靠前字段的实际长度放在后面）；

Null值列表：记录着当前记录中哪些字段的值为null

隐藏列：Compact行格式中，除了记录真实列外，还为每个记录新增了三个隐藏列，分别如下：

row_id：行id，唯一标识一条记录

在前面学习索引时，我提到过一嘴，在InnoDB中，如果你没有指定主键，且表中没有一个UNIQUE修饰的字段时，InnoDB会自动帮你生成一个隐式的唯一不为null的字段作为主键，这个字段其实说的就是这个row_id。注意，如果你这个表中已经提供了主键，那么InnoDB则不会生成row_id。

transcation_id：事务id（后面再细说）

roll_pointer：回滚指针（后面再细说）

③Dynamic和Compressed行格式（Dynamic是动态的意思，Compressed是被压缩的意思）

行溢出：InnoDB可以将一条记录中的某些数据存储在真正的数据页之外，当它把某些数据存到真正数据页之外时，这就叫行溢出。

。。。。。有待补充

④Redundant行格式（翻译过来是冗余的意思）

。。。。。有待补充

区，段，表空间

① 区

B+树每一层的页都会形成一个双向链表，它们的真实物理地址在磁盘上可能是隔得很远的，如果我们想查的数据所在的页已经被加载到了内存还好，我们直接在内存中查询速度很快，就怕的是某个页还没被加载到内存仍然在磁盘中，同时我们想要的数据就在这个页中，此时你就得到磁盘上去找了。

但磁盘中寻址的速度是非常慢的，为什么磁盘的寻址速度慢？

磁盘的物理结构：

我们平时看到的磁盘其实是下面这个样子（不是固态）

解剖图：

从上面的解剖图可以看出，磁盘是由多个'光盘'组成，每个'光盘'的两面都散步的大量的磁性物质，

每个'光盘'每一面都有一个读写磁头，读写磁头可以改变磁性物质的两极转向来模拟二进制01，所以磁盘可以用来存储二进制数据。

磁盘的每一面被分为很多条磁道，即表面上的一些同心圆，越接近中心，圆就越小。而每一个磁道又按512个字节为单位划分为等分，叫做扇区，我们的数据就存放在这些扇区中的。

磁盘的旋转速度为7200转每分钟，换算下来≈8.3ms转一圈，也就是要完成整个磁盘的查找的话，至少要8.3ms，这个速度相对于内存是非常非常慢的，内存的速度是ns级别，中间差了十几万倍。

所以再回到刚才那个问题：如果我们想找到磁盘中的某个页，显然这个时间就可能是ms级别，非常的慢，所以此时设计者们就想出了一个办法 >>>>> 顺序存储与批量读取

顺序存储：

在之前，不同的页可能分散在磁盘中不同的地方，你要从页A找到页B你必须要经过磁盘的旋转,并且页A跟页B可能还离得很远，这样在磁盘中旋转查找时就非常的慢，所以设计者们就将所有的页在磁盘中进行顺序存储，也就是页与页之间是紧密相邻的，但由于磁盘中数据量巨大，无法做到给全部页都分配连续的空间，但是可以将所有页都分成不同的区，每个区中都有64个页，区中的页在物理磁盘上是紧密相邻的，不同的区之间又通过双向链表连接；

这样设计的好处是：假如我想查询c1字段大于20小于3000的用户记录，我定位到了大于20小于1500的用户记录都在页A中，剩下的全在页B中，原来的方式就需要我旋转磁盘，这个旋转幅度有可能大有可能小,基于两个页的位置决定，但是现在不同了，页A跟页B都在同一个区中，且是紧密相连的，我的磁盘只需要旋转一丁点就可以找到页B，显然这样的速度就非常快了。

再提一嘴：一个区就是在物理磁盘上紧密相连、连续的64个页，一个页16kb，一个区64x16正好就是1MB。

批量读取：

磁盘的吞吐量是40MB每秒，也就是磁盘可以一次性输出/输入40MB数据，40x64=64个区=2560个页，也就是我们不再一个页一个页的传输数据给内存了，而是一次性要传就传64个区，1秒钟传64个区给内存，算下来传输一个页只需要0.4ms，在内存中查找一个页的速度大概是1ms（意思是：这个页已经被加载到了内存，我在内存中找到它），这样批量读取的速度比你直接在内存中查还要快，极大的提高了磁盘与内存的交互效率。

综上所述：已经将为什么需要有区的概率解释清楚了。

②段

③碎片区

④表空间

第四章：索引的创建与设计原则（索引优化）

一、索引的声明与使用

1.索引的分类

不同的角度可以有不同的分类方式：

按功能逻辑划分：索引可分为：普通索引，唯一索引，主键索引，全文索引

按底层物理实现方式：索引可分为：聚簇索引，非聚簇索引/辅助索引/二级索引

按作用字段个数进行划分：索引可分为:单列索引，联合索引

①.普通索引：

创建索引时不附加任何约束条件，也不要求非空和唯一，只是用于提高查询效率，这类索引可以创建在任何数据类型的字段中。

②.唯一索引：

注意：当你在创建表时，使用了UNIQUE修饰字段，那么mysql会自动为这个字段添加唯一索引。

如果你想删除对这个字段的唯一性约束，你只需要删除这个字段的唯一性索引即可实现。

创建了唯一索引的字段，必须唯一，但是可以有NULL值。

注意：唯一索引比普通索引更快，但在内存中操作也不会快太多；

③主键索引：

主键索引就是特殊的唯一索引，必须唯一且非空，一张表里最多只能有一个主键索引。

为什么只能有一个主键索引？

这是因为InnoDB引擎在底层实现聚簇索引的物理结构就是这样的，前面讲过。

④联合索引：

联合索引唯一值得注意的是：最左匹配原则，后面我会讲。

⑤空间索引：

⑥全文索引：全文检索基本不用mysql，所以这里不讲它

2.创建索引

在create table时我们可以创建索引，如果没有在建表时创建索引，也可以后期使用alter table的方式来添加索引，或者也可以使用create index语句在已存在的表上添加索引。

① 建表时创建索引

语法格式：

案例1：创建普通索引

create table tableName(
    id INT,
    name VARCHAR(100),
    age INT,
    #创建普通索引
    INDEX 索引名称(列名)
);

案例2：创建唯一索引：

如果你要创建唯一性索引，全文索引，空间索引，在INDEX前面加上对应的修饰词UNIQUE，FULLTEXT，SPATIAL即可
如下：
create table tableName(
    id INT,
    name VARCHAR(100),
    age INT,
    #创建唯一性索引
    UNIQUE INDEX 索引名称(列名)  #你也可以把INDEX关键字换成KEY也是可以的。
);

案例3：创建联合索引

create table tableName(
    id INT,
    name VARCHAR(100),
    age INT,
    #创建联合索引
    INDEX 索引名称(列名1，列名2)  #你也可以把INDEX关键字换成KEY也是可以的。
);

注意：联合索引的B+树，叶子节点的排序规则：会先以列名1的值排序，如果列名1的值相同，再以列名2排序。

案例4：创建索引时指定长度

在前面我们看了创建索引的语法，如下：

这里的length使用场景是：当你要对某一个字段添加索引，但是这个字段的值特别长，比如这个字段是一个text类型，显然你将这个字段的值存入叶子节点就不太合适，因为太大了，所以你可以通过length来指定长度，比如指定为10，只将这个字段的前10位作为值存到叶子节点中，这样就大大的节省了空间，同时也能达到索引的目的，没有必要全部存进去；

用法：INDEX 索引名称(列名1(10)) >>>>> 前面的建表语句我省略了，在使用时请自动加上建表语句。

案例5：创建空间索引

。。。。。。。对空间索引，我暂时还不熟，这里不写案例，后面熟悉了再补充。

②给已经建好的表添加索引：

>>> alter table的方式：

ALTER TABLE 表名 ADD UNIQUE | FULLTEXT | SPATIAL INDEX | KEY 索引名（列名（截取的长度））INVISIBLE | VISIBLE

>>> create index的方式：

CREATE UNIQUE | FULLTEXT | SPATIAL INDEX | KEY 索引名 ON 表名 (列名(截取的长度)) INVISIBLE | VISIBLE

③查看表中的所有索引：

SHOW INDEX FROM 表名 #查看某张表中的索引

3 删除索引

删除索引的场景：当你要对某张表的数据进行大量的增删改时，你可以先将这张表的索引删掉，如果不删，当你去增删改时，InnoDB会同步的维护这些索引的B+树，成本很高，所以你先将索引都删掉，等增删改查完成后，再把索引加回来，就可以极大的提高效率。

①使用alter table 来删除索引

ALTER TABLE 表名 DROP INDEX 索引名；

②使用drop index来删除索引

DROP INDEX 索引名 ON 表名；

注意1：被AUTO_INCREMENT修饰字段的唯一索引不能被删除，为什么？

答：AUTO_INCREMENT只能存在于有主键约束或者有唯一约束的字段上，假如你把一个列的唯一索引删掉了，那么这个字段的唯一约束就没了，这个字段如果不是主键的话，那么就违背了AUTO_INCREMENT只能存在于主键约束或唯一约束字段上的原则了，所以被AUTO_INCREMENT修饰字段的唯一索引不能删除。

注意2：

>>>>> 如果你这个字段已经添加了索引，你把这个字段删除时，这个字段的索引也会被删除；

>>>>> 如果你对列A，列B，列C合在一起添加了联合索引，你将任意一个列删除了，这个联合索引的叶子节点中被删除列的值就会消失，如果你把这三个列都删完了，这个联合索引也没了；

二、 Mysql8.0索引的新特性

1.支持降序索引

① 降序索引的语法与意义

再拿出我们前面的创建索引的语法，后面有个ASC，DESC，这个就是用来指定索引是降序还是升序的，

什么意思？

比如你对col1列创建索引，在MYSQL8以前，这个索引的叶子节点中，默认是对这个列的值升序排列的，现在不同了，你可以通过SQL语法来将其指定为DESC，如果不指定，默认就是升序；

案例：

CREATE TABLE 表名（
    列名1 INT,
    列名2 VARCHAR(10)
    INDEX 索引名(列名1，列名2 DESC)
）

我这里就是创建了一个列名1跟列名2的联合索引，

列名1我没有指定ASC或DESC，默认就是ASC，

在构建B+树的叶子节点时，首先会按照列名1来进行升序排序，如果两个用户记录出现了列名1的值相等的情况，就会再以列名2的降序进行排列。

②为什么需要降序索引

没有降序索引之前，我对列名1创建一个索引，默认就是升序的，当我使用

SELECT * FROM 表名 ORDER BY 列名1 DESC时，此时查询速率会明显降低，因为在底层InnoDB会反向查找，效率不高，所以需要降序索引；

注意事项：

我现在常见了一个联合索引，对列A升序，对列B降序，

CREATE TABLE 表名（
    列名1 INT,
    列名2 VARCHAR(10)
    INDEX 索引名(列名A，列名B DESC)
）

此时我使用SELECT * FROM 表名 ORDER BY 列A,列B DESC进行查询，是完全符合索引中叶子节点的结构的，所以可以很快速的查找到；

但是如果我使用了SELECT * FROM 表名 ORDER BY 列A DESC,列B DESC，将列A也进行降序排序，就跟索引中叶子节点结构不同了，InnoDB在查询时就还是会进行反向查询，效率依然不高；

解决办法就是：你再单独创建一个列B降序，列A也降序的联合索引就可以了，只不过是多了一个B+树；

我这里只举了联合索引的例子，对单列索引肯定也适用的。

2. 隐藏索引

我们创建索引时，默认这些索引都是visible的，也就是可见的状态，我们也可以将其设置为隐藏状态invisible；

①索引的硬删除：

我们前面讲了索引的删除，无论是使用alter table，drop index都是硬删除，它们都是硬删除，你将这个索引删除后，不排除会出现问题，等出现问题后，你又将索引创建回来，如果你的表中数据量非常大，这一套操作下来，InnoDB在恢复这些索引的B+树时消耗的资源就非常多，成本很高，所以就需要一个软删除，这是用invisible就起来作用了；

②索引的软删除：

在删除一个索引前，你可以先将这个索引修改为invisible隐藏状态，使查询优化器不再使用这个索引，即使你使用force index强制使用这个索引，查询优化器也不会使用这个索引，等你确认索引隐藏后，系统没有受到任何影响，你就可以彻底的删除掉这个索引，这种就叫软删除；

同时：如果你想验证这个索引删除后的查询性能差异，你也可以考虑暂时隐藏该索引

注意1：主键是不能被设置为隐藏索引的；

注意2：当索引被隐藏时，你再增删改数据时，这个隐藏索引的B+树也是会被更新的，也会影响增删改的性能，所以你一旦确认这个隐藏索引确实不需要了，还是建议你删掉它；

③隐藏索引的三种方式

>>> 建表时创建一个索引，并将其指定为隐藏索引

CREATE TABLE 表名(
    列A INT,
    列B VARCHAR(20),
    INDEX 索引名(列B(5) DESC) INVISIBLE #如果不指定INVISIBLE，默认就是VISIBLE
)

>>> 使用ALTER TABLE创建隐藏索引

1、为某表添加一个隐藏索引

ALTER TABLE 表名 ADD UNIQUE | FULLTEXT | SPATIAL INDEX 索引名(列名(截取长度)) INVISIBLE；

2、将表中的某个索引修改为隐藏状态

ALTER TABLE 表名 ALTER INDEX 需要隐藏的索引的名称 INVISIBLE；

将隐藏索引改为显示状态：

ALTER TABLE 表名 ALTER INDEX 需要隐藏的索引的名称 VISIBLE；

>>> 使用CREATE INDEX来创建隐藏索引

CREATE UNIQUE | FULLTEXT | SPATIAL INDEX 索引名(列名(截取长度)) INVISIBLE ON 表名

三、索引的设计原则（重要）

1. 哪些情况适合加索引

①字段本身就是唯一的，但是既没有加唯一性约束，也没有加主键约束的字段适合加索引

此时就适合给它添加唯一索引，因为就算这个字段本身是唯一的，但是没建立索引，对它的查询效率也不会提高；

举例：学号，学号都是唯一的，所以你可以对其添加唯一索引

②频繁作为WHERE查询条件的字段适合加索引

③经常GUOUP BY 和ORDER BY的字段适合加索引

注意：并不是WHERE条件后才会触发索引，我GRUOP BY 列A，如果这个列A有索引，也会触发索引，同理ORDER BY 列A，也会触发索引；

1.经典案例：（一定要看）

现在有下面这样一个查询语句：

SELECT student_id,COUNT(1) AS num FROM student_info
GROUP BY student_id
ORDER BY create_time DESC;

如果要让你来创建索引，来优化这条SQL的查询效率，你会怎么优化呢？

错误的方式：我对student_id建一个唯一索引，对create_time再建立一个降序索引（因为这个SQL是对create_time降序排序）

第一步：单独为student_id建立一个唯一性索引，索引名：student_id

ALTER TABLE student_info ADD UNIQUE INDEX student_id(student_id) VISIBLE;

第二步：再单独为create_time建立一个降序普通索引，索引名：create_time

ALTER TABLE student_info ADD INDEX create_time(create_time DESC) VISIBLE;

但显然使用这种方式来创建索引，你基本上达不到优化的目的，为什么？

首先：SQL的执行顺序中，先走FROM，再走GRUOP BY，再走ORDER BY（部分顺序没说完），显然当SQL执行到GROUP BY时，InnoDB就已经发现student_id有索引了，所以它会去走student_id这棵B+树，从始至终根本不会走create_time的B+树，你的create_time索引建了个寂寞，如果你student_id没有索引，那么最后就会走create_time这个索引；

但是如果InnoDB走到GROUP BY时，除了发现student_id有一个单列索引了，还发现student_id还有一个联合索引,并且student_id还是联合索引中最左的列，那么InnoDB就不会走student_id单列索引，而会去走联合索引；

另外，如果InnoDB走到GROUP BY这里，发现student_id有一个联合索引，但是student_id不是最左的列，它还会走这个联合索引吗？就不会走这个联合索引了，此时如果student_id有单列索引，它就会走单列索引；

正确的方式：

对student_id，create_time建立联合索引，并且要保证student_id在前，create_time在后，同时让create_time的降序排列

ALTER TABLE student_info ADD INDEX student_id_create_time(student_id,create_time DESC) VISIBLE

④UPDATE，DELETE的WHERE条件列也适合添加索引

举例：

UPDATE student_info SET student_id = 10001 WHERE student_name = '许海'；

DELETE FROM student_info WHERE student_name = '许海';

这两个语句后面的student_name字段都适合加上索引；

注意：在使用UPDATE语句时，我们对WHERE条件后的字段加了索引，会大幅度提升InnoDB找到这条记录的效率，同时如果UPDATE语句中更新的字段不是索引字段，那么提升的效率会更明显，为什么？它不是索引字段，InnoDB就不用去维护它的B+树啦，当然速度是极快的；

⑤DISTINCT修饰的字段适合创建索引

为什么DISTINCT修饰的字段适合创建索引呢？

假如你不对去重字段建立索引，要实现去重功能：肯定是要先将表中该字段的所有值全都查出来，然后再去掉重复的值；

如果对去重字段建立了索引，那么这个字段相同的用户记录基本上都是在同一个数据页中（小概率不在，就算不在，也肯定是在紧密相邻的数据页中），此时InnoDB就可以在查询的同时对字段进行去重，不需要查询完成后再去重了，效率更高；

比如SELECT DISTINCT(student_id) FROM student_info 这句sql要提升效率，你就可以对student_id建立索引

⑥多表JOIN联表查询时的注意事项

联表查询时，连接的表尽量不要超过3张，每多一张表就相当多嵌套了一次循环，呈指数级的增长，严重影响查询效率；

对用于连接的字段，也适合创建索引，并且该字段在参与连接的表中的数据类型要保持一致；

看下面的SQL：

SELECT course_id,name,student_info.student_id ,course_name

FROM student_info JOIN course ON student_info .course_id = course.course_id

WHERE name = '许海'；

我要对这个SQL进行效率的优化，

--->首先，我们看到WHERE，就应该想到可以对name字段加索引；

---> 其次，如果数据量确实大，我还可以继续对用于连接的字段创建索引，这里的连接条件是ON student_info .course_id = course.course_id，也就是我们在student_info，course这两张表中都对course_id字段建立索引，同时还要保证两张表中的course_id字段是同一个类型，不能一个是varchar，一个是int，虽然一个是varchar，一个是int也能查出来，因为'101'这种数字类型的字符串在ON连接一个int类型时，会被隐式的转换成int类型，但这中间是经过了mysql的函数的，只要有函数，就会导致索引失效，所以一定要保证ON两边的字段类型类型相同；

⑦创建列时，能使用小类型，就尽量使用小类型

什么意思呢？比如我现在要创建一个id字段，我可以用int，bigint，varchar，等等很多，在满足业务要求的情况下，尽量选择小的，就尽量选择int，为什么呢？

字段的类型小，它所占用的空间就小，一页中就能存储更多的用户记录，B+树就能更加的扁平，减少B+树层级，从而IO次数

字段的类型小，在进行查询时，InnoDB进行的比较操作就越快，数据类型越大，比较越费时间；

⑧使用字符串前缀创建索引

当一个字段是字符串时，且这个字符串比较长时，我们创建索引时是否有必要将完整的字符串作为索引值来构建B+树，显然没有必要，所以我们在对这类长字符串的字段建立索引时，可以限制索引截取的长度，前面的创建索引有讲语法；

这样的好处是：即减少了比较时间，又节省了数据页中的空间；

问题是：截取多少呢？截多了达不到节省空间和减少比较时间的目的，截少了又会导致重复值太多，索引效率不高

-----待补充----：越接近于1越好，学到这里时由于我没有学习mysql的函数，这里不是特别明白，所以后续学完了再进行补充

拓展：Alibaba规约：

在对varchar字段建立索引时，必须指定索引长度。

开发经验：通常截取长度达到20时，区分度就会达到90%以上，但是你最好是用上面的公式自己算一算；

⑨区分度越高的字段越适合建立索引

意思是：相同值越少的字段越适合建立索引

⑩在创建联合索引时，将使用最频繁的列放在联合索引的最左侧

这是因为联合索引有一个最左匹配原则，不满足最左匹配原则会导致索引失效，所以应该让使用最频繁的列放在联合索引的最左侧；

（这里我没有提mysql的优化器对最左匹配的优化，比如SELECT * FROM 表名 WHERE student_id = 10013 AND course_id = 100，假如我建的联合索引是将cours_id放在前，student_id在后，按我们现在学的知识来说，这个联合索引是会失效的，但实际使用过程中还是会走这个联合索引，因为mysql的优化器会自动对这种情况进行优化）

但是我们前面讲过一个SQL：

SELECT student_id,COUNT(1) AS num FROM student_info

GROUP BY student_id

ORDER BY create_time DESC;

使用GROUP BY跟ORDER BY的组合进行查询时，优化器是不会对最左匹配原则进行优化的，我们上面有讲解过案例；

11）在多个字段都要创建索引的情况下，联合索引优于单列索引

开发经验：建议单表中索引不要超过6个，我们前面都学过了，索引会占空间，且影响到增删改的效率

2.哪些情况不适合加索引

①where条件中（包括order by，group by中）用不到的字段不适合加索引

加了也没用，纯纯浪费感情。

②数据量小的表，最好别加索引（开发经验：数据量低于1000行你还是别创建索引了）

你加了索引，如果是非聚簇索引，还可能需要回表，完全没必要，多的时间都去了。

③有大量重复数据的列，不要对它创建索引

开发经验：当一个列的重复数据高于10%时，这个列就不适合创建索引了。

④避免对经常更新的表创建过多索引

⑤不建议用无序的值作为索引，比如UUID，身份证号等这些值作为索引会产生页分裂的情况。

⑥不要建立冗余的索引

比如：我创建了一个联合索引(name,birthday,phone)，又对name创建了一个单列索引，

那么name这个单列索引就纯粹是冗余的，因为它联合索引完全可以替代name这个单列索引，效果完全一样。

第五章、性能分析工具的使用

一、数据库优化的步骤

二、查看系统性能参数：

Mysql中，可以使用show status命令查询Mysql服务端的性能参数，执行频率等。

1.show status语法：

show [ global | session ] status like '参数';

一些常用的性能参数：

Connections：连接Mysql服务器的次数。

Uptime：当前Mysql实例运行的时长，单位秒。

show status like 'Uptime';

结果为：

表示我当前这个mysql服务器已经运行了609423秒，当你把mysql服务器重启后，这个时间又会从0开始计算。

Slow_queries：Mysql服务器记录的慢查询SQL的次数。

注意：默认情况下，超过10秒的查询SQL会被当成慢查询，我们后续可以自己改这个阈值，请往下看。

Innodb_rows_read：select语句返回的行数，注意：这是整个Mysql实例运行期间的总查询行数，以下几个参数同理。

Innodb_rows_inserted：执行insert语句插入的行数，注意：这是整个Mysql实例运行期间的总插入行数，以下几个参数同理。

Innodb_rows_updated：执行update语句更新的行数。

Innodb_rows_deleted：执行delete语句删除的行数。

Com_select：查询操作的次数。

Com_insert：插入操作的次数，对于批量插入的insert操作，只累加一次。

Com_update：更新操作的次数。

Com_delete：删除操作的次数。

2.统计SQL的查询成本：last_query_cost，翻译过来就是最近一次的查询花费了多少成本。

①举例：我先执行一个查询语句，如下：

select * from student_info where id = 900001;

再执行：

show status like 'last_query_cost';

我们就能看到最近一次查询语句所消耗的成本，最近一次查询语句就是我们刚才执行的select * from student_info where id = 900001;

执行结果就是：value = 1的意思是：本次查询只用到了一个数据页，显然这个速度很快。

注意：last_query_cost的结果可能是个小数，就如下面的结果，

意思是;总共用到了21个数据页，只不过最后一个数据页只查询了一部分就找到了结果。

②注意：

从页加载的角度来看：

如果这个页就在数据库的缓冲池中，那么它的加载效率是最高的，比内存还高，如果这个页不在缓冲池中，就会从内存或者磁盘中读取。

如果我们从磁盘对单一页进行随机读，那么效率很低，差不多10ms左右，如果我们采用顺序IO读取的方式，批量对页进行读取，平均一页的读取效率甚至要快于单个页在内存中的随机读取。

所以，遇到IO不用担心，方法找对了，效率还是很高的，我们首先要考虑数据页存放的位置，如果是经常使用的数据，就尽量要放到缓冲池中，其次我们可以充分利用磁盘的吞吐能力，一次性批量读取数据页，这样对单个页的读取效率就能明显提升。

3.慢查询日志

默认情况下：Mysql是没有开启慢查询日志的，就像Mysql5.7默认是不开启binlog日志的，

平时不做性能调优的话，建议不要开启慢查询日志，因为开启后，Mysql server会把超过阈值的查询语句记录到慢查询日志文件中，这会损失一定的性能，在性能调优结束后，建议你关掉慢查询日志。

①查看当前Mysql server中慢查询日志是否开启：

show variables like 'slow_query_log';

以下就是显示没开启的状态：

②开启慢查询日志：

set global slow_query_log = on; 注意：global后面没有点'.'
或
set @@global.slow_query_log = on; 注意：global后面有点'.'

③查看真正的慢查询日志文件：

说是慢查询日志，肯定最终要有一个文件来记录这些慢查询，说到最后都要定位到这个文件，那么这个文件在哪里呢？

通过这个命令就能找到真正慢查询日志文件到底在哪里：

show variables like 'slow_query_log_file';

结果：

如果是linux系统，那么该文件在/var/lib/mysql目录下。

④修改慢查询的阈值

show variables like 'long_query_time';

我们可以看到，阈值默认是10秒，超过10秒就会被认为是慢查询（不包含10）；

显然10秒这个时间太长了，所以我们需要重新设置一个合适的值：

set global long_query_time = 1;  注意：global后面没有点'.'
或
set @@global.long_query_time = 1; 注意：global后面有点'.'
注意：
long_query_time即是全局系统参数，又是会话系统参数，你只改全局是不行的，你还需要修改会话系统参数。
set long_query_time = 1;

注意：你通过上面的方式进行修改，配置是没有持久化的，下次mysql重启后又恢复老样子了，所以你可以直接修改my.ini配置文件。

⑤查看当前mysql实例的的慢查询日志：

show status like 'Slow_queries';

结果：

这里的value = 2意思是总共有两次慢查询的记录，那如何找到这两条慢查询SQL呢？这就需要慢查询分析工具了。

⑥慢查询日志分析工具：mysqldumpslow

mysqldumpslow是mysql专门提供的用于慢查询分析的工具，该工具不是在mysql命令行中运行，要在linux中执行；

不是在mysql命令行中执行，mysql命令行中是执行sql的，而mysqldumpslow是一个脚本文件，需要在linux命令行中执行，如下：

help命令查看帮助：mysqldumpslow -help

说明：

-s代表将慢查询sql以什么方式进行排序，后面跟at就表示按平均查询时长排序，后面跟t就表示按什么时候执行的排序

-t代表展示前几行，例如：-t 5就表示展示前5个慢SQL

-a：这个需要解释一下：假如你的慢查询SQL是select * from employee where name = '许海',等你使用mysqldumpslow工具将其查询出来时，字符串'许海'会被替换成'S'，如果是数值，会被替换成'N',所以就变成了select * from employee where name = 'S'；

如果你不想要这种替换，那么你就得把-a这个参数带上。

使用案例：

结果：红色框圈起来的，就是查出来的慢SQL

⑦关闭慢查询日志

永久性方式：

修改my.cnf或者my.ini文件，把slow_query_log设置为off，或者直接把 slow_query_log = off这一项从配置文件中删掉，再重启mysql服务器就可以了。

临时性方式:

使用set语句来设置

⑧删除慢查询日志文件

如果你想节省空间，慢查询日志文件对你又不需要了的话，你可以在linxu中直接使用rm命令将慢查询日志文件删掉；

删掉后，如果你想重置慢查询日志文件，意思就是：我还想用慢查询日志文件，但是想要一个全新的，没有记录的文件，

那么你可以使用命令：

mysqladmin -uroot -p flush-logs slow

注意：flush-logs表示刷新所有日志文件，包含慢查询日志，binglog，redolog日志，如果你只是想刷新慢查询日志，

你就在后面加上slow即可；

注意：你要利用刷新日志文件的方式重置慢查询日志的话，你需要先将slow_query_log 设置成on，表示打开慢查询日志，否则不会生成新的日志文件。

4.explain查看执行计划（或者用describe关键字，两者等价）

上一步中，我们知道了到底是哪些SQL语句执行速度慢，我们现在就可以利用explain关键字来分析这些SQL；

在5.6版本及以前，explain只能对select语句查看执行计划，在5.7以及之后的版本，还可以对update，delete，insert等语句查看执行计划。

①explain中各个字段的意思：

其中重要的有：

type：表示针对单表的访问方法，什么意思呢？

key：实际上使用到的索引

key_len：实际使用到索引的长度

rows：预估的需要读取的记录条数

extra：额外信息

todo待完成。。。。。explain中的东西比较多，以后再补；

第六章：索引优化、查询优化

有哪些维度可以对数据库进行调优？

一、索引失效案例：

现在我有三个索引：

① (age，class_id，name)

② age

③ (age，class_id)

1.尽量做到全值匹配

又有三条SQL：

select * from student where age = 30;

select * from student where age = 30 and class_id = 4;

select * from student where age = 30 and class_id = 4 and name = '许海';

以上三句SQL，哪句会走索引？

答：三个都会走索引。

再问：这三条sql语句，哪一个

2.最左匹配原则

select * from student where class_id = 4 and name = '许海';

这句会走索引吗？不会。

select * from student where class_id = 4 and age = 30 and name = '许海';

这句会走索引吗？会，虽然顺序没有让age排一个，但是mysql底层的优化器会优化我们的sql。

总结：要想使用上联合索引，你的SQL必须带有最左边的字段，否则用不上。

3.主键插入顺序

4.计算、函数、类型转换（自动或手动）会导致索引失效。

1.函数导致索引失效

比如：下面两句SQL谁更好呢？

selsect * from student where name like 'abc%';

selsect * from student where left(name,3) = 'abc';

虽然两句SQL最后的结果都是一样的，但是第一个SQL能用上name索引，第一句SQL无法使用name索引，因为对name字段使用了name函数。

由于函数都是千奇百怪的，mysql并不确定name字段的值经过各种函数后会变成什么样子，所以无法使用上索引，只能是把整张表中所有name字段的值都拿出来跟left函数运算，再跟'abc'做对比，所以使用不上所用。

但是上面的like 'abc%'是可以用上索引的。所以：除了where，order by，group by，还有like也会触发索引

2.计算导致索引失效

selsect * from student where age + 1 = 18;

selsect * from student where age = 17;

这两句结果都是一样的，但是由于第一句对age做了计算，也导致它不能使用age索引，原因跟函数导致索引失效一样，mysql无法判断你的age进行各种计算后会是什么结果，只能是全表扫描把所有age都拿出来+1跟18做对比。

3.类型转换导致索引失效

由于name是字符串类型，你用name等于一个数值类型123，是无法走索引的。

原因是：mysql会先将name的值用隐式的类型转换函数转换成字符串类型，再做对比，

由于对name字段使用了函数，就会导致name索引失效。

selsect * from student where name = 123;

4.范围条件右边的索引会失效

我现在有一个联合索引（age，classId，name）,

select * from student
where age = 30 and classId > 30 and name = '许海';

按照我们前面学习的知识，这句SQL应该会走这个联合索引，并且age，classId，name三个字段都能用得上，

但实际确实：该联合索引能用上，但是只能用age，classId两个字段，name这个字段无法使用上索引，

因为classId > 30是一个范围条件，它右边的所有字段都走不了索引，所以就导致name无法走索引。

注意：我说的右边，指的是联合索引中classId的右边，如下图：

而不是SQL语句中classId的右边：

所以，就算你把SQL语句中name跟字段的位置交换，name字段也是用不了联合索引的。

select * from student
where age = 30 and name = '许海' and classId > 30;

注意1：name无法走上面这个联合索引，那它能单独走name的单列索引吗？

答：一定要注意了，一条sql只能走一个索引，既然已经走了联合索引，就无法走其他单例索引了。

注意2：代表范围的，除了上面的大于，小于...还有不等于，between也属于范围，它也会导致索引失效。

5. is null能使用索引，is not null无法使用索引。

因为B+树中，null值也参与了排序，所以能通过B+树很快找到所有null值，但是is not null却需要全表扫描才能找到所有不是null的值。

开发经验：在设计数据表的时候，最好给字段添加非空约束，比如你可以将int类型的字段默认值设置为0，而不是null将字符串的默认值设置为""而不是null，那么你以后在查询SQL时就不用where is not null了，就可以避免is not null导致索引失效。

6. like查询时，通配符%在左边会导致索引失效。

比如：下面的sql就会导致索引失效。

select * from student
where name like '%许海';

但是通配符%在右边不会导致索引失效，如：

select * from student
where name like '许海%';

为什么'%许海'会导致索引失效呢？

因为你这个值的开头都没有确定，我就完全不知道该从B+树哪里开始找，只能全表扫描了。

但是'许海%'左边是确定了的，所以我就知道从B+树的哪里开始找更近，因为左边的'许海'是确定了的，所以我们可以找排在'许海'后面的行记录。

阿里巴巴规约：页面搜索严禁使用左模糊或全模式，就是因为会导致索引失效，如果你非要用，就请使用搜索引擎。

7. or的前后存在非索引的列，会导致索引失效

假如我对name建了索引，age没有建索引，那么下面的SQL就无法走name这个索引。

select * from student
where name = '许海' or age = 20;

原因是什么呢？

虽然通过B+树可以很快找到name等于'许海'的行记录，但是mysql还需要去找age=20的行记录，所以最终也要进行全表扫描，所以就相当于name索引失效了。

8. 数据库的字符集和表的字符集不相同导致索引失效

不同的字符集在进行比较前需要进行转换，而转换会导致索引失效。

9. 索引练习：

现在我有一个联合索引（a，b，c）,

请看下面的语句，哪些能使用到索引？

二、多表查询的优化

你可能感兴趣的:(mysql,数据库)

计算机毕业设计Python+uniapp校园兼职系统小程序(小程序+源码+LW) Python毕设源码程序高学长 python 课程设计 uni-app
计算机毕业设计Python+uniapp校园兼职系统小程序(小程序+源码+LW)该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+uni+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+UNI等等组成，B/S模式+pychram管理
Python-Django毕业设计养老院老人日常生活管理系统（程序+Lw) Python计算机毕设程序源码_ python django 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+Vue等等组成，B/S模式+pychram管理等等。环境需要1.运行环境：最好是python3.7.7，我们在这个版本上开发的。其他版
mysql 清除事物_mysql事物处理
mysql事物主要用于处理操作量大，复杂度高的数据。比如说，在人员管理系统中，你删除一个人员，你既要删除人员的基本资料，也要删除和该人员相关的信息，如信箱，文章等。这样，这些数据库操作语句就构成一个事物。注意一下几点：在MySQL中只有使用了Innodb数据库引擎的数据库或表才支持事务。事物处理可以用来维护数据库的完整性，保证成批的sql语句要么全部执行，要么全部不执行。事物用来管理insert，
MySQL(149)如何进行数据清洗？辞暮尔尔-烟火年年 MySQL mysql python 数据库
数据清洗在数据处理和分析过程中至关重要，确保数据质量和一致性。以下是一个详细的指南，展示如何使用Java进行数据清洗，包括处理缺失值、重复值、异常值、数据类型转换以及标准化等步骤。一、准备工作确保安装有Java开发环境（JDK）和Maven或Gradle等依赖管理工具。我们将使用ApacheCommonsCSV库来处理CSV文件，并使用Java标准库进行数据清洗操作。二、加载数据首先，我们加载数据
MySQL(147)如何进行跨平台迁移？辞暮尔尔-烟火年年 mysql adb 数据库
跨平台迁移涉及将数据库从一个操作系统或平台迁移到另一个，例如从Windows迁移到Linux，或从不同架构的硬件之间进行迁移。这个过程比同平台迁移更加复杂，需要特别注意数据库的兼容性、数据编码、文件路径等问题。以下是一步一步的指导，详细介绍如何进行跨平台数据库迁移。一、准备工作1.确认源与目标平台源平台：当前运行数据库的操作系统和硬件平台。目标平台：新的操作系统和硬件平台。2.安装数据库软件在目标
MySQL(141)如何处理重复数据问题？辞暮尔尔-烟火年年 MySQL mysql 数据库
处理重复数据问题是数据管理中的一个常见挑战。重复数据会影响数据库的性能、占用资源，并且可能导致数据分析结果的偏差。以下是处理重复数据问题的详细步骤以及结合代码的示例。一、识别重复数据首先，需要识别数据库中的重复数据。可以使用SQL查询来查找重复的数据。示例：假设我们有一个名为employees的表，其中包含以下字段：id、name和email。CREATETABLEemployees(idINTP
IM即时通讯源码/im源码基于uniapp框架从0开始设计搭建在线聊天系统宠友信息 uni-app mysql spring boot java 小程序
文章目录前言一、确定技术栈二、数据库设计：1.引入库2.使用SpringBoot创建后端项目3.实现WebSocket通信：3.1创建WebSocket配置类：3.2创建ChatWebSocketHandler类：3.3前端WebSocket连接与通信：总结前言随着人社交产品的不断发展，即时通讯聊天这门技术也越来越重要，很多人都开启了学习通讯技术，本文就介绍了即时通讯的基础内容。一、确定技术栈在开
（详细！！）2024最新Neo4j详细使用指南熊猫发电机：miniqq207 neo4j neo4j
Neo4j详细使用指南一、介绍Neo4j是什么Neo4j是一个高性能的,NOSQL图形数据库，它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎，但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎，该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态
mysql事物详解
前言：事物是什么？作为一个java程序员，也许我们仅仅只是停留在会使用的程度上，会通过在类上或者方法上使用@Transactional注解的方式来使用事物，但是背后的原理，为什么使用这个注解就能使事物生效可能并不是很清楚。下面本文详细一一介绍事物是什么，事物的特性，怎么使用等等。1.事物是什么所谓事物，在我的理解中就是一系列操作的一个集合，一旦其中一个操作失败，那么整个操作集合必须全部失败，回滚到
JAVAWeb2 DanB24 oracle 数据库
1.数据库设计1.软件的研发步骤数据库设计概念数据库设计就是根据业务系统的具体需求，结合我们所选用的DBMS，为这个业务系统构造出最优的数据存储模型。建立数据库中的表结构以及表与表之间的关联关系的过程。有哪些表？表里有哪些字段？表和表之间有什么关系？数据库设计的步骤需求分析（数据是什么?数据具有哪些属性?数据与属性的特点是什么）逻辑分析（通过ER图对数据库进行逻辑建模，不需要考虑我们所选用的数据库
C#程序唯一性守护：用互斥锁（Mutex）实现进程级安全控制的实战指南
为什么程序重复启动是个"毒瘤"？在软件开发中，程序重复启动可能导致以下灾难性后果：资源冲突：多个实例争夺数据库连接、文件句柄等有限资源数据污染：并发写入配置文件导致内容错乱界面混乱：多个窗口同时弹出，用户体验崩坏安全漏洞：恶意程序通过伪造实例窃取数据而互斥锁（Mutex）是Windows/Linux系统提供的原生机制，能完美解决这些问题。相比文件锁、注册表标记等传统方案，Mutex具有以下不可替代
从零开发推客小程序系统：完整技术方案与实战经验 wx_ywyy6798 小程序推客小程序开发推客系统开发微信小程序推客小程序推客系统推客分销系统开发
一、推客小程序的市场价值社交电商爆发式增长背景推客模式的优势：低成本获客、用户裂变小程序作为推客系统载体的天然优势二、技术架构设计text1.前端技术栈：-微信小程序原生开发/uni-app跨平台方案-自定义分享组件开发-可视化数据看板实现2.后端技术选型：-Node.js/PHP/JavaSpringBoot等后端框架对比-高性能分销关系链存储方案-佣金结算系统的设计要点3.数据库设计：-用户层
基于 MySQL 8.0.40 MGR 与 ProxySQL 的高可用集群部署实践 derek2026 部署实践 mysql 数据库
构建高可用MySQL8.0.40集群：MGR+ProxySQL实战指南一、部署架构图流量路径：应用→ProxySQL（DNS解析ProxySQLIP）→MySQLMGR集群二、环境准备1.系统要求**操作系统:**CentOS7.x服务器配置3台节点（建议最小配置：4核CPU/8GB内存/100GB磁盘）网络互通（关闭防火墙或开放端口：3306,33081,6032,6033节点规划节点1:192
sql优化之延迟关联 ycllycll mysql sql 数据库
具体看这个文章，写得非常不错：mysql优化：覆盖索引（延迟关联）-一枝花算不算浪漫-博客园看完后思考：1.业务相关的表规范上都要设置递增的主键字段，便于后续优化2.很多时候sql查询的性能瓶颈基本都在io上而不是cpu，所以才会这么优化，尽量在sql的where条件后都走主键，不要让sql走回表操作3.博客中改造的sql比较适合大表跟小表的关联情形
hive底层原理 sql执行过程_Hive原理总结（完整版）
目录课程大纲(HIVE增强)31.Hive基本概念41.1Hive简介41.1.1什么是Hive41.1.2为什么使用Hive41.1.3Hive的特点41.2Hive架构51.2.1架构图51.2.2基本组成51.2.3各组件的基本功能51.3Hive与Hadoop的关系61.4Hive与传统数据库对比61.5Hive的数据存储62.Hive基本操作72.1DDL操作72.1.1创建表72.1.
springboot-mybatis-MySQL-集成张_皮皮 springboot mybatis maven springboot mybatis idea
这也是我第一次搭建springboot-mybatis的项目环境，记录一下。我是用IntelliJIDEA，你可以创建maven项目，也可以直接创建spring项目，最终的项目结构如下，这里说明下，resources下面的mappers里面是存放mybatis的SQL映射文件，static下面存放前端静态资源文件，如js,css等，template下存放前端模板文件，本项目使用的freemarke
Android图书借阅系统完整App开发教程(源码+数据库)
本文还有配套的精品资源，点击获取简介：本教程深入介绍了基于Android平台的图书借阅系统App开发过程，涵盖了从UI设计、网络通信到数据库操作的全面实践。项目包含源码和数据库文件，让学生能够通过实际案例学习并掌握Android应用开发的核心技术。本App具有预约借书、书籍评论、图书推荐和逾期提醒等功能，要求开发者熟悉Java语言和Android系统，以及实现后端逻辑和数据存储。此项目是一个宝贵的
框架技术SpringBoot ---SpringBoot集成Mybatis 码农C风 JAVAweb java spring java-ee 数据库
SpringBoot框架内容管理ORM操作MySQLSpringBoot集成Mybaits步骤第一种方式：@Mapper注解第二种方式：@MapperScandao和xml文件分开---yml中配置事务txSpringBoot使用事务业务方法加入@Transactional；同时主启动类加上@TransactionManagerSpringBoot框架整合持久层框架，Mybatis前面已经分享了S
Python Django 数据库索引优化 Python编程之道 python django 数据库 ai
PythonDjango数据库索引优化关键词：DjangoORM、数据库索引、查询优化、性能调优、PostgreSQL、MySQL、执行计划摘要：本文深入探讨Django框架中的数据库索引优化策略。我们将从数据库索引的基本原理出发，详细分析DjangoORM如何生成SQL查询，以及如何通过合理的索引设计提升查询性能。文章包含索引类型选择、复合索引优化、Django模型字段索引配置、查询集优化技巧等
github jekyll+chirpy主题搭建博客 handsomestWei 后端 github Jekyll Chirpy GitHub Pages 博客建站
githubjekyll+chirpy主题搭建博客标签：后端、blog、jekyll全文链接本文简要介绍了如何基于GitHubPages、Jekyll及Chirpy主题搭建个人博客的流程和注意事项。主要内容GitHubPages站点简介可免费搭建个人博客，支持自定义域名，适合静态网站部署。Jekyll简介Jekyll是一个静态博客生成工具，无需数据库，适合部署在GitHub上。提供了相关文档和教程
Django `transaction.atomic()` 完整使用指南言之。 python django 数据库 python
目录#概述#基本用法#事务一致性保障机制#破坏一致性的常见场景#高级用法#最佳实践#诊断与调试#附录概述transaction.atomic()是Django提供的数据库事务管理工具，用于确保一系列数据库操作要么全部成功提交，要么全部回滚，维护数据的一致性。基本用法1.作为上下文管理器fromdjango.dbimporttransactiondefview_func(request):witht
Atlas 读写分离子牙
1.AtlasAtlas是由Qihoo360,Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目。它是在mysql-proxy0.8.2版本的基础上，对其进行了优化，增加了一些新的功能特性。360内部使用Atlas运行的mysql业务，每天承载的读写请求数达几十亿条。下载地址https://github.com/Qihoo360/Atlas/releases注意：1、Atla
MySQL-SQL优化Explain命令以及参数详解只吹45°风 MySQL mysql sql 优化 explain
前言在MySQL优化的众多手段中，EXPLAIN命令扮演着至关重要的角色。它是数据库管理员和开发者手中的利器，用于分析SQL查询的执行计划。通过执行EXPLAIN，MySQL会提供一份详细的查询执行计划报告，这份报告揭示了查询将如何执行，包括数据访问路径、表的连接顺序、使用的索引、预期扫描的行数等关键信息。这些信息对于识别和解决性能瓶颈至关重要。基于EXPLAIN提供的洞察，我们可以采取措施，如优
mysql sql explain_SQL中EXPLAIN命令详解---(转)
在日常工作中，我们会有时会开慢查询去记录一些执行时间比较久的SQL语句，找出这些SQL语句并不意味着完事了，些时我们常常用到explain这个命令来查看一个这些SQL语句的执行计划，查看该SQL语句有没有使用上了索引，有没有做全表扫描，这都可以通过explain命令来查看。所以我们深入了解MySQL的基于开销的优化器，还可以获得很多可能被优化器考虑到的访问策略的细节，以及当运行SQL语句时哪种策略
PostgreSQL数据库集群如何进行自动化性能监测？ TechVision大咖圈数据库 postgresql 自动化性能监测
前言：在这个数据爆炸的时代，PostgreSQL数据库集群就像是我们的"数据宝库"。但是，再好的宝库也需要有专业的"保安"来守护。今天我们就来聊聊如何给PostgreSQL集群配备一套智能的"保安系统"——自动化性能监测。文章目录一、为什么需要自动化监测？二、核心监测指标解析三、监测工具选型指南四、监测架构设计五、实施方案详解六、告警策略配置七、最佳实践总结八、常见问题解答一、为什么需要自动化监测
阿里云RDS MySQL物理备份文件恢复到自建数据库
官方文档RDSMySQL物理备份用XtraBackup恢复到自建数据库_云数据库RDS(RDS)-阿里云帮助中心通过Percona官方仓库来安装最新版本的xtrabackup：（如果没安装）#添加Percona仓库sudoyuminstallhttps://repo.percona.com/yum/percona-release-latest.noarch.rpmsudopercona-relea
SQL中EXPLAIN命令详解 FSW... mysql 数据库 sql
SQL中EXPLAIN命令详解explain显示了mysql如何使用索引来处理select语句以及连接表。可以帮助选择更好的索引和写出更优化的查询语句。使用方法，在select语句前加上explain就可以了：如:explainselectsurname,first_nameforma,bwherea.id=b.id1、EXPLAINtbl_nameEXPLAINtbl_name是DESCRIBE
如何优雅解决缓存与数据库的数据一致性问题？亲爱的非洲野猪缓存 kafka 分布式 java lock
在高并发系统中，缓存是提升性能的“利器”，但随之而来的“缓存与数据库数据不一致”问题，却常常让开发者头疼。比如用户刚更新了资料，刷新页面却还是旧数据；或者订单状态明明已支付，缓存却显示未付款——这类问题不仅影响用户体验，严重时甚至会引发业务故障。今天就来聊聊如何从“更新策略”“异常处理”“实战方案”三个维度，搭建一套可靠的缓存一致性管控体系。一、核心更新策略：根据业务选对“姿势”缓存与数据库的同步
系统架构设计师教程第二章计算机系统基础知识-2.9 系统性能 AncleLeen 软考-系统架构设计师-学习路线系统架构软考-系统架构师
系统架构设计师教程第二章计算机系统基础知识-2.9系统性能2.9.1.性能指标2.9.1.1计算机的性能指标2.9.1.2路由器的性能指标（了解即可）2.9.1.3交换机的性能指标（了解即可）2.9.1.4网络的性能指标2.9.1.5操作系统的性能指标2.9.1.6数据库管理系统的性能指标2.9.1.7Web服务器的性能指标2.9.2.性能计算2.9.3.性能设计2.9.3.1性能调整2.9.3.
mysql创建集合collection_MongoDB创建集合命令db.createCollection详解 kokosK
MongoDB创建集合命令db.createCollection详解完整的命令如下：db.createCollection(name,{capped:,autoIndexId:,size:,max})name:集合的名字capped:是否启用集合限制，如果开启需要制定一个限制条件，默认为不启用，这个参数没有实际意义size:限制集合使用空间的大小，默认为没有限制max:集合中最大条数限制，默认为没
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS