第七人格

【面试不用背】作为一个CRUD工程师，你必须要知道的MySQL知识

1 写在前面的话
2 MySQL 架构设计
- 2.1 程序是如何跟 MySQL 打交道的
- 2.2 程序是如何跟 MySQL 打交道的图解
- 2.3 服务端流程分析
- 2.4 服务端流程图解
3 InnoDB 架构设计
- 3.1 设计思路
- 3.2 图解
4 MySQL 物理数据模型
- 4.1 数据在磁盘上的存储格式
- 4.2 null列表与数据头
- 4.3 行溢出
5 BufferPool
- 5.1 free 链表
- - 5.1.1 概念
  - 5.1.2 缓存页 hash 表
  - 5.1.3 图解
- 5.2 flush 链表
- - 5.2.1 概念
  - 5.2.2 图解
- 5.3 LRU 链表
- - 5.3.1 概念
  - 5.3.2 图解
  - 5.3.3 LRU 链表存在的问题
  - - 5.3.3.1 预读机制对 LRU 链表的影响
    - 5.3.3.2 触发预读机制的常见情况
    - 5.3.3.3 全表扫描对 LRU 链表的影响
    - 5.3.3.4 图解
  - 5.3.4 MySQL 对 LRU 算法的优化
  - - 5.3.4.1 通过冷热数据分离，优化 LRU 算法
    - 5.3.4.1 通过定时任务，优化 LRU 算法
- 5.4 free 链表、flush 链表、LRU 链表，修改数据的动态联系
6 redo log
- 6.1 概念
- 6.2 图解
- 6.3 redo log block
- 6.4 redo log buffer
7 undo log
- 7.1 概念
- 7.2 图解
8 bin log
- 8.1 概念
- 8.2 bin log 和 redo log的区别
9 事务
- 9.1 脏写与脏读
- - 9.1.1 概念
  - 9.1.2 分析
- 9.2 不可重复读
- - 9.2.1 概念
  - 9.2.2 分析
- 9.3 幻读
- - 9.3.1 概念
  - 9.3.2 分析
- 9.4 隔离级别
- - 9 .4.1 SQL 标准中的四种隔离级别
  - 9.4.2 MySQL 标准中的四种隔离级别
- 9.5 undo log 版本链
- - 9.5.1 概念
  - 9.5.2 图解
- 9.6 ReadView 机制
- - 9.6.1 概念
  - 9.6.2 组成部分
  - 9.6.3 判断规则
- 9.7 MVCC 机制
- - 9.7.1 READ COMMITTED
  - - 9.7.1.1 关键点
    - 9.7.1.2 步骤分析
    - 9.7.1.3 图解
  - 9.7.2 REPEATABLE READ
  - - 9.7.2.1 关键点
    - 9.7.2.2 步骤分析
    - 9.7.2.3 图解
    - 9.7.2.4 幻读
10 MySQL 锁机制
11 索引
- 11.1 数据页存储结构
- - 11.1.1 数据页的各个部分
  - 11.1.1 页分裂
- 11.2 索引页存储结构
- - 11.2.1 概念
  - 11.2.1 例子
- 11.3 聚簇索引
- - 11.3.1 特点
- 11.4 二级索引
- - 11.4.1 概念
  - 11.4.2 图解
  - 11.4.3 回表
- 11.5 联合索引
- 11.6 覆盖索引与回表查询
- - 11.6.1 概念
  - 11.6.2 例子
- 11.7 如何更好的建立索引
- - 11.7.1 索引适用的条件
  - - 11.7.1.1 全值匹配
    - 11.7.1.2 匹配左边的列
  - - 11.7.1.3 匹配列前缀
    - 11.7.1.4 匹配范围值
    - 11.7.1.5 排序
    - 11.7.1.6 分组
  - 11.7.2 阿里巴巴索引规约
- 11.8 执行计划与性能优化浅谈
- - 11.8.1 总览
  - 11.8.2 要素
  - - 11.8.2.1 id
    - 11.8.2.2 select_type
    - 11.8.2.3 table
    - 11.8.2.4 partitions
    - 11.8.2.5 type
    - 11.8.2.6 possible_keys
    - 11.8.2.7 key
    - 11.8.2.8 key_len
    - 11.8.2.9 ref
    - 11.8.2.10 rows
    - 11.8.2.11 filtered
    - 11.8.2.12 Extra
12 参考资料
13 写在后面的话

1 写在前面的话

想要更好地阅读本文，您可能需要自行安装 MySQL，并熟练掌握 MySQL 的基本语法和使用。

阅读全文大概需要 40 分钟。

2 MySQL 架构设计

2.1 程序是如何跟 MySQL 打交道的

MySQL 作为标准的 C/S 架构，分为客户端和服务端。我们写代码的时候，通常会在代码中引入驱动和 client，然后在配置文件中填写 server 地址和账号密码，用于连接到 MySQL 服务器。大概的流程看起来就向下面一样。

2.2 程序是如何跟 MySQL 打交道的图解

2.3 服务端流程分析

客户端向服务端发送请求并得到回复的过程本质上是一个进程间通信的过程，这个处理连接的过程，MySQL 支持以下 3 种方式：

TCP/IP（端口：3306）；
命名管道和共享内存（这个针对于 windows 系统）；
Unix 域套接字文件（这个针对于 linux 系统）。

处理连接后，MySQL 会对我们发送的请求进行解析与优化，这个过程大概分为 3 步：

查询缓存；
语法解析；
查询优化。
然后再经过存储引擎，最后持久化。

2.4 服务端流程图解

为了方便大家记忆这个过程，小七画了下面一张图

以上内容，作为一个 CRUD 工程师，不需要掌握得那么深，了解即可。下文将会讲述重点知识 InnoDB 存储引擎。

3 InnoDB 架构设计

3.1 设计思路

如果让你来设计一个数据库，你会怎么做？结合我们平常的对 MySQL 的使用，小七觉得我们至少需要实现以下几个功能：

数据需要持久化；
支持的并发不能太低，速度要可以；
一旦宕机，需要尽可能的减少数据的丢失，能够快速恢复数据；
如果某一操作有问题，应该可以快速回滚。

实现如下

针对第一点，咱们可以将数据写入磁盘中（MySQL 的磁盘文件）；
针对第二点，咱们可以考虑先基于内存处理，然后再写入磁盘（MySQL 是通过 Buffer Pool 缓冲池实现的）；
针对第三点，咱们可以记录一下当前的操作记录，类比与 redis 的 AOF 文件（MySQL 中叫 redo log）；
针对第四点，咱们可以设计一个文件，专门存放每条操作记录更新前的值（MySQL 中叫 undo log）。
接下来，我们借助一个更新语句，来看看 InnoDB 存储引擎的架构设计。

首先我们从磁盘文件中读取数据，在更新内存数据之前，将旧数据写入 undo log，同时写入 redo log，整个流程如下（其中的 OS cache 和 Redo Log Buffer，读者可以将其看做缓存，后面有涉及，将会详细讲解）：

3.2 图解

4 MySQL 物理数据模型

4.1 数据在磁盘上的存储格式

我们每一行数据在磁盘上到底是怎么存储的呢？我们以常见的varchar为例，他的存储格式大概如下图所示：

注意：变长字段长度实际上是倒序存储的。

4.2 null列表与数据头

下图展示了，null列表与数据头的详细信息，了解即可。

4.3 行溢出

什么叫行溢出？就是说一行数据太多了，多的一个数据页都放不下了，需要放在其他数据页里面（这些数据页是由链表串联起来的），这个就叫行溢出。（数据页的详细介绍，请参考11.1）

5 BufferPool

首先我们通过下图，简单地了解一下 BufferPool 的内存数据结构

我们知道 MySQL 的数据最后都是存放在磁盘文件中的，MySQL 将这一行行数据，放入到了一个一个的叫数据页的数据结构中，然后数据页会被 MySQL 加载到 BufferPool 中。

BufferPoll 主要由描述数据和缓存页构成，默认情况下每一个数据页对应一个缓存页，每一个缓存页都有一个对应的描述数据，描述数据你可以将它看做是缓存页的概览，我们可以通过描述数据找到与之对应的缓存页。

5.1 free 链表

5.1.1 概念

在 MySQL 服务端启动的时候，MySQL 会在内存中开辟一块 BufferPool，并初始化好对应的描述数据以及缓存页。这个时候缓存页都是空的。

然后当我们进行增删改操作的时候，BufferPool 才会将数据对应的数据页读出来，放在缓存页中。这个时候，就出现一个问题了，我们怎么知道哪些缓存页是空的呢？MySQL 为我们引入了另外一个概念，free 链表。他是一个双向链表数据结构，每一个节点都存放了空置的描述数据的地址，并且他还有一个基础节点，存放的是控制缓存页的个数。

5.1.2 缓存页 hash 表

现在我们通过 free 链表，知道了哪些缓存页是空的，但是我们并不知道哪些数据页是被缓存了的呢？其实 MySQL 中有一个缓存页 hash 表，如果在此表中，则表明数据已经被缓存了，他的 key=表空间号+数据页号，他的 value=缓存页地址。

(表空间号+数据页号,缓存页地址)

5.1.3 图解

5.2 flush 链表

5.2.1 概念

如果你在执行增删改的时候，发现数据页没有被缓存，那么 MySQL 就会通过 free 链表找到对应的描述数据，最后缓存到缓存页中，并且断开 free 链表中对应的描述数据节点。但是这又会引出另外一个问题，只要你改变了缓存页的数据，那么缓存页肯定就和磁盘上的数据页不一致了，这个时候需要将缓存页的数据刷到磁盘上去，那么刷哪些数据呢，总不能全量刷盘吧？于是 MySQL 引入了另外一个链表 flush 链表。他的数据结构和 free 链表一致，只不过，他的节点放置的是需要被刷回磁盘的描述数据地址。

5.2.2 图解

5.3 LRU 链表

5.3.1 概念

从前面的文章中我们知道了 BufferPool 中存在缓存页，但是我们思考一下，缓存页是启动的时候就分配好了的，如果满了怎么办？要么扩容，要么淘汰。MySQL 使用的是 LRU 算法淘汰部分缓存。而这个 LRU 算法，是基于 LRU 链表的。最近被访问过的缓存页，会被挪到链表最前面，因此最少访问的缓存页就会在链表的最尾部，淘汰缓存时，我们只需要淘汰最后的数据页即可。

5.3.2 图解

5.3.3 LRU 链表存在的问题

5.3.3.1 预读机制对 LRU 链表的影响

为了提高效率，MySQL 从磁盘上加载数据到缓存的时候，他可能会把数据页相邻的其他数据页也加载到缓存中去，这个就是 MySQL 的预读机制。

我们思考一下这样的预读机制会对 LRU 链表造成什么影响呢？

这些被查出来的预读数据，可能根本不常用，但是他还是被放在了 LRU 链表的前面，从而导致他们不能被及时淘汰。

5.3.3.2 触发预读机制的常见情况

innodb_read_ahead_threshold
默认 56，如果顺序访问一个区里的多个数据页的数量超过了这个阀值，那么就会把相邻区中所有的数据页都加载到缓存里去。
innodb_random_read_ahead
默认 off，如果 Buffer Pool 里缓存了一个区 13 个连续的数据页，且这些数据页会被频繁访问，那么就会把这个区的其他数据页加载到缓存里去。

5.3.3.3 全表扫描对 LRU 链表的影响

select * from table
全表扫描，会将表里所有的数据页都从磁盘加载到 Buffer Pool 里面去，导致 LRU 尾部的链表反而是频繁被访问的数据。

5.3.3.4 图解

5.3.4 MySQL 对 LRU 算法的优化

通过上面的分析，我们知道了 LRU 算法可能会存在的一些问题，写 MySQL 的大佬们当然也想到了这些问题，下文列举了 MySQL 对 LRU 算法的两种优化。

5.3.4.1 通过冷热数据分离，优化 LRU 算法

前面的问题为什么会出现呢？很大原因是因为所有数据都放在 LRU 链表中，如果我们把他分成冷热数据两部分，预读数据、全表扫描和其他不常用的数据放在冷数据区，其他常用的放在热数据区，缓存淘汰的时候，只淘汰冷数据区的数据，是不是就解决这个问题了？这个思想跟秒杀系统中热数据放 redis，冷数据放数据库，小七感觉也是异曲同工。

以下是相关的两个参数，了解即可，一般不会去修改他。

innodb_old_blocks_time
设置冷数据豁免时间，默认 1000ms。（1 秒内，被访问，则不会转移到热数据区域）
innodb_old_blocks_pct
设置冷数据区域所占大小，默认 37%

5.3.4.1 通过定时任务，优化 LRU 算法

为了提升效率，MySQL 开启一个后台线程，定时把冷数据尾部的一些数据输入磁盘。

5.4 free 链表、flush 链表、LRU 链表，修改数据的动态联系

6 redo log

6.1 概念

第三章我们从 InnoDB 架构设计提到了 redo log，这一章我们具体来聊一聊 redo log。

redo log 是 InnoDB 独有的，本质上只是记录了一下事务对数据库做了哪些修改。与在事务提交时将所有修改过的内存中的页面刷新到磁盘中相比，只将该事务执行过程中产生的 redo 日志刷新到磁盘的好处如下：

redo 日志占用的空间非常小，内存利用率高
redo 日志是顺序写入磁盘的，性能较高

6.2 图解

redo log 里本质上记录的就是在对某个表空间的某个数据页的某个偏移量的地方修改了几个字节的值，具体修改的值是什么，他里面需要记录的就是表空间号+数据页号+偏移量+具体的值。redo 日志有很多种，以下是常见的一种。

6.3 redo log block

为了更好的进行系统崩溃恢复，MySQL 把 redo log 都放在了大小为 512 字节的 redo log block 中。

redo log block 分为以下 3 个部分：

header
存放了一些管理信息。
body
redo log 真正存放的地方。
traller
存放了一些管理信息。

其中 header 存放的内容如下：

整个 redo log 写入的流程，总结如下：

6.4 redo log buffer

首先让我们回顾一下下面这张图

为了增加数据更新的效率，MySQL 引入了 BufferPool 的概念；同理，为了增加 redo log 的效率，MySQL 同样引入了 redo log buffer 的概念，它其实就是 redo log 的缓冲区，它包含了若干个连续的 redo log block。最后，我们要知道 redo log 都是先进入 redo log buffer 中的一个 block，然后事务提交的时候才会刷入磁盘文件里去。那么这里会有两种情况

1、事务没提交，MySQL 挂了

这种情况，丢了就丢了，没有影响，不需要重做。

2、事务提交了，MySQL 挂了，但是已经被修改的缓存页还没有被刷入磁盘

这种情况因为有 redo log 存在，你重启 MySQL 之后，可以把没来得及刷入磁盘的事务，他们所对应的 redo log 都加载出来，再在 BufferPool 的缓存页里重做一遍，就可以保证事务提交之后，修改的数据绝对不会丢。

7 undo log

7.1 概念

通过上文我们知道了 redo log 保证了事务提交后的数据，不会丢。但是如果事务执行到一半就 GG 了怎么办？为了保证事务的原子性，我们需要把东西改回原先的样子，这个过程就称之为回滚。MySQL 的回滚主要依赖于 undo log。

undo log 记录的东西也很简单，比如插入一条记录时，至少要把这条记录的主键值记下来，之后回滚的时候只需要把这个主键值对应的记录删掉就好了。

7.2 图解

8 bin log

8.1 概念

前面我们对 redo log 做了介绍，它是一种重做日志，它主要关注“哪个数据页的哪个数据做了什么修改。

bin log 叫做归档日志，它主要关注“对哪个表的哪个数据做了什么操作，操作之后是什么”。

我们可以这样理解 bin log 是偏向于逻辑性的日志，而 redo log 更偏向于物理性。

注意：bin log 不是 InnoDB 存储引擎特有的日志文件，是属于 MySQL server 自己的日志文件。

8.2 bin log 和 redo log的区别

bin log 是MySQL本身就拥有的，不管哪种存储引擎；redo log 是InnoDB独有的。
bin log是一种逻辑日志，redo log 是一种物理日志。
bin log没有幂等性，redo log具有幂等性，多次操作前后的状态是一致的。
bin log开启事务的时候，会将每一次提交的事务一次性写入内存缓冲区，如果未开启事务，则每次进行增删改时，就会将对应事务信息写入内存缓冲区；而redo log是在数据准备修改之前，将数据写入缓冲区redo log中的，然后在缓冲区中修改数据，而且在提交事务的时候，现将redo log 写入缓冲区，写入完成后，再提交事务。
bin log只会在事务提交时，一次性写入bin log；redo log最后一个提交的事务记录会覆盖之前所有未提交的事务记录，并且一个事务的redo log中间会插入其他事务的redo log。
bin log是追加写入，不会覆盖；redo log是循环写入，会覆盖。
bin log一般用于主从复制和数据恢复；redo log 一般用于MySQL，重启后恢复事务已提交但未写入数据表的数据。

9 事务

在开始新篇章之前，让我们回顾一下，下面的流程

1、MySQL 事务执行流程

2、MySQL 事务恢复流程

9.1 脏写与脏读

9.1.1 概念

如果一个事务修改了另一个未提交事务修改过的数据，那就意味着发生了脏写。

如果一个事务读到了另一个未提交事务修改过的数据，那就意味着发生了脏读。

9.1.2 分析

脏读

原始数据为 null
事务 A 更新数据为 A
事务 B 查询数据为 A
事务 A 这个时候回滚了，那么它用它的 undo log 去回滚，现在数据为 null
事务 B 再次查询数据为 null

脏写

原始数据为 null
事务 A 更新数据为 A
事务 B 更新数据为 B
事务 A 这个时候回滚了，那么它用它的 undo log 去回滚，现在数据为 null
事务 B 再次查询数据为 null，事务B修改的数据丢失了

9.2 不可重复读

9.2.1 概念

如果一个事务只能读到另一个已经提交的事务修改过的数据，并且其他事务每对该数据进行一次修改并提交后，该事务都能查询得到最新值，那就意味着发生了不可重复读。

9.2.2 分析

原始数据为 A
事务 A 查询数据为 A
事务 B 更新数据为 B，并提交
事务 A 查询数据为 B
事务 C 更新事务为 C，并提交
事务 A 查询数据为 C

9.3 幻读

9.3.1 概念

如果一个事务先根据某些条件查询出一些记录，之后另一个事务又向表中插入了符合这些条件的记录，原先的事务再次按照该条件查询时，能把另一个事务插入的记录也读出来，那就意味着发生了幻读。

9.3.2 分析

事务 B 插入数据 1 条，总数 11 条
事务 A 查询数据为 11 条
事务 B 这个时候回滚了，总数变为 10 条
事务 A 查询数据为 10 条

9.4 隔离级别

9 .4.1 SQL 标准中的四种隔离级别

隔离级别	隔离级别（中文）	脏读	不可重复读	幻读
READ UNCOMMITTED	读未提交	√	√	√
READ COMMITTED	读已提交	×	√	√
REPEATABLE READ	可重复读	×	×	√
SERIALIZABLE	串行化	×	×	×

9.4.2 MySQL 标准中的四种隔离级别

隔离级别	隔离级别（中文）	脏读	不可重复读	幻读
READ UNCOMMITTED	读未提交	√	√	√
READ COMMITTED	读已提交	×	√	√
REPEATABLE READ	可重复读	×	×	x
SERIALIZABLE	串行化	×	×	×

READ UNCOMMITTED 我们上文提到的几种问题，他都没有解决，所以正常人都不会使用它；

SERIALIZABLE 效率太低，也没人会用他；

READ COMMITTED 在某些需要不可重复读的情况下，会用到，但是这种情况，如果你是用的 Spring 框架，那么可以在代码里单独指定，生产中的 MySQL 数据库级别一般也不是它；

REPEATABLE READ 这个是 MySQL 默认的隔离级别，这里我们需要注意的是，在 RR 隔离级别下，MySQL 解决了幻读问题，具体是怎么解决的呢？下文将会从 undo log 版本链讲起。

9.5 undo log 版本链

9.5.1 概念

简单来说呢，我们每条数据其实都有两个隐藏字段，一个是 trx_id，一个是 roll_pointer，这个 trx_id 就是最近一次更新这条数据的事务 id，roll_pointer 就是指向你了你更新这个事务之前生成的 undo log，接着假设有一个事务 B 跑来修改了一下这条数据，把值改成了值 B，事务 B 的 id 是 15，那么此时更新之前会生成一个 undo log 记录之前的值，然后会让 roll_pointer 指向这个实际的 undo log 回滚日志。

9.5.2 图解

↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓

9.6 ReadView 机制

9.6.1 概念

对于使用 READ COMMITTED 和 REPEATABLE READ 隔离级别的事务来说，都必须保证读到已经提交了的事务修改过的记录，也就是说假如另一个事务已经修改了记录但是尚未提交，是不能直接读取最新版本的记录的，这里就引出另一个问题了，我们怎么知道 undo log 版本链中哪些链条是可读的，哪些链条又是不可读的呢？针对这个问题，MySQL 为我们引入了 ReadView。

9.6.2 组成部分

ReadView 中重要的有 4 个东西：

m_ids
这个就是说此时有哪些事务在 MySQL 里执行还没提交的，表示所有的活跃的读写事务 id 的集合；
min_trx_id
表示在生成 ReadView 时当前系统中活跃的读写事务中最小的事务 id，也就是 m_ids 中的最小值；
max_trx_id
表示 MySQL 要生成的下一个事务 id，也就是事务最大 id；
creator_trx_id
表示当前事务的 id

注意：只有在对表中的记录做改动时（执行 INSERT、DELETE、UPDATE 这些语句时）才会为事务分配事务 id，否则在一个只读事务中的事务 id 值都默认为 0。

9.6.3 判断规则

我们可以根据版本链中的 trx_id 和 ReadView 中这几个值来判断事务是否已经被提交了。

如果被访问版本的 trx_id 属性值与 ReadView 中的 creator_trx_id 值相同，意味着当前事务在访问它自己修改过的记录，所以该版本可以被当前事务访问。
如果被访问版本的 trx_id 属性值小于 ReadView 中的 min_trx_id 值，表明生成该版本的事务在当前事务生成 ReadView 前已经提交，所以该版本可以被当前事务访问。
如果被访问版本的 trx_id 属性值大于或等于 ReadView 中的 max_trx_id 值，表明生成该版本的事务在当前事务生成 ReadView 后才开启，所以该版本不可以被当前事务访问。
如果被访问版本的 trx_id 属性值在 ReadView 的 min_trx_id 和 max_trx_id 之间，那就需要判断一下 trx_id 属性值是不是在 m_ids 列表中，如果在，说明创建 ReadView 时生成该版本的事务还是活跃的，该版本不可以被访问；如果不在，说明创建 ReadView 时生成该版本的事务已经被提交，该版本可以被访问。

9.7 MVCC 机制

MVCC 机制，翻译成中文是多版本并发控制机制的意思。其实我们 9.5 和 9.6 两章已经将 MVCC 核心实现讲了，也就是 undo log 版本链 + ReadView 机制。下面我们分析一下 RC 以及 RR 分别是怎么通过 MVCC 机制实现的。

9.7.1 READ COMMITTED

9.7.1.1 关键点

实现RC的关键点在于，每次读取数据前都生成一个 ReadView。

9.7.1.2 步骤分析

我们假设已经存在有一行数据txr_id=8；
然后现在有2个活跃事务，事务A（id=10），事务B（id=15）；
事务B将数据更新为了值B，未提交；
事务A发起一次查询，生成一个ReadView；
根据ReadView判断规则，当前数据的txr_id=15，在 ReadView的min_trx_id 和 max_trx_id 之间，且 trx_id 属性值在 m_ids 列表中，说明创建 ReadView 时生成该版本的事务还是活跃的，该版本不可以被访问；
undo log 版本链继续向下寻找，txr_id=8小于 ReadView 中的 min_trx_id 值，表明生成该版本的事务在当前事务生成 ReadView 前已经提交，所以该版本可以被当前事务访问；
所以事务A查询的时候访问到的就是已经提交过的值A了。

9.7.1.3 图解

9.7.2 REPEATABLE READ

9.7.2.1 关键点

在第一次读取数据时生成一个 ReadView

9.7.2.2 步骤分析

我们假设已经存在有一行数据txr_id=8；
然后现在有2个活跃事务，事务A（id=10），事务B（id=15）；
事务A发起一次查询，生成一个ReadView；
根据ReadView判断规则，当前txr_id=8小于 ReadView 中的 min_trx_id 值，表明生成该版本的事务在当前事务生成 ReadView 前已经提交，所以该版本可以被当前事务访问；
事务B将数据更新为了值B，并提交；
事务A发起一次查询，还是使用第一次生成的ReadView；
根据ReadView判断规则，当前数据的txr_id=15，在 ReadView的min_trx_id 和 max_trx_id 之间，且 trx_id 属性值在 m_ids 列表中，说明创建 ReadView 时生成该版本的事务还是活跃的，该版本不可以被访问；
undo log 版本链继续向下寻找，txr_id=8小于 ReadView 中的 min_trx_id 值，表明生成该版本的事务在当前事务生成 ReadView 前已经提交，所以该版本可以被当前事务访问；
所以事务A查询的时候访问到的就是已经提交过的值A了（也就是实现了可重复读）。

9.7.2.3 图解

步骤1-4

步骤5-9

9.7.2.4 幻读

解决幻读的推导和和上面解决不可重复度大同小异，小七这里留给读者，自己去推导。

10 MySQL 锁机制

MySQL 锁机制作是MySQL中重要的一环，但是针对小七这种CRUD开发工程师来说，并不需要了解那么深入，我们只需要知道一些常见知识即可。

1、多个事务同时更新一行数据，此时都会加锁，然后都会排队等待，必须一个事务执行完毕了，提交了，释放了锁，才能唤醒别的事务继续执行，这个时候加的锁叫独占锁；

2、当有人在更新数据时，其他事务读取这行数据的时候，默认是走MVCC机制的，也就是不加锁的；

3、当我们非要在执行查询的时候加锁呢？这个时候可以使用lock in share mode，手动加上共享锁；

4、共享锁和共享锁是不互斥的，共享锁和独占锁是互斥的，独占锁和独占锁也是互斥的。

11 索引

11.1 数据页存储结构

11.1.1 数据页的各个部分

在讲索引之前，让我们看看一个单独的数据页是什么样子的

去除掉一些我们不太需要那么关注的部分后，简化如下：

也就是说平时我们在一个表里插入的一行一行的数据会存储在数据页里，然后数据页里的每一行数据都会按照主键大小进行排序存储，同时每一行数据都有指针指向下一行数据的位置，组成单向链表。

11.1.1 页分裂

随着业务的发生，我们的数据页一般会越来越大，当大到一定程度的时候，就需要再搞一个数据页了，如下图所示

但是这一步骤并不是说简简单单多加一个数据页就 OK，还需要保证新加的数据页中的每一行数据的主键值都要比前面的大才行，所以数据行有可能会在数据页中挪动。具体如下图所示：

↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓

11.2 索引页存储结构

11.2.1 概念

上一节我们讲了数据页的存储结构，这一节我们继续学习索引页的存储结构。

我们先思考一个问题，如果我们只有一般的数据页，咱们怎么找到自己想要的数据呢？是不是要将数据页全部遍历，再在每一个页中，通过二分查找查询数据。这么做，实在是太慢了！所以 MySQL 抽象出了一个索引页的概念，它和一般的数据页差不多，只不过存放的是最小主键值和页号。然后后续你查询主键值，就可以在目录里二分查找直接定位到那条数据所属的数据页，接着到数据页里二分查找定位那条数据就可以了，如下图所示。

但是随着数据页越来越多，索引页也变得越来越多，这个时候怎么办呢？这个时候 MySQL 会抽象出一个更高层级的索引页，它里面记录的是最小主键值和索引页号。

那么现在问题再次来了，假如你最顶层的那个索引页里存放的下层索引页的页号也太多了，怎么办呢？此时可以再次分裂，再加一层索引，最后不断的向上加，索引页看起来就像下面这个样子了，也就是一颗 B+树。

11.2.1 例子

最后我们以最简单最基础的主键索引来举例，当你为一个表的主键建立起来索引之后，其实这个主键的索引就是一颗 B+树，然后当你要根据主键来查数据的时候，直接就是从 B+树的顶层开始二分查找，一层一层往下定位，最终一直定位到一个数据页里，在数据页内部的目录里二分查找，找到那条数据。

11.3 聚簇索引

11.3.1 特点

我们上面介绍的B+树索引，它有两个特点：

使用记录主键值的大小进行记录和页的排序
B+树的叶子节点存储的是完整的用户记录
符合这两个特点的索引，就是聚簇索引。在 InnoDB 存储引擎中，聚簇索引就是数据的存储方式，InnoDB 存储引擎会自动的为我们创建聚簇索引。

11.4 二级索引

11.4.1 概念

聚簇索引，使用记录主键值的大小进行记录和页的排序，他是和主键强关联的。但是如果查询的条件不是主键，而是其他列呢？这个时候，就要请出咱们的二级索引了。

二级索引也是一颗B+树，但是它的数据页里存放的是主键+目标字段值。换句话说，将聚簇索引中的主键值替换成目标值段，且叶子节点仅存储主键+目标字段值这两个列的值，那么他就是二级索引了。

当你要根据目标字段来查数据的时候，直接就是从 B+树的顶层开始二分查找，一层一层往下定位，最终一直定位到一个数据页里，在数据页内部的目录里二分查找，找到那条数据。但是这条数据只有主键+目标字段值。

11.4.2 图解

11.4.3 回表

如果你的查询结果中还需要有其他值，那么你得再根据主键在聚簇索引这个B+树中，再查找一次，得到最终的结果，这个过程叫做回表。

11.5 联合索引

联合索引也是一颗B+树，但是它的数据页里存放的是主键+多个目标字段值。其他和二级索引类似。

11.6 覆盖索引与回表查询

11.6.1 概念

首先我们要明确一点，覆盖索引，并不是真正的索引，他其实是一种基于索引的查询方式。

不管是二级索引，还是联合索引，如果你的查询结果中没有其他值，只有索引值，那么你得不需要再在聚簇索引这个B+树中，再查找一次，只需要扫描当前索引的叶子节点，就能得到结果，这种就叫做覆盖索引。

11.6.2 例子

select xx1,xx2,xx3 from table order by xx1,xx2,xx3

基于xx1,xx2,xx3建立联合索引

这种情况下，你仅仅需要联合索引里的几个字段的值，那么其实就只要扫描联合索引的索引树就可以了，不需要回表去聚簇索引里找其他字段了。

11.7 如何更好的建立索引

通过前文我们知道了索引其实是一颗一颗的B+树，那么接下来我们介绍一下B+树索引适用的条件。

11.7.1 索引适用的条件

首先我们给出一张示例表，如下：

CREATE TABLE `user` (
  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键',
  `name` varchar(32) NOT NULL COMMENT '用户名',
  `age` int(3) NOT NULL COMMENT '年龄',
  PRIMARY KEY (`id`),
  KEY `index_name_age` (`name`,`age`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='user示例表';

这个例子中，有两个索引，一个是根据id排序的聚簇索引，另一个是跟据name和age排序的二级索引。

注意：二级索引，是先跟据name排序，如果name相同，再根据age排序的。

11.7.1.1 全值匹配

例子：

SELECT * FROM user WHERE name = '第七人格' AND age = '29';

解析：

因为B+树的数据页和记录先是按照name列的值进行排序的，所以先可以很快定位name列的值是“第七人格”的记录位置。
在name列相同的记录里又是按照age列的值进行排序的，所以在name列的值是“第七人格”的记录里又可以快速定位age列的值是’29’的记录。

11.7.1.2 匹配左边的列

【例子】：

SELECT * FROM user WHERE name = '第七人格';

解析：

因为B+树的数据页和记录先是按照name列的值进行排序的，所以先可以很快定位name列的值是“第七人格”的记录位置。

【反例】：

SELECT * FROM user WHERE age = '29';

解析：

因为B+树的数据页和记录先是按照name列的值进行排序的，所以先可以很快定位name列的值是“第七人格”的记录位置，但是现在用age去找，你想想能找到吗？当然找不到了，你都没找到第一层排序的name值，怎么能找到下层的age呢？

11.7.1.3 匹配列前缀

【例子】：

SELECT * FROM user WHERE name like '第七%';

解析：

因为B+树的数据页和记录先是按照name列的值进行排序的，那么的值是按照字符串排序的，字符串本质是按照字符排序的，这个例子中“第七”是被排好序了的，也可以很快定位name列的值是“第七…”的记录位置。
【反例】：

SELECT * FROM user WHERE name like '%第七%';

或者

SELECT * FROM user WHERE name like '%第七';

解析：

“第七”并没有排好序，所以无法使用索引。

11.7.1.4 匹配范围值

【例子】：

SELECT * FROM user WHERE name > 'Anna' AND name < 'Ziad';

解析：

name能用到索引。
【例子】：

SELECT * FROM user WHERE name > 'Anna' AND age < '35';

解析：

name能用到索引，age不能。
【思考】：

SELECT * FROM user WHERE name = 'Anna' AND age < '35';

请读者思考上面可以使用到索引吗？为什么？

11.7.1.5 排序

【例子】：

SELECT * FROM user ORDER BY name,age LIMIT 1;

解析：

这个是可以用到索引的，因为他是按照联合索引的字段顺序去进行order by排序的，这样就可以直接利用联合索引树里的数据有序性，到索引树里直接按照字段值的顺序去获取数据。
【反例】：

SELECT * FROM user ORDER BY name ASC,age DESC;

解析：

既有升序又有降序，没办法使用索引。

11.7.1.6 分组

【例子】：

SELECT name,age FROM user GROUP BY name ,age;

解析：

这个是可以用到索引的，原因可以类比排序。

11.7.2 阿里巴巴索引规约

【强制】业务上具有唯一特性的字段，即使是组合字段，也必须建成唯一索引。
【强制】超过三个表禁止 join。需要 join 的字段，数据类型保持绝对一致；多表关联查询时，保证被关联的字段需要有索引。
【强制】在 varchar 字段上建立索引时，必须指定索引长度，没必要对全字段建立索引，根据实际文本区分度决定索引长度。
【强制】页面搜索严禁左模糊或者全模糊，如果需要请走搜索引擎来解决。
【推荐】如果有 order by 的场景，请注意利用索引的有序性。order by 最后的字段是组合索引的一部分，并且放在索引组合顺序的最后，避免出现 file_sort 的情况，影响查询性能。
【推荐】利用覆盖索引来进行查询操作，避免回表。
【推荐】利用延迟关联或者子查询优化超多分页场景。
最好。
【推荐】建组合索引的时候，区分度最高的在最左边。
以上规约摘自阿里巴巴开发手册，通过前面的学习，小七相信大家可以从更深层次理解这些规约了，而不是一味的死记硬背。

11.8 执行计划与性能优化浅谈

11.8.1 总览

在生产中我们判断一个SQL写的好不好，一般都是通过EXPLAIN关键字，看他的执行计划的。

首先我们看看执行计划长什么样子，我们执行以下SQL

EXPLAIN SELECT * FROM user WHERE name = '第七人格' AND age = '29';

得到的执行计划如下：

11.8.2 要素

11.8.2.1 id

这个字段对性能优化来说，不太重要，我们只需要知道，在一个大的查询语句中每个SELECT关键字都对应一个唯一的id 就行了。

11.8.2.2 select_type

SELECT关键字对应的那个查询的类型，也不重要。

11.8.2.3 table

表名，意思就是查的哪个表，也不是很重要。

11.8.2.4 partitions

匹配的分区信息，我们接触不到这个知识点，99.9%都是null。

11.8.2.5 type

针对单表的访问方法，这个就非常重要了。

完整的类型如下：system，const，eq_ref，ref，fulltext，ref_or_null，index_merge，unique_subquery，index_subquery，range，index，ALL 。

这里我们针对比较常见和重要的几种类型介绍一下。

const，常量级，一般出现这个，就表示，你写的SQL非常好，性能非常快。哪些属于const呢？比如select * from user where id=x，或者select * from user where name=x这样的的语句，直接就可以通过聚簇索引或者二级索引+聚簇索引回表，轻松查到你要的数据。

值的一提的是，这里的二级索引必须是唯一索引。如果是普通索引，那么就是ref了，就如我们总览中的执行计划一样。当然，ref也是一种非常快的查询方式。

range也是一种常见的查询方式，一般出现在范围查询中，比如我们前面举的一个例子select * from user where name>=x and name <=x，假设name就是一个普通索引，此时就必然利用索引来进行范围筛选，一旦利用索引做了范围筛选，那么这种方式就是range。

我们再回忆一下这个sql，select name,age from user where age = ‘29’，因为age不是索引最左边的值，所以它是没法从联合索引的根节点二分查找快速跳转的，但是因为他的结果和条件都在索引里，所以MySQL的优化器，会直接扫描这个联合索引，一个个的遍历。也就是说，针对这种只要遍历二级索引就可以拿到你想要的数据，而不需要回源到聚簇索引的访问方式，就叫做index访问方式，这种访问方式相对于前面几种，就要慢的多。

最后再看看ALL，顾名思义，全表扫描，一般属于我们要杜绝的情况。

11.8.2.6 possible_keys

可能用到的索引。

11.8.2.7 key

实际上使用的索引。

11.8.2.8 key_len

实际使用到的索引长度。

11.8.2.9 ref

当使用索引列等值查询时，与索引列进行等值匹配的对象信息。

11.8.2.10 rows

预估的需要读取的记录条数，这个值按道理来说，越小越好。

11.8.2.11 filtered

某个表经过搜索条件过滤后剩余记录条数的百分比，对于单表查询来说，这个值没什么意义，都是100%，但是对于多表查询就有意义了，越小越好。

11.8.2.12 Extra

一些额外的信息。比如Using where，Using index，Using filesort等等。我们用group by、union、distinct之类的语法的时候，要是没法直接利用索引来进行分组聚合，那么MySQL会直接基于临时表来完成，会有大量的磁盘操作，也就是会使用文件排序（Using filesort）。这种情况一般也是需要避免的。

12 参考资料

《从根上理解 MySQL》
《MySQL 技术内幕》
《深入浅出 MySQL》
《从零开始带你成为 MySQL 优化实战高手》
《深入理解分布式事务》
《阿里巴巴开发手册》
《高性能MySQL》

13 写在后面的话

如果你觉得小七文章给您带来了一些收获，可以帮忙点个赞，或者关注一下小七，小七会一如既往地更新有价值的博客。如果文章存在错误，也请联系小七，小七会在看到后，第一时间修改。最后感谢大家的支持，谢谢~

你可能感兴趣的:(mysql,mysql,面试,数据库)

mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe