Markland_l

mysql11

MySQL的查询重写规则

条件化简

移除不必要的括号
- 有时候表达式里有许多无用的括号，比如这样：
  
  ((a = 5 AND b = c) OR ((a > c) AND (c < 5)))
  
  看着就很烦，优化器会把那些用不到的括号给干掉，就是这样：
  
  (a = 5 and b = c) OR (a > c AND c < 5)
常量传递（constant_propagation）
- 有时候某个表达式是某个列和某个常量做等值匹配，比如这样：
  
  a = 5
  
  当这个表达式和其他涉及列 a 的表达式使用 AND 连接起来时，可以将其他
  
  表达式中的 a 的值替换为 5，比如这样：
  
  a = 5 AND b > a
- 有时候多个列之间存在等值匹配的关系，比如这样：
  
  a = b and b = c and c = 5
  
  这个表达式可以被简化为：
  
  a = 5 and b = 5 and c = 5
移除没用的条件（trivial_condition_removal）
- (a < 1 and b = b) OR (a = 6 OR 5 != 5)
  
  很明显，b = b 这个表达式永远为 TRUE，5 != 5 这个表达式永远为 FALSE，所
  
  以简化后的表达式就是这样的：
  
  (a < 1 and TRUE) OR (a = 6 OR FALSE)
  
  可以继续被简化为
  
  a < 1 OR a = 6
表达式计算
- 在查询开始执行之前，如果表达式中只包含常量的话，它的值会被先计算出
  
  来，比如这个：
  
  a = 5 + 1
  
  因为 5 + 1 这个表达式只包含常量，所以就会被化简成：
  
  a = 6
- 但是这里需要注意的是，如果某个列并不是以单独的形式作为表达式的操作
  
  数时，比如出现在函数中，出现在某个更复杂表达式中，就像这样：
  
  ABS(a) > 5
  
  或者：
  
  -a < -8
  
  优化器是不会尝试对这些表达式进行化简的。我们前边说过只有搜索条件中
  
  索引列和常数使用某些运算符连接起来才可能使用到索引，所以如果可以的话，
  
  最好让索引列以单独的形式出现在表达式中。
常量表检测
- 使用主键等值匹配或者唯一二级索引列等值匹配作为搜索条件来查询某个表。
- MySQL 觉得这两种查询花费的时间特别少，少到可以忽略，所以也把通过这两种方式查询的表称之为常量表（英文名：constant tables）。优化器在分析一个查询语句时，先首先执行常量表查询，然后把查询中涉及到该表的条件全部替换成常数，最后再分析其余表的查询成本，比方说这个查询语句：
  
  SELECT * FROM table1 INNER JOIN table2 ON table1.column1 = table2.column2 WHERE table1.primary_key = 1;
- 很明显，这个查询可以使用主键和常量值的等值匹配来查询 table1 表，也就是在这个查询中 table1 表相当于常量表，在分析对 table2 表的查询成本之前，就会执行对 table1 表的查询，并把查询中涉及 table1 表的条件都替换掉，也就是上边的语句会被转换成这样：
  
  SELECT table1 表记录的各个字段的常量值, table2.* FROM table1 INNER JOIN table2 ON table1 表 column1 列的常量值 = table2.column2;

外连接消除

我们前边说过，内连接的驱动表和被驱动表的位置可以相互转换，而左（外）连接和右（外）连接的驱动表和被驱动表是固定的。这就导致内连接可能通过优化表的连接顺序来降低整体的查询成本，而外连接却无法优化表的连接顺序。

外连接和内连接的本质区别就是：对于外连接的驱动表的记录来说，如果无法在被驱动表中找到匹配 ON 子句中的过滤条件的记录，那么该记录仍然会被加入到结果集中，对应的被驱动表记录的各个字段使用 NULL 值填充；而内连接的驱动表的记录如果无法在被驱动表中找到匹配 ON 子句中的过滤条件的记录，那么该记录会被舍弃。查询效果就是这样：

SELECT * FROM e1 INNER JOIN e2 ON e1.m1 = e2.m2;

m1	n1	m2	n2
2	b	2	b
3	c	3	c

SELECT * FROM e1 LEFT JOIN e2 ON e1.m1 = e2.m2;

m1	n1	m2	n2
2	b	2	b
3	c	3	c
1	a	null	null

对于上边例子中的（左）外连接来说，由于驱动表 e1 中 m1=1, n1='a’的记录无法在被驱动表 e2 中找到符合 ON 子句条件 e1.m1 = e2.m2 的记录，所以就直接把这条记录加入到结果集，对应的 e2 表的 m2 和 n2 列的值都设置为 NULL。

因为凡是不符合 WHERE 子句中条件的记录都不会参与连接。只要我们在搜索条件中指定关于被驱动表相关列的值不为 NULL，那么外连接中在被驱动表中找不到符合ON子句条件的驱动表记录也就被排除出最后的结果集了，也就是说：在这种情况下：==外连接和内连接也就没有什么区别了！==比方说这个查询：
- SELECT * FROM e1 LEFT JOIN e2 ON e1.m1 = e2.m2 WHERE e2.n2 IS NOT NULL;
- 由于指定了被驱动表 e2 的 n2 列不允许为 NULL，所以上边的 e1 和 e2 表的左（外）连接查询和内连接查询是一样的。当然，我们也可以不用显式的指定被驱动表的某个列 IS NOT NULL，只要隐含的有这个意思就行了，比方说这样：
  
  SELECT * FROM e1 LEFT JOIN e2 ON e1.m1 = e2.m2 WHERE e2.m2 = 2;
- 在这个例子中，我们在 WHERE 子句中指定了被驱动表 e2 的 m2 列等于 2，也就相当于间接的指定了 m2 列不为 NULL 值，所以上边的这个左（外）连接查询其实和下边这个内连接查询是等价的：
  
  SELECT * FROM e1 INNER JOIN e2 ON e1.m1 = e2.m2 WHERE e2.m2 = 2;
- 我们把这种在外连接查询中，指定的 WHERE 子句中包含被驱动表中的列不为 NULL 值的条件称之为空值拒绝（英文名：reject-NULL）。在被驱动表的 WHERE句符合空值拒绝的条件后，外连接和内连接可以相互转换。这种转换带来的好处就是查询优化器可以通过评估表的不同连接顺序的成本，选出成本最低的那种连接顺序来执行查询。

子查询优化

子查询语法

在一个查询语句 A 里的某个位置也可以有另一个查询语句 B，这个出现在 A 语句的某个位置中的查询 B 就被称为子查询，A 也被称之为外层查询。

SELECT子句中

SELECT (SELECT m1 FROM e1 LIMIT 1);

FROM子句中

SELECT m, n FROM (SELECT m2 + 1 AS m, n2 AS n FROM e2 WHERE m2 > 2) AS t;
这个例子中的子查询是：(SELECT m2 + 1 AS m, n2 AS n FROM e2 WHERE m2 > 2)，这里可以把子查询的查询结果当作是一个表，子查询后边的 AS t 表明这个子查询的结果就相当于一个名称为 t 的表，这个名叫 t 的表的列就是子查询结果中的列，比如例子中表 t 就有两个列：m 列和 n 列。这个放在 FROM 子句中的子查询本质上相当于一个表，但又和我们平常使用的表有点儿不一样，MySQL 把这种由子查询结果集组成的表称之为派生表。

WHERE或ON子句中

把子查询放在外层查询的 WHERE 子句或者 ON 子句中可能是我们最常用的一种使用子查询的方式了，比如这样：
- SELECT * FROM e1 WHERE m1 IN (SELECT m2 FROM e2);
这个查询表明我们想要将(SELECT m2 FROM e2)这个子查询的结果作为外层查询的 IN 语句参数，整个查询语句的意思就是我们想找 e1 表中的某些记录，这些记录的 m1 列的值能在 e2 表的 m2 列找到匹配的值。

ORDER BY子句、GROUP BY子句中

虽然语法支持，但没啥意义。

按返回的结果集区分子查询

因为子查询本身也算是一个查询，所以可以按照它们返回的不同结果集类型而把这些子查询分为不同的类型：

标量子查询

那些只返回一个单一值的子查询称之为标量子查询，比如这样：
- SELECT (SELECT m1 FROM e1 LIMIT 1);
- SELECT * FROM e1 WHERE m1 = (SELECT MIN(m2) FROM e2)
- SELECT * FROM e1 WHERE m1 < (SELECT MIN(m2) FROM e2);
- 这两个查询语句中的子查询都返回一个单一的值，也就是一个标量。这些标量子查询可以作为一个单一值或者表达式的一部分出现在查询语句的各个地方。

行子查询

顾名思义，就是返回一条记录的子查询，不过这条记录需要包含多个列（只包含一个列就成了标量子查询了）。比如这样：
- SELECT * FROM e1 WHERE (m1, n1) = (SELECT m2, n2 FROM e2 LIMIT 1);
其中的(SELECT m2, n2 FROM e2 LIMIT 1)就是一个行子查询，整条语句的含义就是要从 e1 表中找一些记录，这些记录的 m1 和 n1 列分别等于子查询结果中的 m2 和 n2 列。

列子查询

列子查询自然就是查询出一个列的数据喽，不过这个列的数据需要包含多条记录（只包含一条记录就成了标量子查询了）。比如这样：
- SELECT * FROM e1 WHERE m1 IN (SELECT m2 FROM e2);
其中的(SELECT m2 FROM e2)就是一个列子查询，表明查询出 e2 表的 m2 列的值作为外层查询 IN 语句的参数。

表子查询

顾名思义，就是子查询的结果既包含很多条记录，又包含很多个列，比如这样：
- SELECT * FROM e1 WHERE (m1, n1) IN (SELECT m2, n2 FROM e2);
其中的(SELECT m2, n2 FROM e2)就是一个表子查询，这里需要和行子查询对比一下，行子查询中我们用了 LIMIT 1 来保证子查询的结果只有一条记录，表子查询中不需要这个限制。

按与外层查询关系来区分子查询

不相关子查询

如果子查询可以单独运行出结果，而不依赖于外层查询的值，我们就可以把这个子查询称之为不相关子查询。我们前边介绍的那些子查询全部都可以看作不相关子查询。

[NOT] IN/ANY/SOME/ALL 子查询

对于列子查询和表子查询来说，它们的结果集中包含很多条记录，这些记录相当于是一个集合，所以就不能单纯的和另外一个操作数使用操作符来组成布尔表达式了，MySQL 通过下面的语法来支持某个操作数和一个集合组成一个布尔表达式：

IN 或者 NOT IN

具体的语法形式如下：
- 操作数 [NOT] IN (子查询)
这个布尔表达式的意思是用来判断某个操作数在不在由子查询结果集组成的集合中，比如下边的查询的意思是找出 e1 表中的某些记录，这些记录存在于子查询的结果集中：
- SELECT * FROM e1 WHERE (m1, n1) IN (SELECT m2, n2 FROM e2);

ANY/SOME（ANY 和 SOME 是同义词）

具体的语法形式如下：
- 操作数比较符 ANY/SOME(子查询)
这个布尔表达式的意思是只要子查询结果集中存在某个值和给定的操作数做比较操作，比较结果为 TRUE，那么整个表达式的结果就为 TRUE，否则整个表达式的结果就为 FALSE。比方说下边这个查询：
- SELECT * FROM e1 WHERE m1 > ANY(SELECT m2 FROM e2);
- 这个查询的意思就是对于 e1 表的某条记录的 m1 列的值来说，如果子查询 (SELECT m2 FROM e2)的结果集中存在一个小于 m1 列的值，那么整个布尔表达式的值就是 TRUE，否则为 FALSE，也就是说只要 m1 列的值大于子查询结果集中最小的值，整个表达式的结果就是 TRUE，所以上边的查询本质上等价于这个查询：
- SELECT * FROM e1 WHERE m1 > (SELECT MIN(m2) FROM e2);
- 另外，=ANY 相当于判断子查询结果集中是否存在某个值和给定的操作数相等，它的含义和 IN 是相同的。

ALL

具体的语法形式如下：
- 操作数比较操作 ALL(子查询)
这个布尔表达式的意思是子查询结果集中所有的值和给定的操作数做比较操作比较结果为 TRUE，那么整个表达式的结果就为 TRUE，否则整个表达式的结果就为 FALSE。比方说下边这个查询：
- SELECT * FROM e1 WHERE m1 > ALL(SELECT m2 FROM e2);
- 这个查询的意思就是对于 e1 表的某条记录的 m1 列的值来说，如果子查询 (SELECT m2 FROM e2)的结果集中的所有值都小于 m1 列的值，那么整个布尔表达式的值就是 TRUE，否则为 FALSE，也就是说只要 m1 列的值大于子查询结果集中最大的值，整个表达式的结果就是 TRUE，所以上边的查询本质上等价于这个查询：
- SELECT * FROM e1 WHERE m1 > (SELECT MAX(m2) FROM e2);

EXISTS 子查询

有的时候我们仅仅需要判断子查询的结果集中是否有记录，而不在乎它的记录具体是个啥，可以使用把 EXISTS 或者 NOT EXISTS 放在子查询语句前边，就像这样：
- SELECT * FROM e1 WHERE EXISTS (SELECT 1 FROM e2);
对于子查询(SELECT 1 FROM e2)来说，我们并不关心这个子查询最后到底查询出的结果是什么，所以查询列表里填*、某个列名，或者其他啥东西都无所谓，我们真正关心的是子查询的结果集中是否存在记录。也就是说只要(SELECT 1 FROM e2)这个查询中有记录，那么整个 EXISTS 表达式的结果就为 TRUE。

子查询语法注意事项

子查询必须用小括号扩起来。
在 SELECT 子句中的子查询必须是标量子查询，如果子查询结果集中有多个列或者多个行，都不允许放在 SELECT 子句中，在想要得到标量子查询或者行子查询，但又不能保证子查询的结果集只有一条记录时，应该使用 LIMIT 1 语句来限制记录数量。
对于[NOT] IN/ANY/SOME/ALL 子查询来说，子查询中不允许有 LIMIT 语句，而且这类子查询中 ORDER BY 子句、DISTINCT 语句、没有聚集函数以及 HAVING 子句的 GROUP BY 子句没有什么意义。因为子查询的结果其实就相当于一个集合，集合里的值排不排序等一点儿都不重要。
不允许在一条语句中增删改某个表的记录时同时还对该表进行子查询。

子查询在 MySQL 中是怎么执行的

想象子查询的执行方式

前提，对于in查询，in中数量小于200个，是精确统计页面，大于200个时，是桶index divive去统计的
想象中子查询的执行方式是这样的：
如果该子查询是不相关子查询，比如下边这个查询：
- SELECT * FROM s1 WHERE order_note IN (SELECT order_note FROM s2);
- 先单独执行(SELECT order_note FROM s2)这个子查询。然后在将上一步子查询得到的结果当作外层查询的参数再执行外层查询 SELECT * FROM s1 WHERE order_note IN (…)。
如果该子查询是相关子查询，比如下边这个查询：
- SELECT * FROM s1 WHERE order_note IN (SELECT order_note FROM s2 WHERE s1.order_no= s2.order_no);
- 这个查询中的子查询中出现了 s1.order_no= s2.order_no 这样的条件，意味着该子查询的执行依赖着外层查询的值，先从外层查询中获取一条记录，本例中也就是先从 s1 表中获取一条记录，然后执行子查询。最后根据子查询的查询结果来检测外层查询 WHERE 子句的条件是否成立，如果成立，就把外层查询的那条记录加入到结果集，否则就丢弃。再次执行第一步，获取第二条外层查询中的记录，依次类推
但真的是这样吗？其实 MySQL 用了一系列的办法来优化子查询的执行，大部分情况下这些优化措施其实挺有效的，下边我们来看看各种不同类型的子查询具体是怎么执行的。

标量子查询、行子查询的执行方式

对于不相关标量子查询或者行子查询来说，它们的执行方式很简单，比方说下边这个查询语句：
- SELECT * FROM s1 WHERE order_note = (SELECT order_note FROM s2 WHERE key3 = ‘a’ LIMIT 1);
- 它的执行方式和我们前面想象的一样：先单独执行(SELECT order_note FROM s2 WHERE key3 = ‘a’ LIMIT 1)这个子查询。然后在将上一步子查询得到的结果当作外层查询的参数再执行外层查询 SELECT * FROM s1 WHERE order_note= …。
- 也就是说，对于包含不相关的标量子查询或者行子查询的查询语句来说， MySQL 会分别独立的执行外层查询和子查询，就当作两个单表查询就好了。
对于相关的标量子查询或者行子查询来说，比如下边这个查询：
- SELECT * FROM s1 WHERE order_note = (SELECT order_note FROM s2 WHERE s1.order_no= s2.order_no LIMIT 1);
- 事情也和我们前面想象的一样，它的执行方式就是这样的：先从外层查询中获取一条记录，本例中也就是先从 s1 表中获取一条
- 然后从上一步骤中获取的那条记录中找出子查询中涉及到的值，本例中就是从 s1 表中获取的那条记录中找出 s1.order_no 列的值，然后执行子查询。
- 最后根据子查询的查询结果来检测外层查询 WHERE 子句的条件是否成立，如果成立，就把外层查询的那条记录加入到结果集，否则就丢弃。
- 再次执行第一步，获取第二条外层查询中的记录，依次类推。
- 也就是说对于两种使用标量子查询以及行子查询的场景中，MySQL 优化器的执行方式并没有什么新鲜的。

MySQL 对 IN 子查询的优化

第一种，物化表+转连接
第二种，将子查询转换成半连接

物化表

物化表就是临时表，进内存还是进磁盘，取决于表大小，还有系统变量和堆大小可以控制
对于不相关的 IN 子查询，比如这样：
- SELECT * FROM s1 WHERE order_note IN (SELECT order_note FROM s2 WHERE
order_no = ‘a’);
我们最开始的感觉就是这种不相关的 IN 子查询和不相关的标量子查询或者行子查询是一样一样的，都是把外层查询和子查询当作两个独立的单表查询来对待。但是 MySQL 为了优化 IN 子查询下了很大力气，所以整个执行过程并不像我们想象的那么简单。
对于不相关的 IN 子查询来说，如果子查询的结果集中的记录条数很少，那么把子查询和外层查询分别看成两个单独的单表查询效率很高，但是如果单独执行子查询后的结果集太多的话，就会导致这些问题：
- 1、结果集太多，可能内存中都放不下。
- 2、对于外层查询来说，如果子查询的结果集太多，那就意味着 IN 子句中的参数特别多，这就导致：无法有效的使用索引，只能对外层查询进行全表扫描。
在对外层查询执行全表扫描时，由于 IN 子句中的参数太多，这会导致检测一条记录是否符合和 IN 子句中的参数匹配花费的时间太长。
- 比如说 IN 子句中的参数只有两个：
- SELECT * FROM tbl_name WHERE column IN (a, b);
- 这样相当于需要对 tbl_name 表中的每条记录判断一下它的 column 列是否符合 column = a OR column = b。在 IN 子句中的参数比较少时这并不是什么问题，
如果 IN 子句中的参数比较多时，比如这样：
- SELECT * FROM tbl_name WHERE column IN (a, b, c …, …);
- 那么这样每条记录需要判断一下它的 column 列是否符合 column = a OR column = b OR column = c OR …，这样性能耗费可就多了。
MySQL 的改进是不直接将不相关子查询的结果集当作外层查询的参数，而是将该结果集写入一个临时表里。写入临时表的过程是这样的：
- 1、该临时表的列就是子查询结果集中的列。
- 2、写入临时表的记录会被去重，临时表也是个表，只要为表中记录的所有列建立主键或者唯一索引。
一般情况下子查询结果集不会大的离谱，所以会为它建立基于内存的使用 Memory 存储引擎的临时表，而且会为该表建立哈希索引。
如果子查询的结果集非常大，超过了系统变量 tmp_table_size 或者 max_heap_table_size，临时表会转而使用基于磁盘的存储引擎来保存结果集中的记录，索引类型也对应转变为 B+树索引。
MySQL 把这个将子查询结果集中的记录保存到临时表的过程称之为物化（英文名：Materialize）。为了方便起见，我们就把那个存储子查询结果集的临时表称之为物化表。正因为物化表中的记录都建立了索引（基于内存的物化表有哈希索引，基于磁盘的有 B+树索引），通过索引执行 IN 语句判断某个操作数在不在子查询结果集中变得非常快，从而提升了子查询语句的性能。

物化表转连接

事情到这就完了？我们还得重新审视一下最开始的那个查询语句：
- SELECT * FROM s1 WHERE order_note IN (SELECT order_note FROM s2 WHERE order_no = ‘a’);
- 当我们把子查询进行物化之后，假设子查询物化表的名称为 materialized_table，该物化表存储的子查询结果集的列为 m_val，那么这个查询就相当于表 s1 和子查询物化表 materialized_table 进行内连接：
- SELECT s1.* FROM s1 INNER JOIN materialized_table ON order_note = m_val;
转化成内连接之后就有意思了，查询优化器可以评估不同连接顺序需要的成本是多少，选取成本最低的那种查询方式执行查询。我们分析一下上述查询中使用外层查询的表 s1 和物化表 materialized_table 进行内连接的成本都是由哪几部分组成的：
- 1、如果使用 s1 表作为驱动表的话，总查询成本由下边几个部分组成：
  - 物化子查询时需要的成本
  - 扫描 s1 表时的成本
  - s1 表中的记录数量 × 通过 m_val = xxx 对 materialized_table 表进行单表访问的成本（我们前边说过物化表中的记录是不重复的，并且为物化表中的列建立了索引，所以这个步骤显然是非常快的）。
- 2、如果使用 materialized_table 表作为驱动表的话，总查询成本由下边几个部分组成：
  - 物化子查询时需要的成本
  - 扫描物化表时的成本
  - 物化表中的记录数量 × 通过 order_note= xxx 对 s1 表进行单表访问的成本（如果 order_note 列上建立了索引，这个步骤还是非常快的）。
  - MySQL 查询优化器会通过运算来选择上述成本更低的方案来执行查询。

将子查询转换为 semi-join

虽然将子查询进行物化之后再执行查询都会有建立临时表的成本，但是不管怎么说，我们见识到了将子查询转换为连接的强大作用，MySQL 继续开脑洞：能不能不进行物化操作直接把子查询转换为连接呢？让我们重新审视一下上边的查询语句：
- SELECT * FROM s1 WHERE order_note IN (SELECT order_note FROM s2 WHERE order_no = ‘a’);
- 我们可以把这个查询理解成：对于 s1 表中的某条记录，如果我们能在 s2 表（准确的说是执行完 WHERE s2.order_no= 'a’之后的结果集）中找到一条或多条记录，这些记录的 order_note 的值等于 s1 表记录的 order_note 列的值，那么该条 s1 表的记录就会被加入到最终的结果集。这个过程其实和把 s1 和 s2 两个表连接起来的效果很像：
- SELECT s1.* FROM s1 INNER JOIN s2 ON s1.order_note = s2.order_note WHERE s2.order_no= ‘a’;
- 只不过我们不能保证对于 s1 表的某条记录来说，在 s2 表（准确的说是执行完 WHERE s2.order_no= 'a’之后的结果集）中有多少条记录满足 s1.order_no = s2.order_no 这个条件，不过我们可以分三种情况讨论：
  - 情况一：对于 s1 表的某条记录来说，s2 表中没有任何记录满足 s1.order_note = s2.order_note 这个条件，那么该记录自然也不会加入到最后的结果集。
  - 情况二：对于 s1 表的某条记录来说，s2 表中有且只有 1 条记录满足 s1.order_note = s2.order_note 这个条件，那么该记录会被加入最终的结果集。
  - 情况三：对于 s1 表的某条记录来说，s2 表中至少有 2 条记录满足 s1.order_note = s2.order_note 这个条件，那么该记录会被多次加入最终的结果集。而in里面是个集合，是去重的，不会有多个
- 对于 s1 表的某条记录来说，由于我们只关心 s2 表中是否存在记录满足 s1.order_no = s2.order_note 这个条件，而不关心具体有多少条记录与之匹配，又因为有情况三的存在，我们上边所说的 IN 子查询和两表连接之间并不完全等价。但是将子查询转换为连接又真的可以充分发挥优化器的作用，所以 MySQL 在这里提出了一个新概念 — 半连接（英文名：semi-join）。
将 s1 表和 s2 表进行半连接的意思就是：对于 s1 表的某条记录来说，我们只关心在 s2 表中是否存在与之匹配的记录，而不关心具体有多少条记录与之匹配，最终的结果集中只保留 s1 表的记录。为了让大家有更直观的感受，我们假设 MySQL 内部是这么改写上边的子查询的：
- SELECT s1.* FROM s1 SEMI JOIN s2 ON s1.order_note = s2.order_note WHERE order_no= ‘a’;
- 注意： semi-join 只是在 MySQL 内部采用的一种执行子查询的方式，MySQL 并没有提供面向用户的 semi-join 语法。概念是有了，怎么实现这种所谓的半连接呢？MySQL 准备了好几种办法。
Table pullout （子查询中的表上拉）
- 当子查询的查询列表处只有主键或者唯一索引列时，可以直接把子查询中的表上拉到外层查询的 FROM 子句中，并把子查询中的搜索条件合并到外层查询的搜索条件中，比如假设 s2 中存在这个一个 key2 列，列上有唯一性索引：
- SELECT * FROM s1 WHERE key2 IN (SELECT key2 FROM s2 WHERE key3 = ‘a’);
- 由于 key2 列是 s2 表的唯一二级索引列，所以我们可以直接把 s2 表上拉到外层查询的 FROM 子句中，并且把子查询中的搜索条件合并到外层查询的搜索条件中，上拉之后的查询就是这样的：
- SELECT s1.* FROM s1 INNER JOIN s2 ON s1.key2 = s2.key2 WHERE s2.key3 = ‘a’;
- 为啥当子查询的查询列表处只有主键或者唯一索引列时，就可以直接将子查询转换为连接查询呢？因为主键或者唯一索引列中的数据本身就是不重复的嘛！所以对于同一条 s1 表中的记录，你不可能找到两条以上的符合 s1.key2 = s2.key2 的记录。
DuplicateWeedout execution strategy （重复值消除）
- 对于这个查询来说：
- SELECT * FROM s1 WHERE order_note IN (SELECT order_note FROM s2 WHERE order_no= ‘a’);
- 转换为半连接查询后，s1 表中的某条记录可能在 s2 表中有多条匹配的记录，所以该条记录可能多次被添加到最后的结果集中，为了消除重复，我们可以建立一个临时表，比方说这个临时表长这样：
- CREATE TABLE tmp (
id PRIMARY KEY

);
- 这样在执行连接查询的过程中，每当某条 s1 表中的记录要加入结果集时，就首先把这条记录的 id 值加入到这个临时表里，如果添加成功，说明之前这条 s1 表中的记录并没有加入最终的结果集，现在把该记录添加到最终的结果集；如果添加失败，说明之前这条 s1 表中的记录已经加入过最终的结果集，这里直接把它丢弃就好了，这种使用临时表消除 semi-join 结果集中的重复值的方式称之为 DuplicateWeedout。
LooseScan execution strategy （松散扫描）
- 大家看这个查询：
- SELECT * FROM s1 WHERE order_note IN (SELECT order_no FROM s2 WHERE order_no> ‘a’ AND order_no< ‘b’);
- 在子查询中，对于 s2 表的访问可以使用到 order_no 列的索引，而恰好子查询的查询列表处就是 order_no 列，这样在将该查询转换为半连接查询后，如果将 s2 作为驱动表执行查询的话，那么执行过程就是这样：
- 在 s2 表的 idx_order_no 索引中，值为’aa’的二级索引记录一共有 3 条，那么只需要取第一条的值到 s1 表中查找 s1.order_note= 'aa’的记录，如果能在 s1 表中找到对应的记录，那么就把对应的记录加入到结果集。依此类推，其他值相同的二级索引记录，也只需要取第一条记录的值到 s1 表中找匹配的记录，这种虽然是扫描索引，但只取值相同的记录的第一条去做匹配操作的方式称之为松散扫描。
- 当然除了我们上面所说的，MySQL 中的半连接方式还有好几种，比如 Semi-join Materializationa 半连接物化、FirstMatch execution strategy （首次匹配）等等，我们就不更深入的讨论了。
semi-join 的适用条件
- 当然，并不是所有包含 IN 子查询的查询语句都可以转换为 semi-join，只有形如这样的查询才可以被转换为 semi-join：
- SELECT … FROM outer_tables WHERE expr IN (SELECT … FROM inner_tables …) AND …
- 或者这样的形式也可以：
- SELECT … FROM outer_tables WHERE (oe1, oe2, …) IN (SELECT ie1, ie2, … FROM inner_tables …) AND …
- 用文字总结一下，只有符合下边这些条件的子查询才可以被转换为 semi-join：该子查询必须是和 IN 语句组成的布尔表达式，并且在外层查询的 WHERE 或者 ON 子句中出现。
- 外层查询也可以有其他的搜索条件，只不过和 IN 子查询的搜索条件必须使用AND连接起来。
- 该子查询必须是一个单一的查询，不能是由若干查询由 UNION 连接起来的形式。
- 该子查询不能包含 GROUP BY 或者 HAVING 语句或者聚集函数。
MySQL 对不能转为 semi-join 查询的子查询优化
- 1、对于不相关子查询来说，可以尝试把它们物化之后再参与查询比如我们上边提到的这个查询：
  - SELECT * FROM s1 WHERE order_note NOT IN (SELECT order_note FROM s2 WHERE order_no= ‘a’)
  - 先将子查询物化，然后再判断 order_note 是否在物化表的结果集中可以加快查询执行的速度。
- 2、不管子查询是相关的还是不相关的，都可以把 IN 子查询尝试转为 EXISTS 子查询
- 其实对于任意一个 IN 子查询来说，都可以被转为 EXISTS 子查询，通用的例子如下：
- outer_expr IN (SELECT inner_expr FROM … WHERE subquery_where)
- 可以被转换为：
- EXISTS (SELECT inner_expr FROM … WHERE subquery_where AND outer_expr=inner_expr)
- 为啥要转换呢？这是因为不转换的话可能用不到索引，比方说下边这个查询：
- SELECT * FROM s1 WHERE order_no IN (SELECT order_no FROM s2 where s1.order_note = s2.order_note) OR insert_time > ‘2021-03-22 18:28:28’;
- 这个查询中的子查询是一个相关子查询，而且子查询执行的时候不能使用到索引，但是将它转为 EXISTS 子查询后却可以使用到索引：
- SELECT * FROM s1 WHERE EXISTS (SELECT 1 FROM s2 where s1.order_note = s2.order_note AND s2.order_no= s1.order_no) OR insert_time > ‘2021-03-22 18:28:28’00;
- 转为 EXISTS 子查询时便可能使用到 s2 表的 idx_order_no 索引了。需要注意的是，如果 IN 子查询不满足转换为 semi-join 的条件，又不能转换为物化表或者转换为物化表的成本太大，那么它就会被转换为 EXISTS 查询。
- 在 MySQL5.5 以及之前的版本没有引进 semi-join 和物化的方式优化子查询时，优化器都会把 IN 子查询转换为 EXISTS 子查询，所以当时好多声音都是建议大家把子查询转为连接，不过随着 MySQL 的发展，最近的版本中引入了非常多的子查询优化策略，内部的转换工作优化器会为大家自动实现。

小结

如果 IN 子查询符合转换为 semi-join 的条件，查询优化器会优先把该子查询转换为 semi-join，然后再考虑下边 5 种执行半连接的策略中哪个成本最低：
- Table pullout
- DuplicateWeedout
- LooseScan
- Materialization
- FirstMatch
- 选择成本最低的那种执行策略来执行子查询。
如果 IN 子查询不符合转换为 semi-join 的条件，那么查询优化器会从下边两种策略中找出一种成本更低的方式执行子查询：
- 先将子查询物化之后再执行查询
- 执行 IN to EXISTS 转换

ANY/ALL 子查询优化

如果 ANY/ALL 子查询是不相关子查询的话，它们在很多场合都能转换成我们熟悉的方式去执行，比方说：

原始表达式转换为
- < ANY (SELECT inner_expr …) < (SELECT MAX(inner_expr) …)
- > ANY (SELECT inner_expr …) > (SELECT MIN(inner_expr) …)
- < ALL (SELECT inner_expr …) < (SELECT MIN(inner_expr) …)
- > ALL (SELECT inner_expr …) > (SELECT MAX(inner_expr) …)

[NOT] EXISTS 子查询的执行

如果[NOT] EXISTS 子查询是不相关子查询，可以先执行子查询，得出该[NOT] EXISTS 子查询的结果是 TRUE 还是 FALSE，并重写原先的查询语句，比如对这个查询来说：
- SELECT * FROM s1 WHERE EXISTS (SELECT 1 FROM s2 WHERE expire_time= ‘a’) OR order_no> ‘2021-03-22 18:28:28’0;
- 因为这个语句里的子查询是不相关子查询，所以优化器会首先执行该子查询，假设该 EXISTS 子查询的结果为 TRUE，那么接着优化器会重写查询为：
- SELECT * FROM s1 WHERE TRUE OR order_no> ‘2021-03-22 18:28:28’0;
- 进一步简化后就变成了：
- SELECT * FROM s1 WHERE TRUE;
对于相关的[NOT] EXISTS 子查询来说，比如这个查询：
- SELECT * FROM s1 WHERE EXISTS (SELECT 1 FROM s2 WHERE s1.order_note = s2.order_note);
- 很不幸，这个查询只能按照我们想象中的那种执行相关子查询的方式来执行。
- 不过如果[NOT] EXISTS 子查询中如果可以使用索引的话，那查询速度也会加快不少，比如：SELECT * FROM s1 WHERE EXISTS (SELECT 1 FROM s2 WHERE s1.order_note = s2.order_no);
- 上边这个 EXISTS 子查询中可以使用 idx_order_no 来加快查询速度。

再深入查询优化

全局考虑性能优化

为什么查询速度会慢

在尝试编写快速的查询之前，需要清楚一点，真正重要是响应时间。如果把查询看作是一个任务，那么它由一系列子任务组成，每个子任务都会消耗一定的时间。如果要优化查询，实际上要优化其子任务，要么消除其中一些子任务，要么减少子任务的执行次数，要么让子任务运行得更快。
MySQL 查询的生命周期大致可以按照顺序来看:
- 从客户端到服务器，
- 然后在服务器上进行解析，
- 生成执行计划，执行，并返回结果给客户端。其中“执行” 可以认为是整个生命周期中最重要的阶段，这其中包括了大量为了检索数据到存储引擎的调用以及调用后的数据处理，包括排序、分组等。
在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络，CPU 计算，生成统计信息和执行计划、锁等待（互斥等待）等操作，尤其是向底层存储引擎检索数据的调用操作,这些调用需要在内存操作,CPU 操作和内存不足时导致的 IO 操作上消耗时间。根据存储引擎不同，可能还会产生大量的上下文切换以及系统调用。
优化查询的目的就是减少和消除这些操作所花费的时间。

查询执行的流程再回顾

当希望 MySQL 能够以更高的性能运行查询时，最好的办法就是弄清楚 MySQL 是如何优化和执行查询的。一旦理解这一点，很多查询优化工作实际上就是遵循一些原则让优化器能够按照预想的合理的方式运行。
换句话说，是时候回头看看我们前面讨论的内容了:MySQL 执行一个查询过程。根据下图，我们可以看到当向 MySQL 发送一个请求的时候，MySQL 到底做了些什么
- 1.客户端发送一条查询（通讯协议<半双工>）给服务器。
- 2.服务器先检查查询缓存，如果命中了缓存，则立刻返回存储在缓存中的结果。否则进入下一阶段。
- 3.服务器端通过解析器进行 SQL 解析，生成解析树，再预处理，得到进一步的解析树，再由查询优化器生成对应的查询执行计划。
- 4.MySQL 根据查询优化器生成的查询执行计划，调用查询存储引擎的（innodb、myisam、etc） API 来执行查询。
- 5.将结果返回给客户端。
上面的每一步都比想象的复杂，查询优化器固然是其中特别复杂也特别难理解的部分。但是其他部分就对查询的性能毫无影响？

MySQL 客户端服务器通信协议

一般来说，不需要去理解 MySQL 通信协议的内部实现细节，只需要大致理解通信协议是如何工作的。MySQL 客户端和服务器之间的通信协议是“半双工” 的，这意味着，在任何一个时刻，要么是由服务器向客户端发送数据，要么是由客户端向服务器发送数据，这两个动作不能同时发生。所以，我们无法也无须将一个消息切成小块独立来发送。
这种协议让 MySQL 通信简单快速，但是也从很多地方限制了 MySQL。一个明显的限制是，这意味着没法进行流量控制。一旦一端开始发生消息，另一端要接收完整个消息才能响应它。这就像来回抛球的游戏﹔在任何时刻，只有一个人能控制球，而且只有控制球的人才能将球抛回去（发送消息)。
客户端用一个单独的数据包将查询传给服务器。这也是为什么当查询的语句很长的时候，参数 max_allowed_packet 就特别重要了。一旦客户端发送了请求，它能做的事情就只是等待结果了。
相反的，一般服务器响应给用户的数据通常很多，由多个数据包组成。当服务器开始响应客户端请求时，客户端必须完整地接收整个返回结果，而不能简单地只取前面几条结果，然后让服务器停止发送数据。这种情况下，客户端若接收完整的结果，然后取前面几条需要的结果，或者接收完几条结果后就“粗暴”地断开连接，都不是好主意。这也是在必要的时候一定要在查询中加上 LIMIT 限制（分页）的原因。
换一种方式解释这种行为:当客户端从服务器取数据时，看起来是一个拉数据的过程，但实际上是 MySQL 在向客户端推送数据的过程。客户端不断地接收从服务器推送的数据，客户端也没法让服务器停下来。多数连接 MySQL 的库函数都可以获得全部结果集并缓存到内存里，还可以逐行获取需要的数据。默认一般是获得全部结果集并缓存到内存中。MySQL 通常需要等所有的数据都已经发送给客户端才能释放这条查询所占用的资源，所以接收全部结果并缓存通常可以减少服务器的压力，让查询能够早点结束、早点释放相应的资源。
当使用库函数从 MySQL 获取数据时，其结果看起来都像是从 MySQL 服务器获取数据，而实际上都是从这个库函数的缓存获取数据。多数情况下这没什么问题，但是如果需要返回一个很大的结果集的时候，这样做并不好，因为库函数会花很多时间和内存来存储所有的结果集。
对于 Java 程序来说，很有可能发生 OOM，所以 MySQL 的 JDBC 里提供了 setFetchSize() 之类的功能，来解决这个问题：
- 1、当 statement 设置以下属性时，采用的是流数据接收方式，每次只从服务器接收部份数据，直到所有数据处理完毕，不会发生 JVM OOM。 setResultSetType(ResultSet.TYPE_FORWARD_ONLY); setFetchSize(Integer.MIN_VALUE);
- 2、调用 statement 的 enableStreamingResults 方法，实际上 enableStreamingResults 方法内部封装的就是第 1 种方式。
- 3、设置连接属性 useCursorFetch=true (5.0 版驱动开始支持)，statement 以 TYPE_FORWARD_ONLY 打开，再设置 fetch size 参数，表示采用服务器端游标，每次从服务器取 fetch_size 条数据。
```
con = DriverManager.getConnection(url); 
ps = (PreparedStatement) con.prepareStatement(sql,ResultSet.TYPE_FORWARD_ONLY, ResultSet.CONCUR_READ_ONLY); 
ps.setFetchSize(Integer.MIN_VALUE); 
ps.setFetchDirection(ResultSet.FETCH_REVERSE); 
rs = ps.executeQuery(); 
while (rs.next()) {……实际的业务处理}
```

查询状态

对于一个 MySQL 连接，或者说一个线程，任何时刻都有一个状态，该状态表示了 MySQL 当前正在做什么。在一个查询的生命周期中，状态会变化很多次

查询优化处理

查询的生命周期的下一步是将一个 SQL 转换成一个执行计划，MySQL 再依照这个执行计划和存储引擎进行交互。这包括多个子阶段:解析 SQL、预处理、优化 SQL 执行计划。这个过程中任何错误（例如语法错误）都可能终止查询。在实际执行中，这几部分可能一起执行也可能单独执行。
我们通过前面的学习，可以看到 MySQL 的查询优化器是一个非常复杂的部件，它使用了很多优化策略来生成一个最优的执行计划。优化策略可以简单地分为两种，一种是静态优化，一种是动态优化。静态优化可以直接对解析树进行分析，并完成优化。例如，优化器可以通过一些简单的代数变换将 WHERE 条件转换成另一种等价形式。静态优化不依赖于特别的数值，如 WHERE 条件中带入的一些常数等。静态优化在第一次完成后就一直有效，即使使用不同的参数重复执行查询也不会发生变化。可以认为这是一种“编译时优化”。
相反，动态优化则和查询的上下文有关，也可能和很多其他因素有关，例如 WHERE 条件中的取值、索引中条目对应的数据行数等。这需要在每次查询的时候都重新评估，可以认为这是“运行时优化”。
优化器是相当复杂性和智能的。建议大家“不要自以为比优化器更聪明”。如果没有必要，不要去干扰优化器的工作，让优化器按照它的方式工作。尽量按照优化器的提示去优化我们的表、索引和 SQL 语句，比如写查询，或者重新设计更优的库表结构，或者添加更合适的索引。但是请尽可能的保持 SQL 语句的简洁， SQL 语句变得很复杂的情况下，请相信我，维护会成为一个地狱。而带来的最终的收益微乎其微。
当然，虽然优化器已经很智能了，但是有时候也无法给出最优的结果。有时候你可能比优化器更了解数据，例如，由于应用逻辑使得某些条件总是成立﹔还有时，优化器缺少某种功能特性，如哈希索引﹔再如前面提到的，从优化器的执行成本角度评估出来的最优执行计划，实际运行中可能比其他的执行计划更慢。
如果能够确认优化器给出的不是最佳选择，并且清楚优化背后的原理，那么也可以帮助优化器做进一步的优化。
MySQL 架构由多个层次组成。在服务器层有查询优化器，却没有保存数据和索引的统计信息。统计信息申存储引擎实现，不同的存储引擎可能会存储不同的统计信息（也可以按照不同的格式存储统计信息)。某些引擎，例如 Archive 引擎，则根本就没有存储任何统计信息!
因为服务器层没有任何统计信息，所以 MySQL 查询优化器在生成查询的执行计划时，需要向存储引擎获取相应的统计信息。存储引擎则提供给优化器对应的统计信息，包括:每个表或者索引有多少个页面、每个表的每个索引的基数是多少、数据行和索引长度、索引的分布信息等。优化器根据这些信息来选择一个最优的执行计划。
当出现不理想的 SQL 查询时，我们就需要知道查询优化器是如何工作的，以便有针对性的进行改进，不管是 SQL 语句本身还是表结构相关，比如索引。这个时候请仔细耐心的对慢查询进行分析。

查询执行引擎

在解析和优化阶段，MySQL 将生成查询对应的执行计划，MySQL 的查询执行引擎则根据这个执行计划来完成整个查询。相对于查询优化阶段，查询执行阶段不是那么复杂：MySQL 只是简单地根据执行计划给出的指令逐步执行。

返回结果给客户端

查询执行的最后一个阶段是将结果返回给客户端。即使查询不需要返回结果集给客户端，MySQL 仍然会返回这个查询的一些信息，如该查询影响到的行数。
如果查询可以被缓存，那么 MySQL 在这个阶段也会将结果存放到查询缓存中。
MySQL 将结果集返回客户端是一个增量、逐步返回的过程。一旦服务器开始生成第一条结果时，MySQL 就可以开始向客户端逐步返回结果集了。
这样处理有两个好处﹔服务器端无须存储太多的结果，也就不会因为要返回太多结果而消耗太多内存。另外，这样的处理也让 MySQL 客户端第一时间获得返回的结果。结果集中的每一行都会以一个满足 MySQL 客户端/服务器通信协议的封包发送，再通过 TCP 协议进行传输，在 TCP 传输的过程中，可能对 MySQL 的封包进行缓存然后批量传输。

通过 show profile 分析 SQL

通过上面的描述可知，当我们通过应用程序访问 MySQL 服务时，有时候性能不一定全部卡在语句的执行上。当然通过慢查询日志定位那些执行效率较低的 SQL 语句时候我们常用的手段，但是：
一、慢查询日志在查询结束以后才记录，在应用反映执行效率出现问题的时候查询未必执行完成；
二、有时候问题的产生不一定是语句的执行，有可能是其他原因导致的。慢查询日志并不能定位问题。

show processlist

这个时候通过 **show processlist;**查看线程状态非常有用,这可以让我们很快地了解当前 MySQL 在进行的线程,包括线程的状态、是否锁表等，可以实时地查看 SQL 的执行情况，同时对一些锁表操作进行优化。在一个繁忙的服务器上，可能会看到大量的不正常的状态，例如 statistics 正占用大量的时间。这通常表示，某个地方有异常了。线程常见的状态有很多，比如

statistics

The server is calculating statistics to develop a query execution plan. If a thread is in this state for a long time, the server is probably disk-bound performing other work.
服务器正在计算统计信息以研究一个查询执行计划。如果线程长时间处于此状态，则服务器可能是磁盘绑定执行其他工作。

Creating tmp table

The thread is creating a temporary table in memory or on disk. If the table is created in memory but later is converted to an on-disk table, the state during that operation is Copying to tmp table on disk.
该线程正在内存或磁盘上创建临时表。如果表在内存中创建但稍后转换为磁盘表，则该操作期间的状态将为 Copying to tmp table on disk

Sending data

The thread is reading and processing rows for a SELECT statement, and sending data to the client. Because operations occurring during this state tend to perform large amounts of disk access (reads), it is often the longest-running state over the lifetime of a given query.
线程正在读取和处理 SELECT 语句的行，并将数据发送到客户端。由于在此状态期间发生的操作往往会执行大量磁盘访问（读取），因此它通常是给定查询生命周期中运行时间最长的状态。

其余的可以参考：

https://dev.mysql.com/doc/refman/5.7/en/general-thread-states.html

通过 show profile 分析

对于每个线程到底时间花在哪里，可以通过 show profile 来分析。

1、首先检查当前 MySQL 是否支持 profile

select @@have_profiling;

2、默认 profiling 是关闭的，可以通过 set 语句在 Session 级别开启 profiling:

select @@profiling;
set profiling=1;

3、执行一个 SQL 查询

select count(*) from order_exp;

4、通过 show profiles 语句，看到当前 SQL 的 Query ID

show profiles;

5、通过 show profile for query 语句能够看到执行过程中线程的每个状态和消耗的时间

show profile for query 1;
通过仔细检查 show profile for query 的输出，能够发现在执行 COUNT(*)的过程中，时间主要消耗在 Sending data 这个状态上。

6、在获取到最消耗时间的线程状态后，MySQL 支持进一步选择 all、cpu、

block io、contextswitch、page faults 等明细类型来查看 MySQL 在使用什么资源上耗费了过高的时间:
show profile all for query 1\G
能够发现 Sending data 状态下，时间主要消耗在 CPU 上了。所以show profile能够在做SQL优化时帮助我们了解时间都耗费到哪里去了，同时如果 MySQL 源码感兴趣，还可以通过 show profile source for query 查看 SQL 解析执行过程中每个步骤对应的源码的文件、函数名以及具体的源文件行数。

InnoDB 引擎底层解析

MySQL 对于我们来说还是一个黑盒，我们只负责使用客户端发送请求并等待服务器返回结果，表中的数据到底存到了哪里？以什么格式存放的？MySQL 是以什么方式来访问的这些数据？这些问题我们统统不知道。要搞明白查询优化背后的原理，就必须深入 MySQL 的底层去一探究竟，而且事务、锁等的原理也要求我们必须深入底层

InnoDB 记录存储结构和索引页结构

InnoDB 是一个将表中的数据存储到磁盘上的存储引擎，所以即使关机后重启我们的数据还是存在的。而真正处理数据的过程是发生在内存中的，所以需要把磁盘中的数据加载到内存中，如果是处理写入或修改请求的话，还需要把内存中的内容刷新到磁盘上。而我们知道读写磁盘的速度非常慢，和内存读写差了几个数量级，所以当我们想从表中获取某些记录时，InnoDB 存储引擎需要一条一条的把记录从磁盘上读出来么？
InnoDB 采取的方式是：将数据划分为若干个页，以页作为磁盘和内存之间交互的基本单位，InnoDB 中页的大小一般为 16 KB。也就是在一般情况下，一次最少从磁盘中读取 16KB 的内容到内存中，一次最少把内存中的 16KB 内容刷新到磁盘中。
我们平时是以记录为单位来向表中插入数据的，这些记录在磁盘上的存放方式也被称为行格式或者记录格式。InnoDB 存储引擎设计了 4 种不同类型的行格式，分别是 Compact、Redundant、Dynamic 和 Compressed 行格式。

行格式

我们可以在创建或修改表的语句中指定行格式：
CREATE TABLE 表名 (列的信息) ROW_FORMAT=行格式名称
四种行格式
- compact
- redundant
- dynamic
- compressed

组成

记录的额外信息
- 变长字段长度列表
- NULL值列表
- 记录头信息
  - 预留位
  - 预留位
  - delete mask
  - min rec mask
  - n owned
  - heap no
  - record type
  - next record
DB_ROW_ID
DB_TRX_ID
DB_ROLL_PTR
记录的真实数据
- 列1的值
- 列2的值
- 列3的值
- 。。。
- 列N的值

COMPACT

我们知道 MySQL 支持一些变长的数据类型，比如 VARCHAR(M)、 VARBINARY(M)、各种 TEXT 类型，各种 BLOB 类型，我们也可以把拥有这些数据类型的列称为变长字段，变长字段中存储多少字节的数据是不固定的，所以我们在存储真实数据的时候需要顺便把这些数据占用的字节数也存起来。如果该可变字段允许存储的最大字节数（M×W）超过 255 字节并且真实存储的字节数（L）超过 127 字节，则使用 2 个字节，否则使用 1 个字节。
表中的某些列可能存储 NULL 值，如果把这些 NULL 值都放到记录的真实数据中存储会很占地方，所以 Compact 行格式把这些值为 NULL 的列统一管理起来，存储到 NULL 值列表。每个允许存储 NULL 的列对应一个二进制位，二进制位的值为 1 时，代表该列的值为 NULL。二进制位的值为 0 时，代表该列的值不为 NULL。
还有一个用于描述记录的记录头信息，它是由固定的 5 个字节组成。5 个字节也就是 40 个二进制位，不同的位代表不同的意思。
- 预留位 1 1 没有使用
- 预留位 2 1 没有使用
- delete_mask 1 标记该记录是否被删除
- min_rec_mask 1 B+树的每层非叶子节点中的最小记录都会添加该标记
- n_owned 4 表示当前记录拥有的记录数
- heap_no 13 表示当前记录在页的位置信息
- record_type3 表示当前记录的类型，0 表示普通记录，1 表示 B+树非叶子节点记录，2 表示最小记录，3 表示最大记录
- next_record16 表示下一条记录的相对位置，B+树中的叶子节点内部元素是通过单链表连起来，就是这个字段，叶子节点间是通过双向链表连起来的
记录的真实数据除了我们自己定义的列的数据以外，MySQL 会为每个记录默认的添加一些列（也称为隐藏列），包括：
- DB_ROW_ID(row_id)：非必须，6 字节，表示行 ID，唯一标识一条记录
  - 主键或者唯一性索引，如果都没有，默认会添加一个作为主键
- DB_TRX_ID：必须，6 字节，表示事务 ID
- DB_ROLL_PTR：必须，7 字节，表示回滚指针
InnoDB 表对主键的生成策略是：优先使用用户自定义主键作为主键，如果用户没有定义主键，则选取一个 Unique 键作为主键，如果表中连 Unique 键都没有定义的话，则 InnoDB 会为表默认添加一个名为 row_id 的隐藏列作为主键。 DB_TRX_ID（也可以称为 trx_id）和 DB_ROLL_PTR（也可以称为 roll_ptr）这两个列是必有的，但是 row_id 是可选的（在没有自定义主键以及 Unique 键的情况下才会添加该列）。
其他的行格式和 Compact 行格式差别不大。

Redundant 行格式

Redundant 行格式是 MySQL5.0 之前用的一种行格式，不予深究。

Dynamic 和 Compressed 行格式

MySQL5.7 的默认行格式就是 Dynamic，Dynamic 和 Compressed 行格式和 Compact 行格式挺像，只不过在处理行溢出数据时有所不同。Compressed 行格式和 Dynamic 不同的一点是，Compressed 行格式会采用压缩算法对页面进行压缩，以节省空间。
什么叫数据溢出？

你可能感兴趣的:(mysql,sql,数据库,java)

Java解决赎金信问题宣布无人罪力扣面试题 java 开发语言
Java解决赎金信问题01题目给你两个字符串：ransomNote和magazine，判断ransomNote能不能由magazine里面的字符构成。如果可以，返回true；否则返回false。magazine中的每个字符只能在ransomNote中使用一次。示例1：输入：ransomNote="a",magazine="b"输出：false示例2：输入：ransomNote="aa",magaz
Java解决同构字符串问题宣布无人罪力扣面试题 java 开发语言
Java解决同构字符串问题01题目给定两个字符串s和t，判断它们是否是同构的。如果s中的字符可以按某种映射关系替换得到t，那么这两个字符串是同构的。每个出现的字符都应当映射到另一个字符，同时不改变字符的顺序。不同字符不能映射到同一个字符上，相同字符只能映射到同一个字符上，字符可以映射到自己本身。示例1:输入：s="egg",t="add"输出：true示例2：输入：s="foo",t="bar"输
Nginx、Spring Cloud Gateway 与 Higress 的应用场景及核心区别拂晓神剑zzz nginx 运维
Nginx、SpringCloudGateway与Higress的应用场景及核心区别一、应用场景对比1.Nginx：传统Web服务与高性能反向代理典型场景：静态资源服务器（图片、CSS、JS）高并发Web服务反向代理（如JavaTomcat前端）简单负载均衡（轮询、IP哈希）传统企业网站、电商平台入口层优势：轻量级、低资源消耗，单机可处理万级并发稳定可靠，适合长期运行的静态服务社区成熟，插件生态丰
day7反转链表&反转链表II替换空格&反转字符串里的单词&左旋转字符串彬彬小码农代码随想录链表数据结构 java
Java中有很多对字符串封装的操作，本次解题中不调用方法。1.力扣344利用双指针即可解决反转链表，定义一个left指针指向0，right指向nums.length-1，交换后向中间移动，直至left>=right结束解题步骤：定义两个指针，left和right，分别初始化为0和nums.length-1nums【left】和nums【right】交换值，并让左右指针分别向中间移动一步重复循环，直
数据仓库技术及应用（Hive 产生背景与架构设计，存储模型与数据类型）娟恋无暇数据仓库笔记 hive
1.Hive产生背景传统Hadoop架构存在的一些问题：MapReduce编程必须掌握Java，门槛较高传统数据库开发、DBA、运维人员学习门槛高HDFS上没有Schema的概念，仅仅是一个纯文本文件Hive的产生：为了让用户从一个现有数据基础架构转移到Hadoop上现有数据基础架构大多基于关系型数据库和SQL查询Facebook诞生了Hive2.Hive是什么官网：https://hive.ap
[Java恶补day39] 整理模板·考点六【反转链表】
考点六【反转链表】【考点总结】1.206.【题目】【核心思路】【复杂度】时间复杂度：O()O()O()。空间复杂度：O()O()O()。【代码】92.【题目】【核心思路】【复杂度】时间复杂度：O()O()O()。空间复杂度：O()O()O()。【代码】25.K个一组翻转链表【题目】【核心思路】图解：【复杂度】时间复杂度：O()O()O()。空间复杂度：O()O()O()。【代码】参考：1、灵神视频
C#与SQL Server交互的数据库技术实践不教书的塞涅卡
本文还有配套的精品资源，点击获取简介：本课程深入探讨C#与SQLServer数据库的交互技术，包括建立连接、执行SQL语句以及进行CRUD操作。详细介绍使用C#进行数据库操作时的核心概念与高级功能，如参数化查询、存储过程、事务处理、索引、视图和触发器等。旨在教授开发者如何高效、安全地管理和开发SQLServer数据库应用。1.C#与SQLServer的连接建立在现代软件开发中，后端服务经常需要与数
了解GC吗？什么是GC？后端java
GC是什么？为什么要GC？GC（GarbageCollection），垃圾回收，是Java与C++的主要区别之一。作为Java开发者，一般不需要专门编写内存回收和垃圾清理代码。这是因为在Java虚拟机中，存在自动内存管理和垃圾清理机制。对JVM中的内存进行标记，并确定哪些内存需要回收，根据一定的回收策略，自动的回收内存，保证JVM中的内存空间，防止出现内存泄露和溢出问题。GC是任意时候都能进行的吗
未来数据库硬件-网络篇数据库云计算架构
本文在绿泡泡“狗哥琐话”首发于2025.2.17<-关注不走丢。最近看到一篇不错的文章，叫做“ModernHardwareforFutureDatabases”，里面从几个方向讲了下现在数据库的硬件发展趋势，今天先来说说网络篇。内容中，一位大佬对（获过图灵奖的大佬）OLTP系统进行了一些基准测试，发现TCP-IP协议栈对于总体CPU使用率是占在47～68%。如果使用的网络带宽增加，这个开销还会提升
数据库的后悔药：Undo Log揭秘你一身傲骨怎能输游戏行业领域知识专栏撤销日志（Undo Log）
文章摘要撤销日志（UndoLog）是数据库的“后悔药”机制，用于保证数据操作的原子性和一致性。其核心原理是修改数据前先记录原始状态到UndoLog，若事务失败则进行回滚恢复。典型应用包括：1）事务回滚（如转账异常时还原数据）；2）并发控制（通过快照读提供多版本视图）。主流数据库如MySQLInnoDB和Oracle均采用该技术，其流程可概括为“先备份后修改，出错即还原”。简言之，UndoLog通过
基于虚拟化技术的网闸安全交换：物理隔离时代的智能数据流通引擎 109702008 #linux系统安全安全人工智能网络
摘要：在等保2.0和零信任架构背景下，传统网闸正从“物理断网”向“智能交换”演进。本文将深入解析如何通过硬件虚拟化+策略容器化在网闸内部实现安全数据交换，并提供工业级落地方案。一、痛点：隔离与效率的终极矛盾当企业面临以下场景时，传统网闸力不从心：生产网与办公网需实时同步数据库公有云与私有云间敏感文件传输多租户环境下跨安全域业务协同核心矛盾：物理隔离阻断攻击链的同时，也阻断了业务流！二、技术破局：虚
JavaScript基础语法之运算符和控制流 AA-代码批发V哥 JavaScript javascript
JavaScript基础语法之运算符和控制流一、运算符1.1算术运算符：数值计算的基石1.1.1字符串拼接陷阱1.2比较运算符：条件判断的起点1.2.1严格比较（`===`）vs松散比较（`==`）1.2.2其他比较运算符1.3逻辑运算符：复杂条件的组合1.3.1短路逻辑（重要特性）1.3.2实战：表单验证1.4赋值运算符：数据存储的桥梁1.4.1基础赋值（`=`）1.4.2解构赋值（ES6新增）
2019年架构师系列教程：高并发Netty实战打造百万连接架构不教书的塞涅卡
本文还有配套的精品资源，点击获取简介：本课程面向高级IT专业人士，旨在教授如何利用Netty框架设计和实现能够处理高并发连接的服务器架构。Netty是一个高性能、异步事件驱动的Java网络应用程序框架。课程将提升学员在系统架构设计和性能优化方面的技能，应对高并发场景挑战，特别是在金融、游戏、物联网等领域。1.Netty框架基础概念介绍Netty是一个高性能的网络应用框架，专为快速开发可维护的高性能
JavaScript基础语法之变量声明和数据类型 AA-代码批发V哥 JavaScript javascript
JavaScript基础语法之变量声明和数据类型一、变量声明1.1变量声明的本质1.2三种声明方式对比（var/let/const）1.2.1var：函数作用域的“老派选手”1.2.2let：块级作用域的“新生代”1.2.3const：常量声明的“守护者”二、数据类型2.1原始数据类型（PrimitiveTypes）2.1.1字符串（String）2.1.2数值（Number）2.1.3布尔（Bo
守护线程及定时器小白白成长记多线程程序人生经验分享 java
守护线程（后台线程）在java语言中线程分为ldalei用户线程和守护线程（后台线程）其中守护线程代表有垃圾回收线程守护线程的特点一般守护线程是一个死循环，所有的用户线程结束，守护线程就结束（main方法也是一个用户线程）*守护线程的用处假设每天00：00时候系统数据自动备份这个时候就需要设置定时器，并且可以将定时器设置为守护线程定时器定时器的作用是间隔特定的时间，执行特定的程序在Java的类库中
基于锁的获取与释放方式即计划于所得获取与释放方式进行分类——显式锁和隐式锁小黄工程师学习进阶版 Java java
隐式锁Java中的隐式锁（也称为内置锁或自动锁）是通过使用关键字实现的一种线程同步机制。当一个线程进入被synchronized修饰的方法或代码块时，它会自动获得对象级别的锁，退出该方法或代码块时则会自动释放这把锁。在Java中，隐式锁的实现机制主要包括以下两种类型：互斥锁（Mutex）虽然Java标准库并未直接暴露操作系统的互斥锁提供使用，但在Java虚拟机对synchronized关键字处理的
java 定时器需要守护线程,守护线程什么时候有用？ weixin_39956353 java 定时器需要守护线程
当所有正在运行的线程都是守护进程线程时，JVM将退出。所以想象你正在写一个简单的游戏，你的主要方法循环，直到你决定退出。想象一下，在游戏开始的时候，你会开始一个无休止地轮询一些网站来触发警报的线程。当您决定结束游戏时，您希望JVM退出。你不希望无尽的投票，以防止游戏结束。所以你让这个轮询线程成为一个守护线程。当所有“正常”线程终止时，Deamon线程将被JVM自动终止。普通线程永远不会自动终止。您
分布式压测活跃家族性能分布式
1.扩展：启动java项目，nohup生成文件写入项目相关输出信息，包括日志信息。想要看的话可以监听这个文件：tail-f,cat查看文件等。1、做性能测试，为什么要用分布式？1、机器的端口数量有限，在发发起请求的时候，端口不够用，无法发起访问，端口消耗完，解决：增加端口数量，增加机器，分布式压测修改系统参数，端口数量扩大，修改注册表，但是一般不做长链接改为短链接2、分布式原理：1、一台机器主控机
java 定时器需要守护线程_守护线程和定时器迟落有渡 java 定时器需要守护线程
Java中又两种线程：用户线程：普通的线程；守护线程：又可叫做后台线程，如垃圾回收线程。一般是死循环执行，等到所有的用户线程结束，守护线程就结束。如：我们需要每天的00：00就进行数据的备份，这个时候我们就需要一个定时器线程，并且将该定时器线程设置为守护线程。1.守护线程守护线程是一直执行的，即死循环，当用户线程执行完毕时，守护线程也执行完毕。如何设置线程为守护线程？在线程启动前，setDaemo
java 定时器需要守护线程_守护线程定时器泓三宝 java 定时器需要守护线程
守护线程：java语言中线程分为两大类：用户线程守护线程(后台线程)守护线程:其中具有代表性的就是垃圾回收线程守护线程特点：一般守护线程是一个死循环，所有的用户线程只要结束，守护线程自动结束，即使守护线程为死循环主线程main方法是一个用户线程守护线程用在什么地方：每天0点的时候系统自动备份，需要使用到定时器，并且我们可以将定时器设置为守护线程setDaemonpublicclassTest_11
Python实例题：基于 Flask 的在线聊天系统
目录Python实例题题目要求：解题思路：代码实现：Python实例题题目基于Flask的在线聊天系统要求：使用Flask框架构建一个实时在线聊天系统，支持以下功能：用户注册、登录和个人资料管理一对一实时聊天功能群聊功能消息通知和未读消息提示在线用户状态显示使用Flask-SocketIO实现实时通信。使用SQLite数据库存储用户、聊天记录等信息。添加美观的前端界面，支持响应式设计。解题思路：使
xml文件笔记
今天学习了一下xml下面是总结的一些笔记Xml可以用来配置文件xml特点：Xml可以从HTYML中分离数据可以利用xml文件在不兼容的系统之间交换数据Xml数据以纯文本格式存储Xml与其他软硬件的耦合度更低，数据可以被更多的设备利用，还可以将XML文件当作数据源来处理，就像操作数据库一样Xml的格式在xml文件头部要有声明在XML中字母的大小写是敏感的Xml文件中有且只有一个根元素，所有的其他元素
Java面试八股文(2023最新)--Linux面试题月月崽面试 linux 运维服务器
目录1.什么是Linux内核2.Linux的体系结构.4.基本命令5.如何查看最近1000行日志6.如何查端口号是否被占用7.查看当前所有已经使用的端口情况8.什么是硬链接和软链接?1.什么是Linux内核Linux系统的核心是内核,内核控制着计算机系统上的软硬件,在必要时分配硬件,并根据需要执行软件.系统内存管理应用程序管理硬件设备管理文件系统管理2.Linux的体系结构.Linux体系结构可以
Java面试八股文(2023最新)--Redis面试题月月崽面试 java redis 面试
目录1.什么是Redis？2.Redis的优缺点？3.Redis有哪些数据结构？4.Redis的应用场景5.持久化？6.Redis的持久化机制是什么？有什么优缺点？7.Redis的过期删除策略？8.Redis的内存淘汰策略有哪些？9.Redis的事务保证原子性吗，支持回滚吗？10.什么是Redis穿透？10.什么是Redis击穿？11.什么是redis雪崩？12.使用Redis作为缓存，Redis
Cursor 使用教程：Java 单体架构中 AI 规则自定义的 CRUD 开发全流程程序员岳彬全栈开发 java 架构人工智能后端 AI编程 ai
一、Cursor自定义AI规则基础入门1.1什么是Cursor自定义AI规则Cursor是一款强大的AI编程助手，而自定义AI规则是Cursor中用于约束和指导AI行为的配置文件，它允许开发者根据项目的特定需求定制AI的响应方式。这些规则文件本质上是你与AI之间的"协议"，告诉AI你的项目架构、编码规范、技术栈偏好等信息，从而让AI生成更符合你期望的代码和建议。简单来说，Cursor自定义AI规则
oracle操作xml笔记 chushiyunen oracle xml 笔记
文章目录第一个例子EXTRACTVALUE()方法oracle这么成熟的数据库，肯定对xml有很好的支持了。第一个例子创建表：CREATETABLExml_table(idNUMBERPRIMARYKEY,xml_dataXMLType);插入数据：INSERTINTOxml_table(id,xml_data)VALUES(1,XMLType('Value'));查询：SELECTEXTRACT
在 Dify 平台中集成上下文工程技术由数入道人工智能数据库大数据人工智能软件工程 dify
1.提升LLM问答准确率的上下文构建与提示策略大语言模型在开放领域问答中常面临幻觉和知识过时等问题。为提高回答准确率，上下文工程的关键是在提示中注入相关背景知识与指导。具体策略包括：检索增强(RAG)：通过从知识库中检索相关内容并将其纳入提示，可以显著提升回答的准确性和可信度。Dify提供了知识检索节点，支持向量数据库存储外部知识，并将检索结果通过上下文变量注入LLM提示中。例如，在知识库问答应用
Application的onLowMemory从Android API 34开始系统不再触发，从API 35开始废弃 zhangphil Android android
Application的onLowMemory从AndroidAPI34开始系统不再触发，从API35开始废弃Android的Application的onLowMemory()是在ComponentCallbacks定义实现，源代码链接https://android.googlesource.com/platform/frameworks/base/+/master/core/java/andro
MySQL 八股文【持续更新ing】小明铭同学 MySQL mysql 数据库
MySQL八股文【持续更新ing】文章目录MySQL八股文【持续更新ing】前言一、MySQL的存储引擎有哪些？他们之间有什么区别？二、MySQL`InnoDB引擎中`的聚簇索引和非聚簇索引有什么区别？1.InnoDB中的聚簇索引2.InnoDB中的非聚簇索引三、MySQL的索引类型有哪些？四、为什么MySQL选择使用B+树作为索引结构？五、MySQL索引的最左匹配原则是什么？六、MySQL三层B
深度解析：Java内部类与外部类的交互机制 hi星尘 java java 交互开发语言
1.内部类概述在Java中，**内部类（InnerClass）**是定义在另一个类内部的类。根据是否依赖外部类实例，内部类可分为：非静态内部类（成员内部类）：持有外部类的隐式引用，可访问其成员。静态内部类（StaticNestedClass）：不依赖外部类实例，需显式传递引用。局部内部类（LocalClass）：定义在方法或作用域内。匿名内部类（AnonymousClass）：无类名，直接实例化。
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$