爱弹代码的吉他手

PostgreSQL源码学习笔记(6)-查询编译

文章目录

引言(Introduction)
概述
查询分析
- Lex与Yacc
- - Lex
  - Yacc
- 词法和语法分析
- 语义分析
查询重写
- 规则系统
- SELECT/INSERT/UPDATE/DELETE
- - SELECT
  - INSERT/UPDATE/DELETE
- INSTEAD/ALSO
- 规则与触发器
- 规则系统的操作
查询规划
- 总体处理流程
- 预处理
- - 提升子链接与子查询
  - 预处理MIN/MAX聚集函数
  - 预处理表达式
  - 预处理HAVING子句
  - 删除冗余信息
- 生成路径
- - - 路径生成算法
    - 路径生成流程
- 计划生成
- 整理计划树
代价估算
总结
参考资料(References)

引言(Introduction)

查询模块是数据库与用户进行交互的模块，允许用户使用结构化查询语言(SQL)或其它高级语言在高层次上表达查询任务，并将用户的查询命令转化成数据库上的操作序列并执行。这里将查询处理分为查询编译与查询执行两个阶段：

查询编译：根据用户的查询语句生成数据库内部的最优执行计划；
查询执行：根据生成的最优执行计划执行查询过程。

概述

当PG的后台进程Postgres接收到查询命令后，需要先将其传递到查询分析模块，进行词法，语法与语义分析。对于用户的查询命令，比如SELECT，CREATE TABLE以及一些简写的命令如"\dt"，“\d”(这些简单命令会首先被转化为SELECT的语句)，PG需要为其构建一颗原始解析树，然后交给查询重写模块。查询重写模块根据解析树以及一些指定参数执行解析分析以及规则重写得到查询树，最后将查询树输入到计划模块得到计划树。

整个查询编译的函数调用流程如下：

exec_simple_query
    ->pg_parse_query
    	->raw_parser
    ->pg_analyze_and_rewrite
    	->parse_analyze
    	->pg_rewrite_query
    ->pg_plan_queries

查询分析

查询分析是查询编译的第一个模块，包括词法分析，语法分析以及语义分析三部分。PG分别使用Lex与Yacc来完成词法分析与语法分析两个功能。用户输入的SQL命令在函数pg_parse_query中经过词法分析与语法分析得到一颗解析树。出于与用户查询交互的考虑，PG将查询分析的三个阶段分为两个函数进行，其中pg_parse_query函数中仅负责实现词法分析与语法分析两个功能(raw_parse)，而语义分析以及重写部分则由函数pg_analyze_and_rewrite负责。

之所以将语义分析放在另外一个函数进行处理是因为语义分析需要查询系统表，而这个操作是在事务中执行的。我们不希望在输入语句的时候立即执行一个事务，并且在raw_parse阶段已经足够识别事务的控制语句，如BEGIN，COMMIT等，这些命令并不需要开启一个新事务。

Lex与Yacc

Lex与Yacc是词法与语法分析工具，两者相互配合可以生成用于词法分析与语法分析的C语言源代码。Lex的工作是负责识别原始查询语句中出现的模式，比如数字，字符串以及特殊符号，然后将其输出传给Yacc。Yacc则负责识别这些模式的组合。下面将简要介绍这两个工具的原理。

Lex

Lex通过采用正则表达式解析的方法来识别字符串中出现的各种模式，是常用的词法分析工具。使用Lex工具可以将定义了正则表达式匹配规则的Lex文件(后缀名为".l")转化为C语言源代码文件。一个Lex文件分为三段，各段之间使用"%%"分隔：

定义段：包含任意的C语言头文件、符号说明等，这部分会被直接拷贝到生成文件当中；
规则段：正则表达式的匹配规则，每当成功匹配一个模式，就对应其后"{}"中的代码；
代码段：可以是任意的C语言代码，但是必须要调用Lex提供的函数，因为这里是Lex的入口函数，完成实际的分析功能。

%{
// 简单例程，用来识别一个整数
#include 				// 定义段
%}
%%
[ \n \t];						// 规则段
-?[0-9]+{printf("num = %d\n", atoi(yytext));}
%%
main(){							// 代码段
yylex();
}

Yacc

语法分析需要找出输入序列中符合某一给定模式序列的语法结构，比如“主谓宾”是一个句子的模式，语法分析则是找出"他一周打一次乒乓球"中的"他，打，乒乓球"三个元素。Yacc与Lex的工作方式相似，需要将语法的定义以及一些必要的C语言代码写在Yacc文件中(后缀名为".y")，并使用Yacc工具将其转化为C语言源代码。一个Yacc文件同样分为三段，隔断之间使用"%%"分隔：

定义段：可以是C代码，包含头文件以及函数声明，同时也可以定义Yacc的内部标志等；
规则段：语法规则，每当成功匹配一个语法后，就对应其后面"{}“中的代码。其中”$$“标识语法表达式中左边结构的值(类似左值)，而”$1"表示语法表达式右边结构第一个标识符对应的值，以此类推；
代码段：包含C代码，同样地也必须包含一些Yacc函数和Lex传递给Yacc的变量。

%{ // 定义段
#include
#include
#include
%}
%token DIGIT // 数字标识符
%% // 规则段，定义匹配加减乘法的语法规则
line    :expr'\n' { printf("%d\n",$1);return;}
        ;
expr    :expr'+'term { $$=$1+$3;} // 加减表达式，支持递归写法
		|expr'-'term { $$=$1-$3;}
		|term
		;
term	:term'*'factor {$$=$1*$3;}
		|factor
		;
factor	:'('expr')' {$$=$2;} // 识别括号或数字
        |DIGIT
        ;
%%
main(){
    return yyparse(); // 解析输入序列
}
 
int yylex(){
    int c;
    while ((c=getchar())==' ');
    if(isdigit(c)){
        yylval=c-'0';
        return DIGIT;
    }
    return c;
}
int yyerror(char *s){
    fprintf(stderr,"%s\n",s);
    return 1;

词法和语法分析

PG中的词法分析与语法分析分别由Lex与Yacc配合完成，其中Lex使用到的源代码文件为scan.l，而Yacc使用到的源代码则为gram.y，其生成的C语言文件分别为scan.c与gram.c。这些解析器存放在目录src/backend/parser中。一些关键的文件如下表所示：

Source Files	Description
parser.c	词法、语法分析的入口文件，提供raw_parser()接口函数
scansup.c	提供词法分析中需要的文件，包括转义字符处理，大写字符转换为小写字符等函数
scan.l	定义词法结构，用于实现对输入语句关键字的识别。使用Lex编译之后生成scan.c文件
gram.h	定义关键字的数值编号
gram.y	定义语法结构，用于实现对数据语句语法的识别。使用Yacc编译后生成gram.c文件

parser提供raw_parser()接口给上层调用，该函数返回List结构存储的解析树。下面将以SELECT语句为例介绍PG是如何对查询语句进行语法分析并生成分析树的。SELECT语句在文件gram.y的定义为：

SelectStmt: select_no_parens			%prec UMINUS
			| select_with_parens		%prec UMINUS
		;
		
select_with_parens:
			'(' select_no_parens ')'				{ $$ = $2; }
			| '(' select_with_parens ')'			{ $$ = $2; }
		;

可以看到，SelectStmt定义为不带括号(select_no_parens)与带括号(select_with_parens)的SELECT语句，并且带括号的SELECT语句也被定义为不带括号的SELECT语句。因此SELECT最终要处理的是不带括号的SELECT语句，其处理函数在gram.y定义为：

select_no_parens:
			simple_select						{ $$ = $1; } // 简单查询语句
			| select_clause sort_clause	{...} // 排序从句
			|...
		;
		
simple_select:
			SELECT opt_all_clause opt_target_list
			into_clause from_clause where_clause
			group_clause having_clause window_clause {...}
			| SELECT distinct_clause target_list
			into_clause from_clause where_clause
			group_clause having_clause window_clause {...}
			| values_clause							{ $$ = $1; }
			| TABLE relation_expr {...}
			| select_clause UNION set_quantifier select_clause {...}
			| select_clause INTERSECT set_quantifier select_clause {...}
			| select_clause EXCEPT set_quantifier select_clause {...}
		;

在不带括号的SELECT语句被定义为一条简单的SELECT语句(simple_select)，也可以在简单的SELECT语句后面加一些特定的谓语，比如说排序从句sort_clause。SELECT解析中最重要的是simple_select，包含了SELECT语句中可能出现的各种关键字，比如distinct，from，where等。每当成功匹配simple_select中设置的语法规则时，会创建一个SelectStmt结构体，并将句子中各个关键字对应的值赋予结构体当中的相应字段。SelectStmt在文件src/include/nodes/parsenodes.h中定义：

typedef struct SelectStmt{
    Node type;
    /*
	 * These fields are used only in "leaf" SelectStmts.
	 */
	List	   *distinctClause; /* NULL, list of DISTINCT ON exprs, or lcons(NIL,NIL) for all (SELECT DISTINCT) */
	IntoClause *intoClause;		/* target for SELECT INTO, like create table as */
	List	   *targetList;		/* the target list (of ResTarget) */
	List	   *fromClause;		/* the FROM clause */
	Node	   *whereClause;	/* WHERE qualification */
	List	   *groupClause;	/* GROUP BY clauses */
	bool		groupDistinct;	/* Is this GROUP BY DISTINCT? */
	Node	   *havingClause;	/* HAVING conditional-expression */
	List	   *windowClause;	/* WINDOW window_name AS (...), ... */
    
	/*
	 * In a "leaf" node representing a VALUES list, the above fields are all
	 * null, and instead this field is set.  Note that the elements of the
	 * sublists are just expressions, without ResTarget decoration. Also note
	 * that a list element can be DEFAULT (represented as a SetToDefault
	 * node), regardless of the context of the VALUES list. It's up to parse
	 * analysis to reject that where not valid.
	 */
	List	   *valuesLists;	/* untransformed list of expression lists */

	/*
	 * These fields are used in both "leaf" SelectStmts and upper-level
	 * SelectStmts.
	 */
	List	   *sortClause;		/* sort clause (a list of SortBy's) */
	Node	   *limitOffset;	/* # of result tuples to skip */
	Node	   *limitCount;		/* # of result tuples to return */
	LimitOption limitOption;	/* limit type */
	List	   *lockingClause;	/* FOR UPDATE (list of LockingClause's) */
	WithClause *withClause;		/* WITH clause */

	/*
	 * These fields are used only in upper-level SelectStmts.
	 */
	SetOperation op;			/* type of set op */
	bool		all;			/* ALL specified? */
	struct SelectStmt *larg;	/* left child */
	struct SelectStmt *rarg;	/* right child */
}SelectStmt;

在SelectStmt中定义了包含存储各种从句的数据，当查询句子匹配时，SelectStmt中的一些字段会被赋值。下表是SELECT语句中出现的关键字以及其对应的语法结构：

Distinct: opt_distinct_clause

opt_distinct_clause:
			distinct_clause							{ $$ = $1; }
			| opt_all_clause						{ $$ = NIL; }
		;

TargetList: opt_target_list(select中指定的查询字段，可以是*字符)

opt_target_list: target_list						{ $$ = $1; }
			| /* EMPTY */							{ $$ = NIL; }
		;

From: from_list

from_clause:
			FROM from_list							{ $$ = $2; }
			| /*EMPTY*/								{ $$ = NIL; }
		;

Where: where_clause

where_clause:
			WHERE a_expr							{ $$ = $2; }
			| /*EMPTY*/								{ $$ = NULL; }
		;

为什么raw_parser会返回一个List？

因为用户一次输入的命令中可能包含多个SQL语句，因此需要为每个SQL命令都返回一个解析树。

语义分析

语义分析阶段会检查命令中是否存在不符合语义规定的元素，比如说访问的表或字段是否存在，聚集函数(比如说求平均值或者计数)是否能够使用。因此语义分析需要访问到数据库中的系统表，从而获得查询表的OID以及查询字段的属性等。

PG中执行语义分析的入口函数是pg_analyze_and_rewrite，其将词法分析与语法分析处理后得到的parsetree_list中的每棵树都进行语义分析与重写。其中负责语义分析的函数为parse_analyze，该函数对parse_tree进行语法分析并转换为一颗查询树(以Query结点的形式存在)。parse_tree函数中涉及的两个重要的结构体分别为Query和ParseState，其中Query用于存储查询树而ParseState则用于存储语义分析的中间信息，比如是否是子查询，查询涉及的表等。

struct ParseState
{
	ParseState *parentParseState;	/* stack link */
	const char *p_sourcetext;	/* source text, or NULL if not available */
	List	   *p_rtable;		/* range table so far */
	List	   *p_joinexprs;	/* JoinExprs for RTE_JOIN p_rtable entries */
	List	   *p_joinlist;		/* join items so far (will become FromExpr */
    ...
};
typedef struct Query
{
	NodeTag		type;
	CmdType		commandType;	/* select|insert|update|delete|utility */
	QuerySource querySource;	/* where did I come from? */
    ...
} Query;

PG中很多结构体的第一个元素都是NodeType类型的，因此可以通过转换指针为NodeTag*传递参数，从而实现统一的函数操作处理。同时PG中定义了NodeTag的枚举类型，因此可以直接判断转换后指针的取值判断传递参数的类型。多态也是基于这种设计实现的。

parse_tree函数会先生成一个存储中间信息的ParseState结构体，然后调用transformTopLevelStmt函数完成语义分析过程。在transformTopLevelStmt函数中实际完成语义分析的函数是transformStmt，该函数中存在多个以transform为前缀的操作函数，这些函数完成语义分析的实际操作(将解析树转换为查询树Query*)。目前tansformStmt支持多种转换操作，并且一些其中Insert，Delete，Select，Update等的操作都是可以优化的，而一些特殊的操作例如Explain，CreateTable这些则不会被优化。

parse_analyze
    ->transformTopLevelStmt
    	->transformOptionalSelectInto
    		->transformStmt
    			switch(nodeTag(parseTree)){
                        // Optimizable statements
                        case T_InsertStmt: transformInsertStmt(pstate, (InsertStmt *) parseTree); break;
                        case T_DeleteStmt: result = transformDeleteStmt(pstate, (DeleteStmt *) parseTree); break;
                        case T_UpdateStmt: result = transformUpdateStmt(pstate, (UpdateStmt *) parseTree); break;
                        case T_SelectStmt: ... result = transformSelectStmt(pstate, n); break;
                        case T_ReturnStmt: result = transformReturnStmt(pstate, (ReturnStmt *) parseTree); break;
					  case T_PLAssignStmt: result = transformPLAssignStmt(pstate, (PLAssignStmt *) parseTree); break;
                        // Special cases
                        case T_DeclareCursorStmt: result = transformDeclareCursorStmt(pstate, (DeclareCursorStmt *) parseTree); break;
					  case T_ExplainStmt: result = transformExplainStmt(pstate, (ExplainStmt *) parseTree); break;
					  case T_CreateTableAsStmt: result = transformCreateTableAsStmt(pstate, (CreateTableAsStmt *) parseTree); break;
 					  case T_CallStmt: result = transformCallStmt(pstate, (CallStmt *) parseTree); break;
                  }

其中transformSelectStmt()能够将一个SelectStmt结构(在语法分析阶段获得)生成一颗查询树，其主要流程如下：

transformSelectStmt
    ->transformWithClause // handle with clause
    ->transformFromClause // process the from clause
    ->transformTargetList // transform targetlist
    ->markTargetListOrigins // mark column origins
    ->transformWhereClause // transform Where and having clauses
    ->transformSortClause
    ->transformGroupClause
    ...
    ->assign_query_collations // mark all expressions in the given query
    ->parseCheckAggregates	// check aggregate function

可以看到transformSelect函数会逐个分析可能存在的谓语从句，并将分析结果填充到Query结点当中。

查询重写

在完成语义分析得到查询树后，会对查询命令进行重写，比如前面介绍的增删查改，而功能性命令则不会被重写。PG中重写查询重写模块存放在文件夹src/backend/rewrite中。

规则系统

查询重写的核心是重写规则系统，该系统由一系列重写的规则组成。PG将重写规则系统存储在系统表pg_rewrite当中：

Column	Description
oid	规则的oid
rulename	规则名称
ev_class	适用于该规则的表的名称
ev_type	规则适用的事件类型：1为SELECT，2为UPDATE，3为INSERT，4为DELETE
ev_enabled	规则在哪个session_replication_role模块中触发：O为在’origin’与’local’，D为规则被禁用，R为在’replica’，A为总是触发
is_instead	若为true，则该规则是INSTEAD规则
ev_qual	规则动作的条件表达式
ev_action	规则动作的查询树

从上表中可以看出规则与触发器相似，其含有规则触发条件，规则触发场所以及规则触发的动作。实际上，一条规则(pg_rewrite中的一个元组)可以理解为在目标表(ev_class)上执行符合条件(ev_qual)的特定动作(ev_type)时，将用规则动作(ev_action)代替原始的动作或者将规则的动作附加在原始命令之前或之后。

根据pg_rewrite中的字段，可以将规则分为两类：

ev_type：可以分为SELECT，UPDATE，INSERT，DELETE；
is_instead：INSTEAD(true)或ALSO(false)。

创建规则的SQL语句格式如下：

CREATE [ OR REPLACE ] RULE name AS ON event										## 创建或替换规则name，在对表格table_name触发事件event时
    TO table_name [ WHERE condition ]										    ## 执行Do后面的语句
    DO [ ALSO | INSTEAD ] { NOTHING | command | ( command ; command ... ) }

SELECT/INSERT/UPDATE/DELETE

SELECT

SELECT规则中只能有一个动作，而且是不带条件的INSTEAD规则。其执行效果与视图类似，这是因为PG中的视图也是通过规则系统实现的。比如说创建一个视图与创建一个表格和规则的动作是等价的：

CREATE VIEW myview AS SELECT * FROM mytab;
#########################################
CREATE TABLE myview (same column list as mytab);
CREATE RULE "_RETURN" AS ON SELECT TO myview DO INSTEAD								# 对视图的操作实际上转换为对实际表格的操作
    SELECT * FROM mytab;

由于SELECT操作并不会修改数据库中的任何数据，并且如果在pg_rewrite系统表中找到与SELECT语句一致的失手，说明存在一个视图(物化视图或临时视图)可以直接用于生成查询结果。

比如下面一个例子：

创建两个表格与一个视图：

create table test_A(name text, class int);
create table test_B(class int, num int);
create view test_view as select A.name, A.class, B.num from test_A A, test_B B where test_A.class = test_B.class;

对视图执行select操作：
```
select * from test_view;
```

那么该select操作会被词法分析与语法分析解析为：

select test_view.name, test_view.class, test_view.num from test_view;

该解析树经过规则系统被重写后变为：

select A.name, A.class, B.num from test_A A, test_B B where test_A.class = test_B.class;

可以看到，SELECT规则的中原查询树已经被替换成新的查询树。

INSERT/UPDATE/DELETE

这三个规则具有以下特性：

可以拥有零个或多个动作；
可以是INSTEAD(true)或ALSO规则(缺省)；
可以使用伪关系NEW或OLD；
可以使用规则条件；
不会对原查询树进行修改，而会创建零个或多个查询树。

INSTEAD/ALSO

INSTEAD与ALSO规则通过字段is_instead的取值区分：

INSTEAD：is_instead为true。用规则定义的动作代替原来查询树中的事件；
ALSO：is_instead为false。原始查询树与规则动作都会被执行，只不过执行命令的先后不同。当原命令为INSERT时，原始动作在规定动作之前，保证规定动作可以看到原始动作修改之后的状态；当原命令为UPDATE或DELETE时，原始动作在规定动作之后，保证规定动作可以看到原始动作修改之前的状态。

规则与触发器

从例子中可以看到，规则与触发器的工作方式相似，都可以在特定条件下执行原始查询之外的动作，但是二者从本质上还是有所区别。比如触发器是在查询执行的时候执行，而规则则是对查询树进行修改或者生成额外的查询树。另外，规则无法实现外键约束，但是触发器则可以。

规则系统的操作

PG的规则系统提供定义规则，删除规则以及利用规则进行查询重写三个操作：

定义规则：在使用规则系统之前需要先定义规则，规则的定义通过命令CREATE RULE命令来完成，"CREATE RULE"被词法解析与语法解析之后，该规则的相关信息会存储在一个RuleStmt结构当中，最后会调用DefineRule函数完成规则的创建；
删除重写规则：在PG14.0中，删除规则由函数RemoveRewriteRuleById实现，其步骤主要如下：1. 打开pg_rewrite系统表；2. 搜索目标元组；3. 对元组进行上锁；4. 删除目标元组；5. 结束扫描并关闭系统表；
查询树重写：查询树的重写会通过调用函数QueryRewrite来完成，其步骤主要如下：1. 按照规则将原查询树中非SELECT的查询进行重写，得到一个或多个修改的查询树；2. 对得到的查询树分别使用RIR规则进行重写，这部分主要是完成对SELECT规则的重写。

查询规划

在DBMS中，可以通过多种查询途径完成用户的查询命令。虽然这些查询途径产生的查询结果相同，但是不同的查询途径其查询效率是不同的，因此查询规划需要找到其中代价最小的执行方案。

在数据库查询中，最耗时的操作是表连接，因此查询优化的核心思想是"尽可能地先做选择操作，最后再执行表连接操作"，比如说谓语下滑以及WHERE语句合并。PG将需要进行连接操作的表提升到同一个查询层次之后，根据动态规划以及遗传算法选择其中代价最小的连接方案。

BTW，虽然表连接很耗时，但是宁愿进行表连接也不愿进行整张表的遍历，比如说or关键字会被优化成join

总体处理流程

查询规划的总体过程可以分为预处理，生成路径和生成计划三个阶段：

预处理：对查询树进一步改造，在这个过程中最重要的是提升子链接或子查询；
生成路径：根据改进的查询树，使用动态规划或遗传算法生成最优的连接路径和候选的路径链表；
生成计划：根据最优路径，先生成基本计划树(SELECT … FROM … WHERE)，然后添加GROUP BY，HAVING和ORDER BY等子句对应的计划结点形成完成的计划树。

查询规划的入口函数是pg_plan_queries，其负责将查询树链表变成执行计划链表。其调用pg_plan_query对每个查询树都进行处理，并将生成的PlannedStmt结构体组织成链表并返回。PlannedStmt包含了查询一些信息，包括命令类型，是否拥有Returning语句等。

typedef struct PlannedStmt
{
	NodeTag		type;
	CmdType		commandType;	/* select|insert|update|delete|utility */
	uint64		queryId;		/* query identifier (copied from Query) */
	bool		hasReturning;	/* is it insert|update|delete RETURNING? */
	bool		hasModifyingCTE;	/* has insert|update|delete in WITH? */
	...
} PlannedStmt;

在pg_plan_query中负责生成计划的是planner函数，该函数会调用standard_planner进入标准查询规划阶段。这些函数的调用关系如下：

exec_simple_query
    ->pg_plan_queries
    	->pg_plan_query
    		->planner
    			->standard_planner
    				->subquery_planner
    					// 预处理
    					->preprocess_xxx
    					->pull_up_sublinks
    					->pull_up_subqueries
    					// 生成计划树
    					->grouping_planner
    						->query_planner
    			->SS_finalize_plan

查询优化中使用到的几个主要函数以及其作用如下标所示。

Function	Description
planner	优化器的入口函数，输入为经过重写后的查询树，输出最优的计划树
standard_planner	标准的优化器入口
subquery_planner	优化处理的主体函数，可以递归使用
grouping_planner	执行grouping，aggregation相关的规划步骤
query_planner	为查询生成路径
set_plan_reference	完成生成执行计划后的清理工作

预处理

预处理阶段时主要负责消除冗余条件，减少递归层数(通过提升子链接与子查询实现)以及简化路径生成等。

提升子链接与子查询

子查询指在FROM子句中存在的SELECT查询语句，而子链接则是出现在WHERE或HAVING修饰的表达式。PG支持嵌套查询的SQL写法，即FROM子句中可以包含一个SELECT查询语句。原始执行下，会先执行子查询(内部)，再执行父查询。但将子查询提升后，可以与父查询共同优化，从而提高查询的效率。

比如有一个原始查询的SQL语句如下：

select d.name from dept d where d.deptno in (select e.deptno from emp e where e.sal = 1000);

如果按照原始SQL语句生成的计划树进行执行的话，后面子链接会生成一张临时表，然后夫查询遍历每个数据元组的时候都会遍历该临时表，这样查询的效率是十分低下的。因此需要对原始查询的子链接进行提升为子链接：

select d.name from dept d (select e.deptno from emp e where e.sal = 1000) as sub where d.deptno = sub.deptno;

然后提升子查询：

select d.name from dept d, emp e where d.deptno = e.deptno and e.sal = 1000;

可以看到，子链接与子查询的提升是为了将其上升到与父查询拥有相同的优化等级。但是当表格的数量达到一定程度的时候，就不会对子查询或子链接进行优化，因为搜索的表越多，优化搜索的事件也越长。

提升子链接的入口函数是pull_up_sublinks，其内部会调用pull_up_sublinks_jointree_recurse函数递归地处理jointree，然后调用pull_up_sublinks_qual_recurse处理约束条件。

提升子查询的入口函数是pull_up_subqueries，其内部会调用pull_up_subqueries_recurse函数递归地处理子查询。提升子查询分为三种情况处理：

范围表存在子查询。如果是简单的子查询，那么调用函数pull_up_simple_subquery直接提升，而如果是简单的UNION ALL子查询，那么调用pull_up_simple_union_all直接提升；
FROM表达式存在子查询。调用pull_up_subqueries_recurse进行递归处理；
连接表达式中的子查询。调用pull_up_subqueries_recurse进行递归处理。

预处理MIN/MAX聚集函数

在路径生成之前，优化器会先检查查询中是否包含MIN/MAX的聚集函数。如果存在MIN/MAX聚集函数，并且聚集函数中的目标字段存在索引，那么会生成通过索引扫描获得最大值或最小值的路径。该聚集函数必须发生在路径生成之前，因为这阶段会改变解析树，改变的解析树会被路径生成阶段使用。

MIN/MAX聚集函数的预处理发生在preprocess_minmax_aggregates函数中。

预处理表达式

表达式可以是一个目标链表，一个WHERE语句，一个HAVING谓语或者一些其它的东西。在PG中表达式的预处理由函数preprocess_expression完成，其主要完成的工作包括：

用基本关系变量取代连接别名；
对常量表达式进行简化；
对表达式进行规范化；
将子链接转化为子计划，该转换通过函数make_subplan实现。

预处理HAVING子句

对于HAVING子句，如果不含有聚集(交集)，那么将其提升到WHERE条件中，否则将其放到Query的HavingQual字段中。

删除冗余信息

经过前面的预处理后，可能发现存在冗余的关系，比如group关系：

select d.name from dept d where d.deptno in (select e.deptno from emp e where e.sal = 1000 group by e.deptno) group by e.deptno;

生成路径

用户的执行或插入都要从基本表或连接表中获取，连接表可以由多个基本表连接而成，在PG中连接表可以被组成成基本表的二叉树形式，因此路径规划中生成的路径即是找到从一组基本表到最终连接表的方式，并选取其中效率最高的路径(一张基本表也可以构成路径)。生成路径的入口函数是query_planner：

query_planner
    ->setup_simple_rel_arrays // Set up arrays for accessing base relations and AppendRelInfos.
    if single relation // just one relation
        ->build_simple_rel
    ->add_base_rels_to_query
    ->build_base_rel_tlists
    ...
    ->make_one_rel

可以看到，当只有一个基本表时query_planner会直接返回该路径，而当存在多个基本表时，则需要处理基本表的目标字段以及基本表之间的连接关系等。在路径生成中，使用到的关键数据结构是RelOptInfo：

typedef struct RelOptInfo
{
	NodeTag		type;
	RelOptKind	reloptkind;
	/* all relations included in this RelOptInfo */
	Relids		relids;			/* set of base relids (rangetable indexes) */
	/* size estimates generated by planner */
	double		rows;			/* estimated number of result tuples */
	/* default result targetlist for Paths scanning this relation */
	struct PathTarget *reltarget;	/* list of Vars/Exprs, cost, width */
	/* materialization information */
	List	   *pathlist;		/* Path structures */
	List	   *ppilist;		/* ParamPathInfos used in pathlist */
	List	   *partial_pathlist;	/* partial Paths */
	struct Path *cheapest_startup_path;
	struct Path *cheapest_total_path;
	struct Path *cheapest_unique_path;
	List	   *cheapest_parameterized_paths;
	...
	List	   *joininfo;		/* RestrictInfo structures for join clauses
								 * involving this rel */
    ...
} RelOptInfo;

可以看到RelOptInfo中包含所有的基本表，估计生成的元组数量，生成的路径以及最具效率的路径等信息。PG中生成的路径被组织成Path的形式：

typedef struct Path
{
	NodeTag		type;
	NodeTag		pathtype;		/* tag identifying scan/join method */

	RelOptInfo *parent;			/* the relation this path can build */
	PathTarget *pathtarget;		/* list of Vars/Exprs, cost, width */
	...
	double		rows;			/* estimated number of result tuples */
	Cost		startup_cost;	/* cost expended before fetching any tuples */
	Cost		total_cost;		/* total cost (assuming all tuples fetched) */

	List	   *pathkeys;		/* sort ordering of path's output */
	/* pathkeys is a List of PathKey nodes; see above */
} Path;

可以看到，一个Path结构体当中还包含了该路径涉及到的元组数量，以及执行该路径可能消耗的启动代价(startup_cost)总代价(total_cost)。另外，如果有搜索字段存在索引的话，使用索引扫描比顺序扫描会更快。

路径生成算法

由于单个表的访问方式(属于顺序访问、索引访问、TID访问)、两个表的连接方式(循环嵌套连接、归并连接、Hash连接)以及多个表间的连接顺序(左连接，右连接和全连接)都有多种，因此即使是相同的两张基本表，但访问一个最终表的路径都会存在很多种。因此优化器需要考虑所有可能的路径，并选择其中最优的路径来生成执行计划。PG中生成执行计划的算法有动态规划与遗传算法：

动态规划：在PG中，通常是使用动态规划来获得最优路径的，其步骤主要分为三步：1. 初始化，为每个基本表生成访问路径；2. 状态传递，从基本表开始向前生成连接表与计算该连接表路径需要的代价，并保留其中代价评估最优的路径；3. 传递到最后表时，选出其中最优的路径。

连接顺序的不同会导致生成的连接表大小不同，从而导致需要的内存以及CPU时间的不同；连接方式的不同则直接导致了不同的CPU时间。因此在状态传递过程中需要估算每条路径需要的代价，并尽可能地保留其中最优的路径。保留的路径需要满足以下三个条件中的一个：
1. 路径的启动代价最小；
2. 路径的总执行代价最小；
3. 路径的输出排序键。
这分别对应着RelOptInfo中的cheapest_startup_path，cheapest_total_path与cheapest_unique_path。动态规划需要消耗的时间随着连接表的增长而指数增长，因为其需要检查所有可能的路径。
遗传算法：当表格的数量过多时，遍历所有的表需要消耗大量的时间和内存空间。因此，PG提供了遗传算法来减少需要遍历的路径，从而提高查找路径的效率。不过遗传算法只能找到一个准最优的路径。

路径生成流程

路径生成的入口函数是make_one_rel，其会找到所有的路径，然后返回一个代表所有连接关系的RelOptInfo结构，其生成的路径会存储在RelOptInfo结构体当中的pathlist中。make_one_rel的内部调用如下：

make_one_rel
    ->set_base_rel_consider_startup
    ->set_base_rel_sizes
    ->set_base_rel_pathlists // 生成所有基本表的访问路径
    ->make_rel_from_joinlist

PG在生成结果表的访问顺序之前，需要先生成所有基本表的访问路径。而这需要检查基本表是否存在索引，如果存在索引则需要根据索引生成路径；而如果不存在索引，则只能使用TID扫描路径(TID表示元组的物理地址)。

计划生成

在得到最优路径后，规划器会根据该路径生成对应的计划。PG中生成计划的源文件是"src/backend/optimizer/plan/createplan.c"，其提供的入口函数是create_plan，里面包含了顺序扫描，采样扫描，索引扫描，TID扫描等计划的生成。

整理计划树

在计划生成后，还需要对计划树做最后的细节调整，以方便执行器的执行。这部分内容由函数set_plan_references实现，其功能包括：

将各种子查询的范围表折叠成一个链表，同时清除无用的范围表；
调整扫描结点中的值，以适应折叠后的范围表；
将子计划的查询结果输出到父计划节点中；
调整需要部分聚集的聚集函数的计划结点；
使用PARAM_EXEC参数代替PARAM_MULTIEXPR；
使用候选子计划代理一个可选的子计划表达式；
找到每个操作对应的OID；
创建一些可能需要使用的变量，存储在执行过程中的缓冲区中；
赋予每个树节点一个特定的ID。

代价估算

路径的效率与其在执行过程中需要的CPU时间以及磁盘存取非常相关，因此PG在文件"src/backend/optimizer/path/costsize.c"中定义了一些关于磁盘I/O以及CPU的估算代价：

seq_page_cost(1.0)：顺序获取一个磁盘页面的代价
random_page_cost(4.0)：随机获取一个磁盘页面的代价
cpu_tuple_cost(0.01)：CPU处理一个元组的代价
cpu_index_tuple_cost(0.005)：CPU处理一个索引元组的代价
cput_operator_cost(0.0025)：CPU执行一个算子的代价
parallel_tuple_cost(0.1)：CPU将元组从worker传递到后端leader的代价
parallel_setup_cost(1000.0)：CPU设置平行操作中共享内存的代价

一条路径的代价与磁盘中存储的元组数量及元组占用的页数相关，其估计路径代价的步骤主要如下：1. 根据统计信息与查询条件估算本次查询需要的I/O次数以及获取的元组个数，并得到估算的磁盘代价；2. 根据元组数量计算需要的CPU代价；3. 综合考虑磁盘代价与CPU代价

总结

在DBMS中，查询编译是用户与数据库进行交互的桥梁，而查询规划产生的计划效率直接影响数据库的性能。

PG在接收用户的SQL命令时需要经过词法分析，语法分析，然后将生成的解析树交由语义分析以及重写模块(规则系统)进行重写，然后为修改后的查询树生成一个最优的计划树。PG是通过尽可能地遍历所有路径，然后根据其中最好的路径并生成计划树。这部分功能由优化器负责。PG中小规模的优化器使用的是动态规划算法，而大规模的优化则是使用遗传算法。

参考资料(References)

parser-stage

跟我一起读postgresql源码(三)——Rewrite(查询重写模块)

规则系统

跟我一起读postgresql源码(四)——Planer(查询规划模块)(上)

你可能感兴趣的:(postgresql,学习,数据库)

【C#面向对象】第二课——深入C#数据类型、值类型和引用类型的学习逍遥小丸子 C#面向对象 C#数据类型数据类型值类型和引用类型拆箱和装箱枚举
知识点：理解值类型和引用类型的区别、掌握结构类型的定义、掌握拆箱和装箱的概念、掌握使用值类型和引用类型作为方法的参数1、值类型和引用类型我们在前面学习过C#中的常用数据类型，常用的数据类型有：C#中的数据类型说明用法举例
元学习的认知思维棱镜由数入道 AI辅助教学学习元学习思维模型认知框架思维棱镜
在学习这场马拉松中，大多数人只关注如何跑得更快（学习方法），但元学习关注的却是如何学会规划路线、调整呼吸、监测体能，甚至理解身体（大脑）的运作机制，从而跑得更远、更有效率。元学习（Meta-Learning）——“学会学习”的底层操作系统本质：元学习，简而言之，就是我们的大脑如何学习、如何反思学习过程、并如何优化学习策略的能力。它不是学习具体知识，而是学习如何学习知识本身。它好比你手中的智能手机，
时序数据库IoTDB可实现的基本操作及命令汇总时序数据说时序数据库 iotdb 数据库物联网大数据开源
一、数据写入、删除与导出1.1数据写入在物联网场景下，元件产生的数据通常会自动写入。但有时，需要修改过去的数据，可以使用INSERT语句插入修改后的值，覆盖原数据。‌示例‌：INSERTINTOroot.BHSFC.Q1.W003(timestamp,speed)VALUES(1657472400000,2);1.2数据删除1.2.1SQL语句删除‌删除整个时间序列‌：DELETEFROMroot
Linux下基于C++11的socket网络编程（基础版本）吃拉面的小波 C++网络编程 linux 网络 c++
第一：socket的基础知识略，网上有很多这样的知识，我觉得他们应该讲的比我好。我是跟着韩国人尹圣雨写的《TCP/IP网络编程》这本书学的。第二：使用的线程库C++11std::thread在经过自己简单的封装第三：声明因为我也是初学，可能写的不好，封装的也不好，我写这篇文章，只是希望帮助很基础的初学者，慢慢的接触socket，也给自己记录一下学习的经过。所以，如果错误的，或者不好的地方，望各位多
数据库领域下的时序数据库并发控制数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent 数据库时序数据库 ai
时序数据库并发控制：原理、实现与最佳实践关键词：时序数据库、并发控制、MVCC、时间戳排序、乐观并发控制、分布式事务、性能优化摘要：本文深入探讨时序数据库中的并发控制机制，从基本原理到实际实现进行全面剖析。文章首先介绍时序数据库的特点和并发控制挑战，然后详细分析MVCC、时间戳排序等核心算法原理，并通过代码示例展示实现细节。接着探讨分布式环境下的特殊考量，提供性能优化策略和实际应用案例。最后展望未
GORM 更新操作：深入探索 Go 语言中的数据库记录修改 code--cat jvm oracle golang go 数据库
在Go语言的Web开发中，GORM是一个广泛使用的ORM(Object-RelationalMapping)框架。它提供了一种流畅的方式来处理数据库的交互，其中包括记录的更新操作。在本篇博客中，我们将一起探索GORM的更新操作，了解如何使用GORM来修改数据库中的记录。一、基础概念：更新操作的准备在GORM中，更新操作是通过Model接口的Update方法来实现的。这个方法接受一个指针，该指针指向
探索GORM：Go语言中的开发友好型ORM库
探索GORM：Go语言中的开发友好型ORM库gormThefantasticORMlibraryforGolang,aimstobedeveloperfriendly项目地址:https://gitcode.com/gh_mirrors/gor/gorm在Go语言的生态系统中，有一颗璀璨的明星——GORM，为开发者们带来了高效且直观的对象关系映射（ORM）体验。这是一篇专为那些寻求数据库操作简便性
探索Octillery：Go语言中的数据库分片利器余纳娓
探索Octillery：Go语言中的数据库分片利器octilleryGopackageforshardingdatabases(SupportseveryORMorrawSQL)项目地址:https://gitcode.com/gh_mirrors/oc/octillery在现代应用开发中，随着数据量的增长，数据库分片成为了提升性能和扩展性的关键技术。今天，我们将深入介绍一个强大的Go语言库——O
mysql锁机制 weixin_45990219 教程 mysql 数据库
深入解析MySQL锁机制：从原理到实战场景前言在数据库高并发场景中，锁机制是保障数据一致性和事务隔离性的核心。然而，MySQL中锁的类型繁多，概念抽象，容易让人望而生畏。本文将通过通俗的语言和实际场景，带你彻底理解MySQL中的各种锁机制及其应用。一、锁的由来与分类1.1为什么需要锁？多个事务并发执行时，可能出现脏写、脏读、不可重复读、幻读等问题。例如：场景：A事务修改了某条数据但未提交，B事务读
Ubuntu下安装Moodle平台 swy520 ubuntu Moodle ubuntu Moodle
一前言Moodle是一个开源课程管理系统（CMS），也被称为学习管理系统（LMS）或虚拟学习环境（VLE），它通常用来播放符合SCORM标准的课件，但功能远不止课程管理，作业模块等功能。这里主要介绍moodle的安装方法。二安装准备Moodle通常在Linux操作系统上，基于Apache，PostgreSQL/MySQL/MariaDB和PHP进行开发。为了平台的稳定性，我们选择Linux操作系统
FlatBuffers（概念、原理及优势、在TS中的使用）前端杂货铺 TodoList 100个小知识 FlatBuffers JSON 序列化反序列化
个人简介个人主页：前端杂货铺‍♂️学习方向：主攻前端方向，正逐渐往全干发展个人状态：研发工程师，现效力于中国工业软件事业人生格言：积跬步至千里，积小流成江海推荐学习：前端面试宝典100个小功能Vue2Vue3Vue2/3项目实战Node.js实战Three.js个人推广：每篇文章最下方都有加入方式，旨在交流学习&资源分享，快加入进来吧文章目录介绍在Vue中使用FlatBuffersFlatBuff
ros学习之路径规划许卿768503 学习
一、全局路径规划中的地图1、栅格地图（GridMap）2、概率图（CostMap）3、特征地图（FeatureMap4、拓扑地图（TopologicalMap）二、全局路径规划算法1、Dijkstra算法2、最佳路径优先搜索算法（BFS）3、A*搜索算法双向A*搜索算法重复A*搜索算法AnytimeRepairingA*(ARA*)搜索算法实时学习A*搜索（LRTA*）算法实时适应性A*搜索（RT
学而思编程周赛语言普及奠基组 | 2025年春第15周T1 新二进制热爱编程的通信人算法 c++
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
学而思编程周赛语言普及奠基组 | 2025年春第15周T2 散步热爱编程的通信人算法 c++
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
织梦DedeCMS转WordPress asqq8
最近，有个用户找模板兔迁移网站，源站用的dede，需要转成wp，文章数量大概7000-8000篇，其中有个需求是保证旧文章的链接有效，在wp上的新文章与旧文章的链接类型不一样，所以这涉及到伪静态来处理跳转。虽然网上都很多教程，但是在这次导入过程中还是遇到过一些问题。以下教程是dede的数据表得与wp的数据表在同一个数据库下！要是不在，可以将dede_archives先导入到wp的数据库里。一般流程
MySQL5.7评估数据库层binlog过滤写入颖妍--唯爱数据库 mysql
binlog-do-db参数的影响本次测试均为binlog_format=row格式,因为binlog_format=statement格式在复制场景下，对函数和存储过程使用不友好，很容易导致主从数据不一致，生产环境很少有使用statement格式。使用use指定库在test库进行ddl操作和dml操作[root@localhost]15:17:10[test]>flushbinarylogs;Q
React系统学习之路莲华君 react.js 学习前端
React系统学习之路学习目录第1章：React入门介绍React的基本概念和应用场景安装Node.js和npm创建第一个React应用React的JSX语法组件的基本结构和生命周期第2章：组件与状态管理函数组件与类组件的区别状态（State）和属性（Props）的使用受控组件与非受控组件高阶组件（HOC）的概念和实现使用ContextAPI进行跨层级状态传递第3章：ReactHooksuseSt
AI人工智能领域知识图谱在深度学习中的应用拓展
AI人工智能领域知识图谱在深度学习中的应用拓展关键词：知识图谱、深度学习、神经网络、图嵌入、知识表示学习、推理机制、应用场景摘要：本文深入探讨了知识图谱与深度学习的融合应用，系统性地分析了知识图谱在深度学习中的关键技术路径和应用场景。文章首先介绍了知识图谱的基本概念和表示方法，然后详细阐述了知识图谱与深度学习结合的多种技术路线，包括图神经网络、知识嵌入和推理机制等。接着通过具体案例展示了知识图谱增
Python商务数据分析——Matplotlib 数据可视化学习笔记爱吃代码的小皇冠 python numpy matplotlib pandas 学习笔记数据分析
一、Matplotlib基础认知1.1库功能与定位核心作用：将数据可视化展示，提升数据直观性与说服力应用场景：绘制折线图、饼图、柱状图等2D/3D图表双接口模式：MATLAB风格：通过pyplot函数快速绘图（自动管理图形对象）面向对象：显式创建Figure和Axes对象（适合复杂绘图）1.2核心对象架构容器类：图(Figure)、坐标系(Axes)、坐标轴(Axis)、刻度(Tick)基础类：线
深入浅出Node.js后端开发 jghhh01 node.js
让我们来理解Node.js的核心——事件循环和异步编程模型。在Node.js中，所有的I/O操作都是非阻塞的，这意味着当一个请求开始等待I/O操作完成时（如读取文件或数据库操作），Node.js不会阻塞后续操作，而是继续执行其他任务。这种机制大大提高了应用的性能和吞吐量。constfs=require('fs');fs.readFile('file.txt','utf8',(err,data)=>
PCIe学习笔记（26） IC纯小白学习笔记网络
ErrorForwarding（错误转发）错误转发(也称为数据中毒)，通过设置EP位表示。下面是一些使用错误转发的例子:•例#1:从主存读取遇到不可纠正的错误•例#2:PCI写到主存的奇偶校验错误•例#3:内部数据缓冲区或缓存上的数据完整性错误错误转发使用模型•错误转发仅用于读取完成数据，AtomicOp完成数据，AtomicOp请求数据或写数据，从不用于错误在“头”(请求阶段，地址/命令等)的情
SapphireRapids NVMe Aggregate Performance with灵活IO测试--学习笔记（二）向阳生活学习笔记网络
4.主机系统配置由于NVMe控制器使用队列和数据缓冲区，这些队列和数据缓冲区可以托管在主机系统内存空间的任何位置，因此假设主机系统具有足够的内存容量和内存带宽来同时处理多个NVMe访问，以避免受到内存带宽限制。主机系统是Sapphire-Rapid2S系统，每个插槽上配置了8个DDR564GB,1DPC,运行在每个插槽上的速度为4800MTS（例如，共1TB内存容量）。4.1根端口的硬盘数量Sap
equine在神经网络中建立量化不确定性 struggle2025 神经网络人工智能深度学习
一、软件介绍文末提供程序和源码下载众所周知，用于监督标记问题的深度神经网络（DNN）可以在各种学习任务中产生准确的结果。但是，当准确性是唯一目标时，DNN经常会做出过于自信的预测，并且无论测试数据是否属于任何已知标签，它们也总是进行标签预测。EQUINEwascreatedtosimplifytwokindsofuncertaintyquantificationforsupervisedlabel
PMP备考神器:免费刷题小程序推荐才聚PMP 人工智能职场和发展
【PMP考试通】是一款专门为备考PMP的免费刷题小程序。【PMP考试通】涵盖了考试中的所有考点，能帮你顺利通过PMP考试。还有最新的考试咨讯提供给大家，随时了解考试的动态，考试更安心。有两种练习模式，可以实现不同的练习需求。1、考试模式:完全模拟考试，做完之后计算得分，并可以查看相应解析2、练习模式:练习与学习，遇到不能解答的题目时，可以直接查看解析，学习当前知识点3、做题类型:章节练习、每日一练
Linux学习笔记：PCIe内核篇（1）：初始化与枚举流程 ZH_2025 嵌入式协议篇 PCIE
根据system.map查看内核中PCIe加载流程：root@zh-vm:~#cat/boot/System.map-5.15.0-130-generic|greppci|grepinitcallffffffff8350ff68d__initcall__kmod_pci__453_6907_pci_realloc_setup_params0ffffffff83510098d__initcall__
UBOOT学习笔记（六）：UBOOT启动--CPU架构及板级初始化阶段 ZH_2025 uboot &linux启动篇 linux arm
3.1、_mainENTRY(_main)#ifdefined(CONFIG_TPL_BUILD)&&defined(CONFIG_TPL_NEEDS_SEPARATE_STACK)ldrr0,=(CONFIG_TPL_STACK)/*TPL（三级引导）使用独立栈*/#elifdefined(CONFIG_SPL_BUILD)&&defined(CONFIG_SPL_STACK)ldrr0,=(C
数据库设计三范式详解与注意事项步行cgn 数据库数据库 oracle 服务器
数据库设计三范式详解与注意事项数据库设计三范式（NormalForms）是关系型数据库设计的核心理论，用于减少数据冗余、提高数据一致性和完整性。下面我将详细解释三范式的概念、应用场景和实际注意事项。一、三范式核心概念1.第一范式(1NF)：原子性定义：每个列都是不可再分的原子值每行有唯一标识（主键）示例：--不符合1NFCREATETABLEorders(order_idINTPRIMARYKEY
数据库 DML 语句详解：语法与注意事项步行cgn 数据库数据库 oracle
数据库DML语句详解：语法与注意事项DML（DataManipulationLanguage，数据操作语言）用于操作数据库中的数据，主要包括SELECT、INSERT、UPDATE、DELETE等语句。下面我将详细说明每种操作的语法、使用场景和关键注意事项。一、SELECT查询语句基本语法SELECT[DISTINCT]column1,column2,...FROMtable_name[WHERE
数据库级联操作详解：级联删除、更新与置空步行cgn 数据库数据库 oracle sql
数据库级联操作详解：级联删除、更新与置空在数据库设计中，级联操作（CASCADE）是管理关联数据的关键机制，它能自动处理主表与从表之间的数据一致性。下面详细介绍级联删除、更新和置空的语法、使用场景及注意事项。一、级联操作语法1.级联删除（ONDELETECASCADE）--创建表时定义CREATETABLEorders(order_idINTPRIMARYKEY,customer_idINT,FO
一个 new 操作耗时1秒？用原型模式，性能提升100倍！ java干货 Spring boot 原型模式
你是否也曾深陷在对象创建的性能泥潭，当new一个对象的成本极其高昂（例如，需要复杂的数据库查询、网络IO或大量计算），导致你的SpringBoot应用响应缓慢，资源消耗巨大？是时候用原型设计模式(PrototypeDesignPattern)来解脱了！这是一种创建型设计模式，它允许你通过复制现有的实例来创建新的对象，而不是从头开始创建，从而大幅提升性能和灵活性。在SpringBoot中，这个模式的
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。