blesslyy

Postgresql-xl 调研

来历

这个项目的背后是一家叫做stormDB的公司。整个代买基于postgres-xc。开源版本应该是stormdb的一个分支。

In 2010, NTT's Open Source Software Center approached EnterpriseDB to
build off of NTT OSSC's experience with a project called RitaDB and
EnterpriseDB's experience with a project called GridSQL, and the
result was a new project, Postgres-XC.

In 2012, a company called StormDB was formed with some of the original
key Postgres-XC developers. StormDB added enhancements, including MPP
parallelism for performance and multi-tenant security.

In 2013, TransLattice acquired StormDB, and in 2014, open sourced it
as Postgres-XL.

个人观感

纯个人理解，不代表是正确的，如果理解有偏差，抱歉

代码的整体质量不错，大部分的改动都有注释，注释可读性也很好，个别注释时效性有问题，但不影响理解代码。所有在pg代码中的改动都用idef做了有效隔离。理论上跟上PG的升级问题不大
postgresql xc修改了一些postgresql的代码，postgresql xl又把他们改了过来，然后又加了好多代码。注意区分#idef和#ifndef
Postgresql-xc的原则是能下推到dataNode的就下推到dataNode，实在推不下去的就把所有的数据集中在在聚集节点做。而xl做了MPP。

分布式架构

Postgresql-xl的官方主页在。注意这个网站引用的googleapi的某些资源，所以有时候比较慢。注意OLAP是排在OLTP的前面。

Features

Fully ACID
Open Source
Cluster-wide Consistency
Multi-tenant Security
PostgreSQL-based

Workloads:

OLAP with MPP Parallelism
Online Transaction Processing
Mixed
Operational Data Store
Key-value including JSON

首先请仔细读官方overview，这篇review中概要地描述了整个系统的大概的状况。注意这个架构中dataNode和coordinators都可以部署多个，GTM（global Transcation Manager)只有一个，图中画了两个的原因是有一个是standby。

和Postgresql-xc的关系

这个问题官方的答案是

Q. How does Postgres-XL relate to Postgres-XC and Stado?
The project includes architects and developers who previously worked
on both Postgres-XC and Stado, and Postgres-XL contains code from
Postgres-XC. The Postgres-XL project has its own philosophy and
approach. Postgres-XL values stability, correctness and performance
over new functionality. The Postgres-XL project ultimately strives to
track and merge in code from PostgreSQL. Postgres-XL adds some
significant performance improvements like MPP parallelism and replan
avoidance on the data nodes that are not part of Postgres-XC.
Postgres-XC currently focuses on OLTP workloads. Postgres-XL is more
flexible in terms of the types of workloads it can handle including
Big Data processing thanks to its parallelism. Additionally,
Postgres-XL is more secure for multi-tenant environments. The
Postgres-XL community is also very open and welcoming to those who
wish to become more involved and contribute, whether on the mailing
lists, participating in developer meetings, or meeting in person.
Users will help drive development priorities and the project roadmap.

实际上在Postgresql-xl的src中包含的一个文件夹就叫pgxc。由于代码是基于pgxc的，所以大量的注释和代码都是pgxc的。

xl和xc最大的不同在于：xc的逻辑是如果SQL可以下推到datanode上做，那么就下推，否则把所有数据读到coordinator上面统一做。而xl则是真正意义上MPP。

代码改动方法和实现

相对于postgresql来说，在pgxl的基本逻辑是尽量少的修改代码，某些核心组件必须要做出调整，但是大部分保持一致，新增的文件都放在新的位置。
他们做的比较好的一点是，所有的改动地方都用ifdef处理过了。

#ifdef PGXC (PG-xc的改动)
#ifndef XCP（PG-xl基于xc的改动）
....
#endif
#endif

GTM

GTM stands for Global Transaction Manager. It provides global
transaction ID and snapshot to each transaction in Postgres-XL
database cluster. It also provide several global value such as
sequence and global timestamp.

GTM itself can be configured as a backup of other GTM as GTM-Standby
so that GTM can continue to run even if main GTM fails. You may want
to install GTM-Standby to separate server.

从代码(src/gtm)上看，这部分主要功能就是提供global的事务管理，给出global_txn_id和timestamp等等，考虑到这是一个单点，standby的相关代码也在这一部分。

snapshot

/*
 * Get snapshot for the given transactions. If this is the first call in the
 * transaction, a fresh snapshot is taken and returned back. For a serializable
 * transaction, repeated calls to the function will return the same snapshot.
 * For a read-committed transaction, fresh snapshot is taken every time and
 * returned to the caller.
 *
 * The returned snapshot includes xmin (lowest still-running xact ID),
 * xmax (highest completed xact ID + 1), and a list of running xact IDs
 * in the range xmin <= xid < xmax.  It is used as follows:
 *		All xact IDs < xmin are considered finished.
 *		All xact IDs >= xmax are considered still running.
 *		For an xact ID xmin <= xid < xmax, consult list to see whether
 *		it is considered running or not.
 * This ensures that the set of transactions seen as "running" by the
 * current xact will not change after it takes the snapshot.
 *
 * All running top-level XIDs are included in the snapshot.
 *
 * We also update the following global variables:
 *		RecentGlobalXmin: the global xmin (oldest TransactionXmin across all
 *			running transactions
 *
 * Note: this function should probably not be called with an argument that's
 * not statically allocated (see xip allocation below).
 */
GTM_Snapshot
GTM_GetTransactionSnapshot(GTM_TransactionHandle handle[], int txn_count, int *status)

snapshot的重要功能就是，在各个节点之间同步事务的提交状态。

GTM-Proxy

Because GTM has to take care of each transaction, it has to read and write enormous amount of messages which may restrict Postgres-XL scalability. GTM-Proxy is a proxy of GTM feature which groups requests and response to reduce network read/write by GTM. Distributing one snapshot to multiple transactions also contributes to reduce GTM network workload.

Coordinator

The Coordinator is an entry point to Postgres-XL from applications.
You can run more than one Coordinator simultaneously in the cluster.
Each Coordinator behaves just as a PostgreSQL database server, while
all the Coordinators handles transactions in harmonized way so that
any transaction coming into one Coordinator is protected against any
other transactions coming into others. Updates by a transaction is
visible immediately to others running in other Coordinators. To
simplify the load balance of Coordinators and Datanodes, as mentioned
below, it is highly advised to install same number of Coordinator and
Datanode in a server.

代码基本在 src/backend/pgxc。

Datanode

The Datanode is very close to PostgreSQL itself because it just handles incoming statements locally.

The Coordinator and Datanode shares the same binary but their behavior is a little different. The Coordinator decomposes incoming statements into those handled by Datanodes. If necessary, the Coordinator materializes response from Datanodes to calculate final response to applications.

实现查询优化的方法

DDL的处理

增加了一个叫做STORM_CATALOG_NAMESPACE的namespace，新增的系统表什么的都在这个namespace里。对于DDL语句来说，基本上就是发命令转发到所有的DataNode和Coodinator上面去，具体的代码，具体逻辑参见函数

/*
 * Execute utility statement on multiple Datanodes
 * It does approximately the same as
 *
 * RemoteQueryState *state = ExecInitRemoteQuery(plan, estate, flags);
 * Assert(TupIsNull(ExecRemoteQuery(state));
 * ExecEndRemoteQuery(state)
 *
 * But does not need an Estate instance and does not do some unnecessary work,
 * like allocating tuple slots.
 */
void
ExecRemoteUtility(RemoteQuery *node)

directStmt

所谓directStmt是这样的stmt：

Synopsis
EXECUTE DIRECT ON ( nodename [, ... ] )
    query
    
Examples
Select some data in a given table tenk1 on remote Datanode named dn1:

EXECUTE DIRECT ON NODE dn1 'SELECT * FROM tenk1 WHERE col_char = ''foo''';
Select local timestamp of a remote node named coord2:

EXECUTE DIRECT ON coord2 'select clock_timestamp()';
Select list of tables of a remote node named dn50:

EXECUTE DIRECT ON dn50 'select tablename from pg_tables';

详细说明见：http://files.postgres-xl.org/documentation/sql-executedirect.html
实际上在standard_planner(Query *parse, int cursorOptions, ParamListInfo boundParams)中对directStmt是这么判断的：

/*
 * pgxc_direct_planner
 * The routine tries to see if the statement can be completely evaluated on the
 * datanodes. In such cases coordinator is not needed to evaluate the statement,
 * and just acts as a proxy. A statement can be completely shipped to the remote
 * node if every row of the result can be evaluated on a single datanode.
 * For example:
 *
 * Only EXECUTE DIRECT statements are sent directly as of now
 */
#ifdef XCP
	if (IS_PGXC_COORDINATOR && !IsConnFromCoord() && parse->utilityStmt &&
			IsA(parse->utilityStmt, RemoteQuery))
		return pgxc_direct_planner(parse, cursorOptions, boundParams);
#endif

简单说就是直接发SQL发到指定的节点。

非directStmt

对于不是directStmt的查询来说，情况会变得比较复杂，可能每个节点只完成一部分的运算，而这次预算的结果又是另外一个或多个节点运算的输入。

有效的划分子查询。主要是生产plan时的工作。
下发子查询，子查询完成后把结果分发给需要的节点。主要是执行阶段的工作。

Parse/resolve

在这个阶段，最重要的事情发生在preprocess_targetlist(PlannerInfo *root, List *tlist)当中，中间用#ifdef XCP包围的代码就是表示xl需要data node分布的代码，这里面会写两个关键的变量distribution->nodes（这个表涉及到的节点）和distribution->restrictNodes（在insert和update中可以根据主键过滤掉部分节点）

生成plan

下面的函数会生成一个RemoteSubPlan，它和PG原有的plan是一样的，只不过它在执行的时候是读取从网络（而不是内存或磁盘）得到的中间结果。在makeplan的时候，需要计算源分布，结果分布和排序。
对于不同的操作join，scan，group by都有着不同的分布方式。不过得到的plan是一致的。

/*
 * make_remotesubplan
 * 	Create a RemoteSubplan node to execute subplan on remote nodes.
 *  leftree - the subplan which we want to push down to remote node.
 *  resultDistribution - the distribution of the remote result. May be NULL -
 * results are coming to the invoking node
 *  execDistribution - determines how source data of the subplan are
 * distributed, where we should send the subplan and how combine results.
 *	pathkeys - the remote subplan is sorted according to these keys, executor
 * 		should perform merge sort of incoming tuples
 */
RemoteSubplan *
make_remotesubplan(PlannerInfo *root,
				   Plan *lefttree,
				   Distribution *resultDistribution,
				   Distribution *execDistribution,
				   List *pathkeys)

重分布数据

/*
 * Set a RemoteSubPath on top of the specified node and set specified
 * distribution to it
 */
static Path *
redistribute_path(Path *subpath, char distributionType,
				  Bitmapset *nodes, Bitmapset *restrictNodes,
				  Node* distributionExpr)

SCAN

/*
 * set_scanpath_distribution
 *	  Assign distribution to the path which is a base relation scan.
 */
static void
set_scanpath_distribution(PlannerInfo *root, RelOptInfo *rel, Path *pathnode)

JOIN

在create_xxxjoin_path中都会调用set_joinpath_distribution来生成join的分布方式。

/*
 * Analyze join parameters and set distribution of the join node.
 * If there are possible alternate distributions the respective pathes are
 * returned as a list so caller can cost all of them and choose cheapest to
 * continue.
 */
static List *
set_joinpath_distribution(PlannerInfo *root, JoinPath *pathnode)
下面这些情况是可以不重分布数据搞定的：
	/*
	 * If both subpaths are distributed by replication, the resulting
	 * distribution will be replicated on smallest common set of nodes.
	 * Catalog tables are the same on all nodes, so treat them as replicated
	 * on all nodes.
	 */
	/*
	 * Check if we have inner replicated
	 * The "both replicated" case is already checked, so if innerd
	 * is replicated, then outerd is not replicated and it is not NULL.
	 * This case is not acceptable for some join types. If outer relation is
	 * nullable data nodes will produce joined rows with NULLs for cases when
	 * matching row exists, but on other data node.
	 */
	 	/*
	 * Check if we have outer replicated
	 * The "both replicated" case is already checked, so if outerd
	 * is replicated, then innerd is not replicated and it is not NULL.
	 * This case is not acceptable for some join types. If inner relation is
	 * nullable data nodes will produce joined rows with NULLs for cases when
	 * matching row exists, but on other data node.
	 */
	 /*
	 * This join is still allowed if inner and outer paths have
	 * equivalent distribution and joined along the distribution keys.
	 */
	/*
	 * Build cartesian product, if no hasheable restrictions is found.
	 * Perform coordinator join in such cases. If this join would be a part of
     * larger join, it will be handled as replicated.
	 * To do that leave join distribution NULL and place a RemoteSubPath node on
	 * top of each subpath to provide access to joined result sets.
	 * Do not redistribute pathes that already have NULL distribution, this is
	 * possible if performing outer join on a coordinator and a datanode
	 * relations.
	 */

GROUP BY

和join，group by的做法类似

/*
 * Grouping preserves distribution if distribution key is the
 * first grouping key or if distribution is replicated.
 * In these cases aggregation is fully pushed down to nodes.
 * Otherwise we need 2-phase aggregation so put remote subplan
 * on top of the result_plan. When adding result agg on top of
 * RemoteSubplan first aggregation phase will be pushed down
 * automatically.
 */
static Plan *
grouping_distribution(PlannerInfo *root, Plan *plan,
					  int numGroupCols, AttrNumber *groupColIdx,
					  List *current_pathkeys, Distribution **distribution)

实现查询执行的方法

ExecutorStart

#ifdef PGXC
		case T_RemoteQuery:
			result = (PlanState *) ExecInitRemoteQuery((RemoteQuery *) node,
													    estate, eflags);
			break;
#endif

#ifdef XCP
		case T_RemoteSubplan:
			result = (PlanState *) ExecInitRemoteSubplan((RemoteSubplan *) node,
													     estate, eflags);
			break;
#endif /* XCP */

ExecutorRun

主要是通过，下面两个函数来完成的，分别处理query和subplan。

#ifdef PGXC
		case T_RemoteQueryState:
			result = ExecRemoteQuery((RemoteQueryState *) node);
			break;
#endif
#ifdef XCP
		case T_RemoteSubplanState:
			result = ExecRemoteSubplan((RemoteSubplanState *) node);
			break;
#endif /* XCP */

数据交换

pgxl的数据交换方式是通过这样的方式完成：

节点完成局部结果之后，把结果持续不断的写入叫做的ShareQueue结果，这是一个生产者（局部计算得到的结果）消费者（目标的节点，也就是需要distribute的结果）模型。
一个节点的输入可能来自多个节点的，循环读取结果即可。
如果需要的话，用Combiner完成排序。

上述ShareQueue每个dataNode上各有一个。

数据分布方式

/*----------
 * DistributionType - how to distribute the data
 *
 *----------
 */
typedef enum DistributionType
{
	DISTTYPE_REPLICATION,			/* Replicated */
	DISTTYPE_HASH,				/* Hash partitioned */
	DISTTYPE_ROUNDROBIN,			/* Round Robin */
	DISTTYPE_MODULO				/* Modulo partitioned */
} DistributionType;

DISTRIBUTE BY Note: The following description applies only to
Postgres-XL

This clause specifies how the table is distributed or replicated among
Datanodes.

REPLICATION Each row of the table will be replicated to all the
Datanode of the Postgres-XL database cluster.

ROUNDROBIN Each row of the table will be placed in one of the
Datanodes in a round-robin manner. The value of the row will not be
needed to determine what Datanode to go.

HASH ( column_name ) Each row of the table will be placed based on the
hash value of the specified column. Following type is allowed as
distribution column: INT8, INT2, OID, INT4, BOOL, INT2VECTOR,
OIDVECTOR, CHAR, NAME, TEXT, BPCHAR, BYTEA, VARCHAR, FLOAT4, FLOAT8,
NUMERIC, CASH, ABSTIME, RELTIME, DATE, TIME, TIMESTAMP, TIMESTAMPTZ,
INTERVAL, and TIMETZ.

Please note that floating point is not allowed as a basis of the
distribution column.

MODULO ( column_name ) Each row of the table will be placed based on
the modulo of the specified column. Following type is allowed as
distribution column: INT8, INT2, OID, INT4, BOOL, INT2VECTOR,
OIDVECTOR, CHAR, NAME, TEXT, BPCHAR, BYTEA, VARCHAR, FLOAT4, FLOAT8,
NUMERIC, CASH, ABSTIME, RELTIME, DATE, TIME, TIMESTAMP, TIMESTAMPTZ,
INTERVAL, and TIMETZ.

Please note that floating point is not allowed as a basis of the
distribution column.

If DISTRIBUTE BY is not specified, columns with UNIQUE constraint will
be chosen as the distribution key. If no such column is specified,
distribution column is the first eligible column in the definition. If
no such column is found, then the table will be distributed by
ROUNDROBIN.

事务处理

算法就是两阶段提交，显然并不是所有的操作都需要两阶段提交的。触发两阶段提交的条件

/*
 * Returns true if 2PC is required for consistent commit: if there was write
 * activity on two or more nodes within current transaction.
 */
bool
IsTwoPhaseCommitRequired(bool localWrite)

关于两阶段提交，这里不赘述，下面这段注释来自postgresql-xc。不过xl应该也是类似的逻辑，相关的代码，一方面在backend/pgxc/pool里，另一方面在PG正常的事务处理中。

/*
 * Do pre-commit processing for remote nodes which includes Datanodes and
 * Coordinators. If more than one nodes are involved in the transaction write
 * activity, then we must run 2PC. For 2PC, we do the following steps:
 *
 *  1. PREPARE the transaction locally if the local node is involved in the
 *     transaction. If local node is not involved, skip this step and go to the
 *     next step
 *  2. PREPARE the transaction on all the remote nodes. If any node fails to
 *     PREPARE, directly go to step 6
 *  3. Now that all the involved nodes are PREPAREd, we can commit the
 *     transaction. We first inform the GTM that the transaction is fully
 *     PREPARED and also supply the list of the nodes involved in the
 *     transaction
 *  4. COMMIT PREPARED the transaction on all the remotes nodes and then
 *     finally COMMIT PREPARED on the local node if its involved in the
 *     transaction and start a new transaction so that normal commit processing
 *     works unchanged. Go to step 5.
 *  5. Return and let the normal commit processing resume
 *  6. Abort by ereporting the error and let normal abort-processing take
 *     charge.
 */

杂项

barrier

CREATE BARRIER
Name

CREATE BARRIER -- create a new barrier
Synopsis

CREATE BARRIER barrier_name
Description

Note: The following description applies only to Postgres-XL

CREATE BARRIER is new SQL command specific to Postgres-XL that creates a new XLOG record on each node of the cluster consistently. Essentially a barrier is a consistent point in the cluster that you can recover to. Note that these are currently created manually, not autoatically. Without barriers, if you recover an individual component, it may be possible that it is not consistent with the other nodes depending on when it was committed.

A barrier is created via a 2PC-like mechanism from a remote Coordinator in 3 phases with a prepare, execute and ending phases. A new recovery parameter called recovery_target_barrier has been added in recovery.conf. In order to perform a complete PITR recovery, it is necessary to set recovery_target_barrier to the value of a barrier already created. Then distribute recovery.conf to each data folder of each node, and then to restart the nodes one by one.

The default barrier name is dummy_barrier_id. It is used when no barrier name is specified when using CREATE BARRIER.

pause\unpause

pause

PAUSE CLUSTER Name

PAUSE CLUSTER -- pause the Postgres-XL cluster Synopsis

PAUSE CLUSTER Description

Note: The following description applies only to Postgres-XL

PAUSE CLUSTER is a SQL command specific to Postgres-XL that pauses
cluster operation.

Pause blocks any new transactions from starting and waits until
existing transactions complete, then returns. Existing sessions are
still connected to Coordinators, it is just that any new statements
will be held up and not be executed.

The session that paused the cluster can perform tasks exclusively on
the cluster. This is useful for maintenance tasks to resolve a
problem, restart a Datanode, manually failover a Datanode, etc.
Applications will not receive error messages unless they themselves
timeout, statement execution will just be briefly suspended.

Once the DBA has completed whatever tasks were needed, the command
UNPAUSE CLUSTER can be used.

Compatibility

PAUSE CLUSTER does not conform to the SQL standards, it is a
Postgres-XL specific command.

unpause

UNPAUSE CLUSTER Name

UNPAUSE CLUSTER -- unpause the Postgres-XL cluster Synopsis

UNPAUSE CLUSTER Description

Note: The following description applies only to Postgres-XL

UNPAUSE CLUSTER is a SQL command specific to Postgres-XL that unpauses
cluster operation.

If the DBA previously paused the cluster via the command PAUSE
CLUSTER, the DBA can resume operation vi UNPAUSE CLUSTER.

Compatibility

UNPAUSE CLUSTER does not conform to the SQL standards, it is a
Postgres-XL specific command.

微博文本挖掘并生成词云图（亲身经历~超级小白教程）吟游诗人理智鱼技能 python visual studio pycharm 爬虫数据挖掘数据可视化
在参与正大杯市场调研大赛的准备过程中，我被分配到了文本挖掘及后续可视化的工作任务，其中就包括爬取微博博文内容数据、以及将内容可视化（生成云图）接下来我将以生成词云图为目标，介绍实现方法以及煮波的一些心路历程。一、微博数据爬取（另外介绍）二、生成词云图从微博爬取的数据会以csv的格式存放在项目文件中，目前我采用的方法是将csv文件转为excel，再对excel中的文本进行词频统计，从而生成词云图，将
【RPC方案调研】Grpc 嵌入式移植流程背着书包狂奔架构设计 c++软件架构师
由于项目需求，准备在嵌入式上使用rpc方案，调研了多个方案，最终由于Grpc和protobuf天然的亲和性，决定对Grpc进行移植。Grpc地址：https://github.com/grpc/grpcGrpc的交叉编译支持三种方式：bazel，cmake，makefile；bazel由于编译太麻烦，主要适合google内部，直接放弃了，本文主要讲解基于cmake的交叉编译方式，makefile也
企业架构业务流程设计五步法公众号：优享智库数字化转型数据治理主数据数据仓库架构
企业架构业务流程设计五步法企业架构与业务流程概述企业架构定义及重要性业务流程概念及作用企业架构与业务流程关系第一步：明确战略目标与需求确定企业战略目标分析业务需求及痛点制定项目目标与计划第二步：梳理现有业务流程调研现有业务流程情况识别关键业务环节及问题评估现有流程效率与效果第三步：设计优化方案与实施路径制定优化策略及原则设计新业务流程框架图规划实施步骤与时间表第四步：落地实施与持续改进搭建支持新流
java合并word mischen520 word合并 java项目实战 java word
最近在做一个需求，主要是将多个word合并输出为一个word，经过调研，代码如下所示：1.导入pom.xmlorg.apache.poipoi-ooxml4.1.22.测试类：packagecom.common.utils;importorg.apache.poi.openxml4j.opc.OPCPackage;importorg.apache.poi.openxml4j.util.ZipSec
2012广东工业大学毕业论文撰写与答辩指南永不放弃yes
本文还有配套的精品资源，点击获取简介：《2012毕业论文手册》是广东工业大学提供的毕业生论文写作与答辩的综合指导手册。它涵盖了从选题到答辩的完整流程，强调研究能力与学术水平的重要性。手册详细介绍了毕业设计的目的、意义，选题与开题报告的撰写，文献调研与引用的规范，研究方法与实验设计的科学性，论文的结构与撰写技巧，以及论文评审与答辩的准备策略。此外，它还提醒学生注意学术诚信与道德规范。通过这份手册，学
精准洞察：B端产品业务调研的实战策略团队协作
B端产品做好业务调研是一个系统而细致的过程，它涉及多个步骤和关键点，以确保能够深入理解业务场景、明确用户需求，并为后续的产品设计和开发提供坚实的基础。以下是一些关键步骤和策略：一、明确调研目标在开始调研之前，首先要明确调研的目标。这有助于确保调研的方向性和可执行性。调研目标可能包括了解整体业务情况、深入挖掘具体业务问题、验证产品方案等。二、确定调研对象和形式调研对象：○内部人员：如一线业务人员、项
华为OD机试 - 人数最多的站点（Python/JS/C/C++ 2024 E卷 100分）哪吒华为od python javascript
一、题目描述公园园区提供小火车单向通行，从园区站点编号最小到最大通行（如1→2→3→4→1），然后供员工在各个办公园区穿梭。通过对公司N个员工调研统计到每个员工的坐车区间，包含前后站点，请设计一个程序计算出小火车在哪个园区站点时人数最多。二、输入描述第1行：为调研员工人数。第2行开始：为每个员工的上车站点和下车站点。使用数字代表每个园区且为整数分割，如3表示从第3个园区上车，在第5个园区下车。三、
外贸客户开发指南：如何高效拓展海外市场？
在全球化经济的浪潮中，外贸企业面临着巨大的机遇和挑战。为了在竞争激烈的国际市场中脱颖而出，企业不仅需要了解目标市场的特点，还需要掌握高效的客户开发策略。本文将从市场调研与分析、客户沟通与关系维护、客户信息数字化管理、安全交易保障以及持续的客户关系维护五个方面，探讨如何利用ZohoBooks等工具来助力外贸企业高效拓展海外市场。一、市场调研与分析成功的市场进入始于详尽的研究。企业应首先研究目标市场的
Python爬虫：从入门到实践来恩1003 Python爬虫 python 爬虫开发语言
Python爬虫学习资料Python爬虫学习资料Python爬虫学习资料在当今数字化信息爆炸的时代，数据已成为企业和个人发展的重要资产。Python爬虫作为一种高效获取网络数据的工具，正逐渐被广大开发者所熟知和应用。无论是市场调研、学术研究，还是数据分析，Python爬虫都能发挥巨大作用。本文将带你从基础概念出发，逐步深入到爬虫的实战应用，助你掌握这一强大的数据获取技能。一、爬虫基础：开启数据获取
华为OD机试E卷 --贪心歌手--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述一个歌手准备从A城去B城参加演出。按照合同，他必须在T天内赶到歌手途经N座城市歌手不能往回走每两座城市之间需要的天数都可以提前获知。歌手在每座城市都可以在路边卖唱赚钱。经过调研，歌手提前获知了每座城市卖唱的收入预期：如果在一座城市第一天卖唱可以赚M，后续每天的收入会减少D（第
国内验签数据不出境的SSL证书怎么申请 ssl证书https运维
申请国内验签且确保数据不出境的SSL证书指南在数字化时代，数据安全和隐私保护至关重要。对于在中国运营的网站或服务，确保SSL证书的申请和验证过程中数据不出境，是维护国家信息安全和用户隐私的重要一环。以下是一份详细的指南，帮助您申请国内验签且数据不出境的SSL证书。一、选择可信赖的国内CA机构调研与选择：首先，对国内外的CA（证书颁发机构）进行调研，选择一家信誉良好、技术成熟且符合国内法律法规要求的
Go 语言 JSON 与 Cache 库调研与选型 gojson缓存
JSON基本上从以下两种角度进行分析性能方面，如是否使用反射；是否支持Unmarshal到map或struct，未涉及灵活性与扩展性方面，下面报告中只考虑最简单的反序列化，不会提及每个库的灵活性，如提供的一些定制化抽取的API；相关库GO1.14标准库JSON大量使用反射获取值，首先go的反射本身性能较差，其次频繁分配对象，也会带来内存分配和GC的开销；valyala/fastjsonstar:1
山东大学小树林支教调研团青青仓木队——翟晓楠山东大学青青仓木队
过了半年，又一次启程，又一次回到支教的初心之地。比起上一次的试探与不安，我更多了一丝稳重与熟练。心境、处境也都随着半个学期的过去而变得不同，半个学期中，身体上的，心理上的，太多的逆境让我变得步履维艰，曲曲折折，弯弯绕绕，我仿佛打不起精神，没有胃口，没有动力。感觉走的不顺畅的时候，支教这个旅程，给了我力量。自告奋勇承担起队长这一职务的我，从组织时的复杂和困难的经历，协调各种问题，从无到有，和校长和队
把握“三度”打造“三有”干部队伍辛德瑞拉卡卡卡
“胜败兴亡之分，不得不归咎于人事也”。干部队伍建设工作的好坏，关系到党和国家的发展全局。近日，新疆维吾尔自治区党委书记马兴瑞在部分党群单位走访调研时强调，要努力培养造就忠诚干净担当的高素质专业化干部队伍。各级组织部门应当在培养选拔干部、吸收优秀青年到党内来、培养造就优秀人才上下功夫，切实增强干部投身实践、解决问题、推进工作的能力，着力打造高素质专业化干部队伍。“天生我材必有用”，增强选育有“准度”
"五项管理"之作业胡军锋
（一）统筹规划，轻负高效1.制定作业管理规范。加强教务处、年级组、班级三级统筹管理，合理调控学科作业结构和总量，严格控制电子作业内容与时长，引导学生正确使用网络、注意用眼卫生，杜绝家庭作业变家长作业，严禁布置家长作业，要求所有作业在校内完成。2.建立作业公示制度。每月定期开展学生作业情况反馈调研，并将调查结果及时反馈到每位学科教师。3.强化延时服务管理。在老师的指导下，应在延时期间完成作业。以完成
从“新疆之行”领悟成长为新疆“行” Wikyou
近日，习近平总书记先后来到乌鲁木齐、石河子、吐鲁番等地，深入学校、国际陆港区、社区、博物馆、农村和新疆生产建设兵团等进行调研，看似几日的调研，其中蕴含着总书记对新疆发展的重视。辅车相依，唇亡齿寒。作为党员干部要读懂总书记此次“新疆之行”的关注与关心，聚焦新疆工作总目标，做好推动事关长治久安的基础性、长远性工作。从“新疆之行”领悟育人是立德之根，筑牢信念之基。思想越是坚定，行动就越是坚定；思想若是松
山东大学小树林支教调研团青青仓木队山东大学青青仓木队
传承红色基因赓续红色血脉---希望小屋·山大担当暑期社会实践7月25日，山东大学“青青仓木”暑期线上支教队给枣庄欧峪小学四年级的小朋友们开展了“一起红色寻访”主题班会。第一个模块叫做“红领巾心向党”。大学生为小朋友们详细介绍了中国少年先锋队，从性质、标志、纪念日以及精神等方面加深了小朋友们对少先队的理解。在讨论环节中，小朋友们展开热烈讨论，对自己身上的“红领巾”有了更深入的认识，意识到了自己肩负的
参政议政湘笨儿
20190305今天参加区委参政议政会议。我感到很震撼。以前大家伙也会积极建言献策，但主要还是靠区委统筹布置调研和执笔任务。但是今天，我明显感觉到，每个同志都具有极强的政党意识，把参政议政当做自己的一项人生使命。同志们不但发言积极，到后来完全不需要领导布置，发表了自己感兴趣的议题后，都做出了初稿完成时间的承诺。完成一个议案，需要投入极大的精力查閲资料、详实调研。而这些都只能在工作之余去完成，甚至需
2022-01-07 炸鸡可以加热_9938
萤火虫实践队寒调实践活动圆满成功（通讯员钱逾2022-01-07）2022年1月7日，湖北师范大学萤火虫实践队寒调活动接近尾声。为了探究‘双减政策’教育背景下，师生，家长面临的新挑战背后的真实情况，以及适应双减政策的解决办法，湖北师范大学萤火虫实践队对问卷与访谈的数据进行了专业的分析，并召开线上会议就寒调心得与寒调研究报告撰写的具体要求以及注意事项进行了指导、交流与分享。上午九点半，实践队全体队员
坑爹的 xwiki 二次开发 iamdll xwiki
boss提出一个需求，要对xwiki进行二次开发，建立一系列的模板来满足不同团队的文档需求。其中，需要在页面上实现一级tag的选择，然后根据一级tag去display二级tag，并且在将相应的tag加到tag云中。为了这件事情，我调研了2天，其中各种文档缺失--xwiki的document就是一坨乱七八糟，杂乱无章，除了不停的search，没有任何办法。调研结果：能不能做呢-肯定是可以的，好不好做
安徽学子走进临北回族乡调研乡村振兴下发展前景 schlj
在广袤的江淮平原，千里淮河，滋养出一片美丽土地——临北回族乡。为探索临北回族乡在乡村振兴战略下的发展前景，7月12日，安徽财经大学青春筑梦团10名成员来到实践地点，开展实践活动。农业丰收特色产业蓬勃发展在驱车路途中，楼房渐少，绿色平原地带逐渐映入视线。与村支书刘书记沟通后，队员了解到临北回族乡以前是主要依靠蔬菜种植和牛羊养殖作为主要产业，农业种植面积和产量实现增长，养殖业产值突破3000万，填补了
2024全球数字电影摄像机、相机、广播摄像机市场报告 8K超高清数码相机人工智能科技
一、全球数字电影摄像机市场规模①全球数字电影摄像机市场销售额市场调研机构恒州博智QYResearch统计，2022年全球数字电影摄像机市场销售额达到31.19亿元，2023年全球数字电影摄像机市场销售额达到33.7亿元，预计未来将持续保持平稳增长的态势，到2030年市场规模将接近53亿元，未来六年CAGR为6.3%。②全球主要数字电影摄像机制造商品牌全球主要的数字电影摄像机制造商包括阿莱、索尼、佳
忙幸福种子成长陕西三原分群群主
1、今天瑜伽老师外出，没坚持！2、给妈妈打电话，告诉妈妈天冷，别出门，妈妈主动给我汇报一切好着！3、一个上午帮小黄联系分层阅读调研的事，直到下午上班所有参与的学校都搞定，感恩学校领导的支持，谢谢谢谢！4、月捐梭梭树又给我发来自动扣费短信，一月又一月好快，随喜钱宝宝的流动，想象我们的环境因我的一份努力不断改善，内心很喜悦！
一罐好奶粉的唯一评判标准小宝娘育儿
小宝娘在这先给各位宝妈们请安啦~在说正题之前，有必要先提的一点：配方奶粉可模仿母乳，但永远也替代不了母乳。在特殊情况下，因为药物原因导致不能哺乳的，又或是出现奶水供不应求的情况时，以“后备粮仓”而闻名遐迩的配方奶粉就隆重出场了。销售员磨破了嘴，宝妈们跑废了腿。这是“奶粉调研阶段”永远伴随着的两种形态，而往往最后宝妈们也没能在价值和品质的权衡上给宝宝找到合适的“口粮”，什么样的奶粉才是好的呢？价格不
戎马南疆十九载，不懈奋斗写人生——记海军老战士刘罗生湘大金盾法学社五老事迹调研团
法学院通讯员：扶紫媛2021年8月17日上午九点，今年74岁高龄的刘罗生老前辈接受了湘潭大学金盾法学社“五老”事迹调研团（以下简称“金盾调研团”）的线上专访。刘老是名海军老战士，军龄19余载；更是一名老党员，党龄55年。1963年，他响应国家号召，从湖南省益阳市南县麻河口的一个小村庄参军入伍远赴海南，在海南省临高县新盈镇的原海军高射炮兵独立营第七营从军19年有余，亲历八六海战、抗美援越、西沙之战、
打造个人品牌赋能工具的产品思考哎卖姜
哎卖姜日更D45我给自己的定位是：个人品牌赋能工具缔造者。所以，我是一个制造工具的人。目前，这个工具我并没有着急开发出来，而是在反复的产品调研、打磨的过程中。要确保这个工具能够“横空出世”，并保持持久的生命力，我们的产品需要做到以下几点：1、符合人性。作为一个产品经理，必须去深度的挖掘人性的本质，一个小小的功能不匹配，可能会导致你的产品前功尽弃。而人性又是一个复杂的存在，所以，产品经理应该像上帝一
调研App里的WebDAV功能@FE File Explorer 文件管理器（二） jaminezhong
今天我又淘到一款特容易链接WebDAV的软件：FEFileExplorer我觉得它最大好处是在Mac版电脑、Android、iOS上，一个全功能的文件上管理app。而且还可以在您的iOS、安卓和Mac电脑上使用流媒体方式播放网络共享、NAS里面的视频和音乐。FEFileExplorerPro+穿越派=个人私有云需要穿越派的，在这里下：https://www.huluer.com/usercente
计算机类毕业设计怎么做李哥讲程序开发课程设计毕设毕业设计
计算机类的毕业设计通常是学生在大学学习期间的一个综合实践项目，旨在检验学生对所学知识的掌握程度以及解决实际问题的能力。以下是一些步骤和建议，可以帮助你完成计算机类的毕业设计：1.**选题与定位**：-选择一个你感兴趣的主题，这有助于保持动力并完成项目。-确保题目具有实际应用价值或理论研究意义。-考虑你的技能和知识水平，确保选择的题目既有挑战性又能够实现。2.**文献调研**：-阅读相关的书籍、学术
大学生走近社区调研社区治理现状安徽财经大学8
大学生走近社区调研社区治理现状党的十九届四中全会作出了“坚持和完善中国特色社会主义制度、推进国家治理体系和治理能力现代化”的重大战略部署，其中对基层社会治理也提出了明确的要求。基层社会治理是国家社会治理体系的基础，是我国治理能力在基层的具体体现，它直接关系到人们的安全感、获得感、幸福感。它的有效运行，决定着整个国家和社会治理基础的坚实性和稳定性。改革开放40多年来，我国社区治理在不断的实践中已经取
IT中的去“IOE” key_zhaojd IOE
I是指“IBM”,O是指“Oracle”,E是“EMC”。去IOE就是去掉IBM的小型机、Oracle数据库、EMC存储设备，代之在开源软件基础上开发的系统。以IBM、Oracle和EMC为代表的三大国际巨头组成的IT系统一直是中国企业信息化的“黄金搭档”，随着云计算和开源软件技术的成熟应用，这种高大上的“黄金搭档”必将走下神坛。据Gartner和IDC的2013年调研数据显示，在全球服务器市场，
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Postgresql-xl 调研

Postgresql-xl 调研

来历

个人观感

分布式架构

Features

Workloads:

和Postgresql-xc的关系

代码改动方法和实现

GTM

snapshot

GTM-Proxy

Coordinator

Datanode

实现查询优化的方法

DDL的处理

directStmt

非directStmt

Parse/resolve

生成plan

SCAN

JOIN

GROUP BY

实现查询执行的方法

ExecutorStart

ExecutorRun

数据交换

数据分布方式

事务处理

杂项

barrier

pause\unpause

你可能感兴趣的:(Postgresql-xl 调研)