J.Kuchiki

【 OpenGauss源码学习 —— 列存储（analyze）(一)】

列存储（analyze）

概述
源码分析
- vacuum 函数
- VacuumStmt 结构体
- BufferAccessStrategy 结构体
analyze_rel 函数
- analyze_get_relation 函数
- analyze_rel_internal 函数

声明：本文的部分内容参考了他人的文章。在编写过程中，我们尊重他人的知识产权和学术成果，力求遵循合理使用原则，并在适用的情况下注明引用来源。
本文主要参考了 OpenGauss1.1.0 的开源代码和《OpenGauss数据库源码解析》一书以及OpenGauss社区学习文档

概述

在OpenGauss中，“ANALYZE” 是一个用于数据库优化的关键操作，它用于收集表中统计信息，以便优化查询性能。对于列存储表，ANALYZE 功能的作用是分析表中的数据分布、值的密度和其他统计信息，以便查询优化器能够更好地决定执行计划，从而提高查询的执行效率。

ANALYZE 功能在列存储表中的工作过程通常包括以下步骤：

数据采样收集：首先，ANALYZE 会从列存储表中随机抽样一部分数据，以避免对整个表进行完整扫描，从而减少分析的时间和资源消耗。

统计信息计算：对于选定的采样数据，ANALYZE 会计算各列中不同值的分布、空值的比例、数据密度等统计信息。这些统计信息可以帮助优化器更好地预测查询的执行计划。

直方图生成：在列存储中，直方图是一种用于表示列中值分布的数据结构。ANALYZE 会基于采样数据生成直方图，以便优化器可以更精确地了解数据分布情况。

数据密度估计：通过分析采样数据，ANALYZE 还可以估计不同列中数据值的密度，这有助于优化器在执行计划中进行成本估算。

统计信息存储：分析完成后，生成的统计信息会被存储在数据库系统的系统表中，以供查询优化器使用。

当涉及 OpenGauss 数据库中的列存储和 ANALYZE 功能时，下面是一个基本的案例，展示了如何创建一个列存储表、插入数据、执行 ANALYZE 操作以及查看统计信息和优化计划。

1. 创建列存储表，执行以下 SQL 语句：

CREATE TABLE sales (
    sale_id SERIAL PRIMARY KEY,
    product_id INT,
    sale_date DATE,
    quantity INT,
    amount DECIMAL
) WITH (ORIENTATION = COLUMN);

postgres=# select * from sales;
 sale_id | product_id | sale_date | quantity | amount
---------+------------+-----------+----------+--------
(0 rows)

postgres=# \d+ sales
                                                             Table "public.sales"
   Column   |              Type              |                        Modifiers                        | Storage | Stats target | Description
------------+--------------------------------+---------------------------------------------------------+---------+--------------+-------------
 sale_id    | integer                        | not null default nextval('sales_sale_id_seq'::regclass) | plain   |              |
 product_id | integer                        |                                                         | plain   |              |
 sale_date  | timestamp(0) without time zone |                                                         | plain   |              |
 quantity   | integer                        |                                                         | plain   |              |
 amount     | numeric                        |                                                         | main    |              |
Has OIDs: no
Options: orientation=column, compression=low

2. 插入一些示例数据到列存储表中：

INSERT INTO sales (product_id, sale_date, quantity, amount)
VALUES
    (101, '2023-08-01', 10, 100.00),
    (102, '2023-08-02', 5, 50.00),
    (101, '2023-08-03', 8, 80.00);

postgres=# select * from sales;
 sale_id | product_id |      sale_date      | quantity | amount
---------+------------+---------------------+----------+--------
       1 |        101 | 2023-08-01 00:00:00 |       10 | 100.00
       2 |        102 | 2023-08-02 00:00:00 |        5 |  50.00
       3 |        101 | 2023-08-03 00:00:00 |        8 |  80.00
(3 rows)

3. 执行 ANALYZE 进行统计信息收集：

postgres=# ANALYZE sales;
ANALYZE

4. 查看统计信息和优化计划：

查看表的统计信息，如不同列的值分布等：
postgres=# SELECT * FROM pg_statistic WHERE starelid = 'sales'::regclass;
 starelid | starelkind | staattnum | stainherit | stanullfrac | stawidth | stadistinct | stakind1 | stakind2 | stakind3 | stakind4 | stakind5 | staop1 | staop2 |
 staop3 | staop4 | staop5 | stanumbers1 | stanumbers2 | stanumbers3 | stanumbers4 | stanumbers5 |                             stavalues1
     | stavalues2 | stavalues3 | stavalues4 | stavalues5 | stadndistinct | staextinfo
----------+------------+-----------+------------+-------------+----------+-------------+----------+----------+----------+----------+----------+--------+--------+
--------+--------+--------+-------------+-------------+-------------+-------------+-------------+----------------------------------------------------------------
-----+------------+------------+------------+------------+---------------+------------
    40980 | c          |         1 | f          |           0 |        4 |          -1 |        2 |        3 |        0 |        0 |        0 |     97 |     97 |
      0 |      0 |      0 |             | {1}         |             |             |             | {1,2,3}
     |            |            |            |            |             0 |
    40980 | c          |         2 | f          |           0 |        4 |    -.666667 |        1 |        3 |        0 |        0 |        0 |     96 |     97 |
      0 |      0 |      0 | {.666667}   | {.5}        |             |             |             | {101}
     |            |            |            |            |             0 |
    40980 | c          |         3 | f          |           0 |        8 |          -1 |        2 |        3 |        0 |        0 |        0 |   2062 |   2062 |
      0 |      0 |      0 |             | {1}         |             |             |             | {"2023-08-01 00:00:00","2023-08-02 00:00:00","2023-08-03 00:00:
00"} |            |            |            |            |             0 |
    40980 | c          |         4 | f          |           0 |        4 |          -1 |        2 |        3 |        0 |        0 |        0 |     97 |     97 |
      0 |      0 |      0 |             | {-.5}       |             |             |             | {5,8,10}
     |            |            |            |            |             0 |
    40980 | c          |         5 | f          |           0 |       11 |          -1 |        2 |        3 |        0 |        0 |        0 |   1754 |   1754 |
      0 |      0 |      0 |             | {-.5}       |             |             |             | {50.00,80.00,100.00}
     |            |            |            |            |             0 |
(5 rows)


查看查询的优化计划：
postgres=# EXPLAIN SELECT * FROM sales WHERE product_id = 101;
                          QUERY PLAN
---------------------------------------------------------------
 Row Adapter  (cost=3.01..3.01 rows=2 width=31)
   ->  CStore Scan on sales  (cost=0.00..3.01 rows=2 width=31)
         Filter: (product_id = 101)
(3 rows)

源码分析

其中，analyze 的核心代码的实现在 vacuum.cpp （路径：src/gausskernel/optimizer/commands/vacuum.cpp）和 analyze.cpp （路径：src/gausskernel/optimizer/commands/analyze.cpp）中。

vacuum 函数

我们首先先来学习 vacuum 函数，该函数在 OpenGauss 数据库中执行 VACUUM 和 ANALYZE 命令的主要入口函数。VACUUM 用于回收已删除行的空间，以及处理未使用的数据页，从而减少表的碎片和存储空间。ANALYZE 则用于计算表中列的统计信息，以便优化查询计划。以下是这个函数的大致执行步骤：

首先，函数输出一个日志消息，指示是否在协调节点上运行以及当前 PGXC 节点的编号。

声明了一些变量，如 stmttype 用于记录操作类型（VACUUM 还是 ANALYZE）、in_outer_xact 用于判断是否在外部事务中，以及 use_own_xacts 用于判断是否需要使用自己的事务。

检查是否启用了特殊的 enable_show_any_tuples 模式，如果启用了则抛出错误。

设置当前 IO 状态为 VACUUM。

根据操作选项判断当前是否需要执行 VACUUM，如果是的话，阻止事务链并设置 in_outer_xact 为假。

检查是否正在执行 VACUUM 或 ANALYZE 操作，如果是则抛出错误。

如果当前是 VACUUM 操作且不是自动 VACUUM 工作进程，则向统计收集器发送死对象信息。

为跨事务内存存储创建一个专用的上下文。

如果未传入缓冲策略对象 bstrategy，则在跨事务内存上下文中创建一个新的策略对象。

构建需要处理的关系列表，如果传入的 relid 为 InvalidOid，则从 vacstmt 中获取。

根据操作选项判断是否需要自己的事务来处理。

如果需要自己的事务，将当前事务提交，以便释放锁定。

设置 VACUUM 成本统计，用于统计执行 VACUUM 和 ANALYZE 的开销。

使用一个循环来处理每一个选定的关系。

在循环中，处理选定的关系，可能执行 VACUUM 和 ANALYZE 操作。

在关系处理结束后，恢复之前的等待状态，释放内存，报告当前状态。

如果在循环处理过程中出现异常，设置相关状态并抛出异常。

最后，恢复各种状态和内存，以及必要的清理工作。

这个函数主要用于执行 VACUUM 和 ANALYZE 操作，它根据传入的参数和操作选项来判断需要执行哪种操作，并根据不同情况进行事务管理、统计信息收集等。

/*
 * Primary entry point for VACUUM and ANALYZE commands.
 *
 * relid is normally InvalidOid; if it is not, then it provides the relation
 * OID to be processed, and vacstmt->relation is ignored.  (The non-invalid
 * case is currently only used by autovacuum.)
 *
 * do_toast is passed as FALSE by autovacuum, because it processes TOAST
 * tables separately.
 *
 * bstrategy is normally given as NULL, but in autovacuum it can be passed
 * in to use the same buffer strategy object across multiple vacuum() calls.
 *
 * isTopLevel should be passed down from ProcessUtility.
 *
 * It is the caller's responsibility that vacstmt and bstrategy
 * (if given) be allocated in a memory context that won't disappear
 * at transaction commit.
 */
void vacuum(
    VacuumStmt* vacstmt, Oid relid, bool do_toast, BufferAccessStrategy bstrategy, bool isTopLevel)
{
    ereport(ES_LOGLEVEL, (errmsg("[Vacuum] > CN?[%d], [%d]", IS_PGXC_COORDINATOR, u_sess->pgxc_cxt.PGXCNodeId)));

    const char* stmttype = NULL;
    volatile bool in_outer_xact = false;
    volatile bool use_own_xacts = false;
    List* relations = NIL;

    /* sanity checks on options */
    Assert(vacstmt->options & (VACOPT_VACUUM | VACOPT_ANALYZE));
    Assert((vacstmt->options & VACOPT_VACUUM) || !(vacstmt->options & (VACOPT_FULL | VACOPT_FREEZE)));
    Assert((vacstmt->options & VACOPT_ANALYZE) || vacstmt->va_cols == NIL);
	
	// 这一行代码的作用是根据 vacstmt 中的操作选项来确定当前执行的操作类型
    stmttype = (vacstmt->options & VACOPT_VACUUM) ? "VACUUM" : "ANALYZE";

	// 检查是否启用了特殊模式 enable_show_any_tuples，如果启用了，则会在执行 VACUUM 或 ANALYZE 命令时抛出错误
    if (u_sess->attr.attr_storage.enable_show_any_tuples)
        ereport(ERROR,
            (errcode(ERRCODE_QUERY_CANCELED),
                errmsg(
                    "%s cannot be executed when u_sess->attr.attr_storage.enable_show_any_tuples is true.", stmttype)));

	// 设置数据库统计信息中的 I/O 状态为 VACUUM
    pgstat_set_io_state(IOSTATE_VACUUM);

    /*
     * We cannot run VACUUM inside a user transaction block; if we were inside
     * a transaction, then our commit- and start-transaction-command calls
     * would not have the intended effect!	There are numerous other subtle
     * dependencies on this, too.
     *
     * ANALYZE (without VACUUM) can run either way.
     */
    // 是否需要在一个事务链上执行操作，并相应地设置事务状态
    if (vacstmt->options & VACOPT_VACUUM) {
        PreventTransactionChain(isTopLevel, stmttype);
        in_outer_xact = false;
    } else
        in_outer_xact = IsInTransactionChain(isTopLevel);

    /*
     * Due to static variables vac_context, analyze_context and vac_strategy,
     * vacuum() is not reentrant.  This matters when VACUUM FULL or ANALYZE
     * calls a hostile index expression that itself calls ANALYZE.
     */
    // 这行代码判断当前是否正在执行 VACUUM 或 ANALYZE 操作
    if (t_thrd.vacuum_cxt.in_vacuum)
        ereport(
            ERROR, (errcode(ERRCODE_QUERY_CANCELED), errmsg("%s cannot be executed from VACUUM or ANALYZE", stmttype)));

    /*
     * Send info about dead objects to the statistics collector, unless we are
     * in autovacuum --- autovacuum.c does this for itself.
     */
    // 用于在执行 VACUUM 操作时向统计收集器报告关于死对象的信息
    if ((vacstmt->options & VACOPT_VACUUM) && !IsAutoVacuumWorkerProcess())
        pgstat_vacuum_stat();

    /*
     * Create special memory context for cross-transaction storage.
     *
     * Since it is a child of t_thrd.mem_cxt.portal_mem_cxt, it will go away eventually even
     * if we suffer an error; there's no need for special abort cleanup logic.
     */
    t_thrd.vacuum_cxt.vac_context = AllocSetContextCreate(t_thrd.mem_cxt.portal_mem_cxt,
        "Vacuum",
        ALLOCSET_DEFAULT_MINSIZE,
        ALLOCSET_DEFAULT_INITSIZE,
        ALLOCSET_DEFAULT_MAXSIZE);

    /*
     * If caller didn't give us a buffer strategy object, make one in the
     * cross-transaction memory context.
     */
    // 检查是否已经提供了一个缓冲策略对象（bstrategy），如果没有，则创建一个新的缓冲策略对象
    if (bstrategy == NULL) {
        MemoryContext old_context = MemoryContextSwitchTo(t_thrd.vacuum_cxt.vac_context);

        bstrategy = GetAccessStrategy(BAS_VACUUM);
        (void)MemoryContextSwitchTo(old_context);
    }
    vac_strategy = bstrategy;

    /*
     * Build list of relations to process, unless caller gave us one. (If we
     * build one, we put it in vac_context for safekeeping.)
     */
    // 用于获取需要处理的关系列表，以供后续的 VACUUM 和 ANALYZE 操作使用
    relations = get_rel_oids(relid, vacstmt);

    /*
     * Decide whether we need to start/commit our own transactions.
     *
     * For VACUUM (with or without ANALYZE): always do so, so that we can
     * release locks as soon as possible.  (We could possibly use the outer
     * transaction for a one-table VACUUM, but handling TOAST tables would be
     * problematic.)
     *
     * For ANALYZE (no VACUUM): if inside a transaction block, we cannot
     * start/commit our own transactions.  Also, there's no need to do so if
     * only processing one relation.  For multiple relations when not within a
     * transaction block, and also in an autovacuum worker, use own
     * transactions so we can release locks sooner.
     */
    // 用于决定是否需要在单独的事务中执行 VACUUM 或 ANALYZE 操作，以及如何设置相应的事务状态
    if (vacstmt->options & VACOPT_VACUUM) {
        use_own_xacts = true;
    } else {
        Assert(vacstmt->options & VACOPT_ANALYZE);
        if (IsAutoVacuumWorkerProcess()) {
            use_own_xacts = true;
        } else if (in_outer_xact) { //是否在外部事务中
            use_own_xacts = false;
        } else if (list_length(relations) > 1) {
            use_own_xacts = true;
        } else {
            use_own_xacts = false;
        }
    }

    /*
     * vacuum_rel expects to be entered with no transaction active; it will
     * start and commit its own transaction.  But we are called by an SQL
     * command, and so we are executing inside a transaction already. We
     * commit the transaction started in PostgresMain() here, and start
     * another one before exiting to match the commit waiting for us back in
     * PostgresMain().
     */
    // 在需要的情况下启动和提交独立的事务
    if (use_own_xacts) {
        /* ActiveSnapshot is not set by autovacuum */
        if (ActiveSnapshotSet())
            PopActiveSnapshot();

        /* matches the StartTransaction in PostgresMain() */
        CommitTransactionCommand();
    }

    /* Turn vacuum cost accounting on or off */
    PG_TRY();
    {
        ListCell* cur = NULL;

        t_thrd.vacuum_cxt.in_vacuum = true;
        t_thrd.vacuum_cxt.VacuumCostActive = (u_sess->attr.attr_storage.VacuumCostDelay > 0);
        t_thrd.vacuum_cxt.VacuumCostBalance = 0;
        t_thrd.vacuum_cxt.VacuumPageHit = 0;
        t_thrd.vacuum_cxt.VacuumPageMiss = 0;
        t_thrd.vacuum_cxt.VacuumPageDirty = 0;

        /*
         * Loop to process each selected relation.
         */
        WaitState oldStatus = pgstat_report_waitstatus(STATE_VACUUM);
        foreach (cur, relations) {
            vacuum_object* vacObj = (vacuum_object*)lfirst(cur);
            Oid relOid = vacObj->tab_oid;
            vacstmt->flags = vacObj->flags;
            vacstmt->onepartrel = NULL;
            vacstmt->onepart = NULL;
            vacstmt->partList = NIL;

            /*
             * do NOT vacuum partitioned table,
             * as vacuum is an operation related with tuple and storage page reorganization
             */
            if (vacstmt->options & VACOPT_VACUUM) {
                if (vacuumPartition(vacstmt->flags) || vacuumRelation(vacstmt->flags) ||
                    vacuumMainPartition(vacstmt->flags)) {
                    if (!vacuum_rel(relOid, vacstmt, do_toast))
                        continue;
                } else {
                    /* for partitioned table, just report collector that we just vacuumed. */
                    pgstat_report_vacuum(relOid, InvalidOid, false, 0);
                }
            }

            vacstmt->flags = vacObj->flags;
            vacstmt->onepartrel = NULL;
            vacstmt->onepart = NULL;

            if (vacstmt->options & VACOPT_ANALYZE) {
                /*
                 * we have received user-defined table's stat info from remote coordinator
                 * in function FetchGlobalRelationStatistics, so we skip analyze
                 */
                if (udtRemoteAnalyze(relOid))
                    continue;

                /*
                 * If using separate xacts, start one for analyze. Otherwise,
                 * we can use the outer transaction.
                 */
                if (use_own_xacts) {
                    StartTransactionCommand();
                    /* functions in indexes may want a snapshot set */
                    PushActiveSnapshot(GetTransactionSnapshot());
                    LockSharedObject(DatabaseRelationId, u_sess->proc_cxt.MyDatabaseId, 0, RowExclusiveLock);
                }

                /*
                 * do NOT analyze partition, as analyze is an operation related with
                 * data redistribution reflect and this is not meaningfull for one
                 * or more partitions, it must be done on basis of table level, either
                 * plain heap or partitioned heap.
                 */
                if (!vacuumPartition(vacstmt->flags)) {
                    pgstat_report_waitstatus_relname(STATE_ANALYZE, get_nsp_relname(relOid));
                    analyze_rel(relOid, vacstmt, vac_strategy);
                }

                if (use_own_xacts) {
                    PopActiveSnapshot();
                    CommitTransactionCommand();
                }
            }
        }
        (void)pgstat_report_waitstatus(oldStatus);
        list_free_deep(relations);
    }
    PG_CATCH();
    {
        t_thrd.vacuum_cxt.in_vacuum = false;
        /* Make sure cost accounting is turned off after error */
        list_free_deep(relations);
        t_thrd.vacuum_cxt.VacuumCostActive = false;
        PG_RE_THROW();
    }
    PG_END_TRY();

    t_thrd.vacuum_cxt.in_vacuum = false;
    /*
     * Reset query cancel signal here to prevent hange 
     * when multiple vacuum triggered (e.g. toast)
     */
    if (t_thrd.int_cxt.QueryCancelPending) {
        t_thrd.int_cxt.QueryCancelPending = false;
    }
    /* Turn off vacuum cost accounting */
    t_thrd.vacuum_cxt.VacuumCostActive = false;

    /*
     * Finish up processing.
     */
    if (use_own_xacts) {
        /* here, we are not in a transaction
         *
         * This matches the CommitTransaction waiting for us in
         * PostgresMain().
         */
        StartTransactionCommand();
        LockSharedObject(DatabaseRelationId, u_sess->proc_cxt.MyDatabaseId, 0, RowExclusiveLock);
    }

    if (((uint32)(vacstmt->options) & VACOPT_VACUUM) && !IsAutoVacuumWorkerProcess()) {
        /*
         * Update pg_database.datfrozenxid, and truncate pg_clog if possible.
         * (autovacuum.c does this for itself.)
         */
        vac_update_datfrozenxid();
    }

    /*
     * Clean up working storage --- note we must do this after
     * StartTransactionCommand, else we might be trying to delete the active
     * context!
     */
    if (t_thrd.vacuum_cxt.vac_context) {
        MemoryContextDelete(t_thrd.vacuum_cxt.vac_context);
        t_thrd.vacuum_cxt.vac_context = NULL;
    }
}

VacuumStmt 结构体

VacuumStmt 结构体是在 PostgreSQL 数据库中用于表示 VACUUM 和 ANALYZE 命令的数据结构。它在数据库源代码中定义，用于存储 VACUUM 和 ANALYZE 命令的各种参数和选项。以下是 VacuumStmt 结构体的定义：（路径：src/include/nodes/parsenodes.h）

typedef struct VacuumStmt {
    NodeTag type;            /* 结构体类型标签 */
    int options;             /* VacuumOption 标志的按位 OR */
    int flags;               /* 用于区分分区或 B 树的标志 */
                             /* 这些标志的值在 vacuum.h 中定义 */
    Oid rely_oid;            /* 对于 B 树，是堆 B 树的 OID，否则为 InvalidOid */
    int freeze_min_age;      /* 最小冻结年龄，-1 表示使用默认值 */
    int freeze_table_age;    /* 扫描整个表的年龄 */
    RangeVar* relation;      /* 要处理的单个表，或者为 NULL */
    List* va_cols;           /* 列名列表，为 NIL 表示所有列 */

    Relation onepartrel;     /* 用于跟踪已打开的关系 */
    Partition onepart;       /* 用于跟踪已打开的分区 */
    List* partList;          /* 分区列表 */
#ifdef PGXC
    void* HDFSDnWorkFlow;    /* @hdfs HDFSDnWorkFlow 存储分析操作相关信息 */
#endif
    bool isForeignTables;     /* @hdfs 当运行 "analyze [verbose] foreign table;" 命令时为 true */
    bool isPgFdwForeignTables; /* 当外部表的 fdw 是 gc_fdw 时为 true */
#ifdef ENABLE_MOT
    bool isMOTForeignTable;   /* 当前是否是 MOT 外部表 */
#endif

    /*
     * @hdfs
     * 参数 totalFileCnt 和 nodeNo 是由 CNSchedulingForAnalyze 设置的
     * CNSchedulingForAnalyze(
     *     int *totalFilesCnt,
     *     int *nodeNo,
     *     Oid foreignTableId)
     */
    unsigned int totalFileCnt; /* @hdfs 分析外部表操作中要采样的文件数 */
    int nodeNo;                /* @hdfs 哪个数据节点将执行分析操作，
                                  @global 统计：其他协调器将从哪个协调器节点获取统计信息。 */

    /*
     * @hdfs 数据节点总数，我们使用这个数字来调整存储在 pg_class 中的 reltuples 数量
     * 例如：我们执行操作 "analyze tablename"，有 x 个数据节点，而 tablename 是一个 HDFS 外部表。
     * 数据节点完成分析命令，协调器从数据节点获取元组数信息。这个数是总元组数的 1/x。在协调器中将这个数值调整为真实值。
     */
    unsigned int DnCnt;

    /*
     * 添加全局统计的参数。
     */
    DestReceiver* dest;       /* 用于数据节点将样本行发送到协调器。 */
    int num_samples;          /* 从数据节点接收的样本行数。 */
    HeapTuple* sampleRows;    /* 从数据节点接收的样本行。 */
    TupleDesc tupleDesc;      /* 普通表的样本行的元组描述符。 */
    int tableidx;             /* 设置当前需要设置样本率或总行数的表索引 */
    GlobalStatInfoEx pstGlobalStatEx[ANALYZE_MODE_MAX_NUM - 1]; /* 全局统计的辅助信息，扩展以识别 HDFS 表。 */
    unsigned int orgCnNodeNo; /* 标识哪个协调器从客户端接收分析命令，其他协调器需要从它获取统计信息。 */
    List* hdfsforeignMapDnList; /* 标识属于分片映射的一些数据节点，用于协调器从它们获取总 reltuples。 */
    bool sampleTableRequired;   /* 需要样本表以获取统计信息。 */
    List* tmpSampleTblNameList; /* 在调试期间识别样本表名称。 */
    bool isAnalyzeTmpTable;     /* 如果分析的表是临时表，则为 true。 */
#ifdef PGXC
    DistributionType disttype; /* 分析表的分布类型。 */
#endif
    AdaptMem memUsage;         /* 分配给语句的自适应内存 */
    Oid curVerifyRel;          /* 当前的关系用于数据库模式以发送远程查询 */
    bool isCascade;            /* 用于验证表 */
} VacuumStmt;

BufferAccessStrategy 结构体

BufferAccessStrategy 是一个在 PostgreSQL 数据库中用于定义缓冲区访问策略的数据结构。它允许控制在数据库中读取和写入缓冲区时的一些策略，以优化内存使用和 I/O 操作。该结构体的目的是提供一种机制，使用户可以在不同的操作（如 VACUUM、ANALYZE、查询等）中自定义如何访问数据库缓冲区。
具体而言，BufferAccessStrategy 定义了一组函数指针，这些函数可以被 PostgreSQL 内核调用来执行实际的缓冲区访问操作。用户可以通过自定义这些函数来实现特定的缓冲区管理策略，例如决定何时读取数据块、何时写入数据块、何时释放缓冲区等。BufferAccessStrategy 结构体源码如下：
（BufferAccessStrategy 路径：src/include/storage/buf/buf.h）

/*
 * Buffer access strategy objects.
 */
typedef struct BufferAccessStrategyData* BufferAccessStrategy;

（BufferAccessStrategyData 路径：src/include/storage/buf/bufmgr.h）

/*
 * 用于管理一个共享缓冲区环的私有（非共享）状态。
 * 目前这是唯一一种类型的 BufferAccessStrategy 对象，但将来可能会有更多种类。
 */
typedef struct BufferAccessStrategyData {
    /* 整体策略类型 */
    BufferAccessStrategyType btype;
    /* buffers[] 数组中的元素数量 */
    int ring_size;

    /*
     * 在环中的“当前”插槽的索引，即由 GetBufferFromRing 返回的最近的插槽。
     */
    int current;

    /* 在当前之后刷新的元素数量 */
    int flush_rate;

    /*
     * 如果由 StrategyGetBuffer 返回的缓冲区已经在环中，则为 true。
     */
    bool current_was_in_ring;

    /*
     * 缓冲区编号的数组。InvalidBuffer（即零）表示我们尚未选择该环插槽的缓冲区。
     * 为了分配的简便性，这是与结构体的固定字段一起分配的。
     */
    Buffer buffers[FLEXIBLE_ARRAY_MEMBER]; /* 可变大小的数组 */
} BufferAccessStrategyData;

analyze_rel 函数

analyze_rel 函数用于执行分析操作（ANALYZE）或者清理操作（VACUUM）的入口函数，它接收一个关系（表）的对象标识符（OID）、分析或清理的语句信息、以及缓冲区访问策略作为参数，然后根据这些参数执行相应的操作。
在给定的 relid 和 vacstmt 参数的情况下，analyze_rel 函数会根据 vacstmt 中的信息来确定要分析的表，然后构建一个包含这些表 OID 的列表。这个列表会在后续的代码中用于逐个分析这些表。函数源码如下：（路径：src/gausskernel/optimizer/commands/analyze.cpp）

/*
 * 描述：分析关系的入口。
 *
 * 参数：
 *     @in relid：关系的 OID
 *     @in vacstmt：进行分析或清理操作的语句
 *     @in bstrategy：缓冲区访问策略对象
 *
 * 返回值：void
 */
void analyze_rel(Oid relid, VacuumStmt* vacstmt, BufferAccessStrategy bstrategy) {
    /*
     * 尝试打开关系，如果打开失败，则跳过该关系。
     * 关系将在 analyze_rel_internal() 中关闭。
     */
    Relation onerel = analyze_get_relation(relid, vacstmt);
    
    if (STMT_RETRY_ENABLED) {
        // 如果启用了查询重试，暂时不做任何操作，只是跳过 validateTempRelation
    } else if (onerel != NULL && onerel->rd_rel != NULL && 
               onerel->rd_rel->relpersistence == RELPERSISTENCE_TEMP && 
               !validateTempNamespace(onerel->rd_rel->relnamespace)) {
        relation_close(onerel, NEED_EST_TOTAL_ROWS_DN(vacstmt) ? AccessShareLock : ShareUpdateExclusiveLock);
        ereport(ERROR,
            (errcode(ERRCODE_DATA_EXCEPTION),
             errmsg("因为 datanode %s 重启，临时表的数据无效。请退出会话以清除无效的临时表。",
                    g_instance.attr.attr_common.PGXCNodeName)));
    }
    
    /*
     * 如果有 onerel，就进行分析。否则，如果已经启动了事务，应该提交事务。
     */
    if (onerel) {
        /* 对普通表进行分析。 */
        if (!RelationIsDfsStore(onerel)) {
            analyze_rel_internal(onerel, vacstmt, bstrategy, ANALYZENORMAL);
        } else {
            /* 分析整个数据库期间 HDFS 表的 Delta 表。 */
            GBLSTAT_HDFS_SAMPLE_ROWS stHdfsSampleRows = {0};
            RangeVar* oldRelVar = vacstmt->relation;
            Relation deltaRel;

            stHdfsSampleRows.hdfs_sample_context = AllocSetContextCreate(t_thrd.vacuum_cxt.vac_context,
                "AnalyzeHDFSSample",
                ALLOCSET_DEFAULT_MINSIZE,
                ALLOCSET_DEFAULT_INITSIZE,
                ALLOCSET_DEFAULT_MAXSIZE);

            AssertEreport(OidIsValid(onerel->rd_rel->reldeltarelid), MOD_OPT, "Delta 表的 OID 必须有效。");
            deltaRel = analyze_get_relation(onerel->rd_rel->reldeltarelid, vacstmt);
            if (deltaRel != NULL) {
                /* 对 Delta 表进行分析。 */
                vacstmt->relation = NULL;
                analyze_rel_internal(deltaRel, vacstmt, bstrategy, ANALYZEDELTA, &stHdfsSampleRows);

                /* 对 DFS 表进行分析。 */
                vacstmt->relation = oldRelVar;
                analyze_rel_internal(onerel, vacstmt, bstrategy, ANALYZEMAIN, &stHdfsSampleRows);
            } else {
                /* 重置并关闭 DFS 表 */
                LOCKMODE lockmode = NEED_EST_TOTAL_ROWS_DN(vacstmt) ? AccessShareLock : ShareUpdateExclusiveLock;
                vacstmt->relation = oldRelVar;
                relation_close(onerel, lockmode);
            }

            MemoryContextDelete(stHdfsSampleRows.hdfs_sample_context);
            stHdfsSampleRows.hdfs_sample_context = NULL;
        }
    }
}

其中，Relation 结构体的解释在 CopyTo 一文中进行了介绍。

analyze_get_relation 函数

analyze_get_relation 函数是用于在进行分析操作（analyze 或 vacuum）之前，打开要分析的关系（表），并获取适当的锁来确保分析的正确执行。函数源码如下：（路径：src/gausskernel/optimizer/commands/analyze.cpp）

/*
 * analyze_get_relation() -- get one relation by relid before do analyze.
 * 从 relid 获取一个关系（表），用于在执行分析之前。
 * @in relid - the relation id for analyze or vacuum
 * @in vacstmt - the statment for analyze or vacuum command
 */
Relation analyze_get_relation(Oid relid, VacuumStmt* vacstmt)
{
    Relation onerel = NULL;
    bool GetLock = false;
    LOCKMODE lockmode = NEED_EST_TOTAL_ROWS_DN(vacstmt) ? AccessShareLock : ShareUpdateExclusiveLock;

    /*
     * Check for user-requested abort.
     * 检查是否有用户请求的中断信号。
     */
    CHECK_FOR_INTERRUPTS();

    /*
     * Open the relation, getting ShareUpdateExclusiveLock to ensure that two
     * ANALYZEs don't run on it concurrently.  (This also locks out a
     * concurrent VACUUM, which doesn't matter much at the moment but might
     * matter if we ever try to accumulate stats on dead tuples.)
     * 打开关系（表），获取 ShareUpdateExclusiveLock 锁，以确保不会并发运行两个 ANALYZE 操作。
     * 这也会锁定并发的 VACUUM 操作，虽然目前不是很重要，但在将来可能会在死元组上累积统计信息时变得重要。
     * 如果关系已被删除，我们无需处理它。
     */
    if ((vacuumRelation(vacstmt->flags) || vacuumMainPartition(vacstmt->flags)) &&
        !(vacstmt->options & VACOPT_NOWAIT)) {
        onerel = try_relation_open(relid, lockmode);
        GetLock = true;
    } else if ((vacuumRelation(vacstmt->flags) || vacuumMainPartition(vacstmt->flags)) &&
               ConditionalLockRelationOid(relid, lockmode)) {
        onerel = try_relation_open(relid, NoLock);
        GetLock = true;
    }

    if (!GetLock) {
        onerel = NULL;
        if (IsAutoVacuumWorkerProcess() && u_sess->attr.attr_storage.Log_autovacuum_min_duration >= 0)
            ereport(LOG,
                (errcode(ERRCODE_LOCK_NOT_AVAILABLE),
                    errmsg("skipping analyze of \"%s\" --- lock not available", vacstmt->relation->relname)));
    }

    return onerel;
}

analyze_rel_internal 函数

analyze_rel_internal 函数用于分析一个关系（表），它接收一个待分析的关系、分析或清理命令的语句信息、缓冲区访问策略、分析类型以及用于 DFS 表、增量表或复杂表的样本行信息作为参数。它执行以下操作：

设置消息级别和错误级别（用于不同的日志输出）。

检查用户权限，判断当前用户是否有分析权限。

忽略其他后端的临时表或全局临时表。

检查表的类型，包括是否是特殊表（如 pg_statistic）、普通表或外部表。

根据表的类型执行相应的分析操作：

对于普通表，获取表的大小和分区列表，执行常规分析。

对于外部表，调用外部表的 FDW（外部数据包装器）钩子函数，检查是否支持分析操作。

对于其他类型的表，输出警告信息。

告诉其他后端正在进行 ANALYZE 操作。

执行常规的非递归 ANALYZE 操作。

如果表是分区表并且使用 PAX 存储格式，则执行递归的 ANALYZE 操作。

关闭源关系，保留锁，以防在提交之前删除关系。

重置 PGXACT 标志，表示不再进行 ANALYZE 操作。

函数源码如下：（路径：src/gausskernel/optimizer/commands/analyze.cpp）

/*
 * Description: 分析单个关系的入口函数。
 *
 * Parameters:
 *  @in onerel: 待分析的关系
 *  @in vacstmt: 分析或清理命令的语句信息
 *  @in bstrategy: 缓冲区访问策略对象
 *  @in analyzemode: 表的分析类型（普通表、DFS 表或增量表）
 *  @in pstHdfsSampleRows: 用于 DFS 表、增量表或复杂表的样本行信息
 */
static void analyze_rel_internal(Relation onerel, VacuumStmt* vacstmt, BufferAccessStrategy bstrategy,
    AnalyzeMode analyzemode, GBLSTAT_HDFS_SAMPLE_ROWS* pstHdfsSampleRows)
{
    AcquireSampleRowsFunc acquirefunc = NULL;
    int elevel;
    int messageLevel;
    BlockNumber relpages = 0;
    List* partList = NIL;
    LOCKMODE lockmode = NEED_EST_TOTAL_ROWS_DN(vacstmt) ? AccessShareLock : ShareUpdateExclusiveLock;

    AssertEreport(onerel, MOD_OPT, "在进行分析时 onerel 不应为 NULL");

    /* 设置静态变量 */
    u_sess->analyze_cxt.vac_strategy = bstrategy;

    messageLevel = WARNING;
    elevel = DEBUG2;

    if (vacstmt->options & VACOPT_VERBOSE) {
        messageLevel = VERBOSEMESSAGE;
        elevel = VERBOSEMESSAGE;
    }

    /*
     * 检查权限，这应与 VACUUM 的检查相匹配！
     */
    AclResult aclresult = pg_class_aclcheck(RelationGetPgClassOid(onerel, false), GetUserId(), ACL_VACUUM);
    if (aclresult != ACLCHECK_OK && !(pg_class_ownercheck(RelationGetPgClassOid(onerel, false), GetUserId()) ||
            (pg_database_ownercheck(u_sess->proc_cxt.MyDatabaseId, GetUserId()) && !onerel->rd_rel->relisshared) ||
                (isOperatoradmin(GetUserId()) && u_sess->attr.attr_security.operation_mode))) {
        /* 如果在 VACUUM 过程中已经有相应的警告，无需再次输出 WARNING */
        if (!(vacstmt->options & VACOPT_VACUUM)) {
            if (onerel->rd_rel->relisshared)
                ereport(messageLevel,
                    (errmsg("跳过 \"%s\" --- 只有系统管理员可以对其进行分析", RelationGetRelationName(onerel))));
            else if (onerel->rd_rel->relnamespace == PG_CATALOG_NAMESPACE)
                ereport(messageLevel,
                    (errmsg("跳过 \"%s\" --- 只有系统管理员或数据库所有者可以对其进行分析",
                        RelationGetRelationName(onerel))));
            else
                ereport(messageLevel,
                    (errmsg("跳过 \"%s\" --- 只有表或数据库所有者可以对其进行分析",
                        RelationGetRelationName(onerel))));
        }

        relation_close(onerel, lockmode);

        return;
    }

    /*
     * 静默地忽略其他后端的临时表 --- 对它们进行分析相当无意义，因为它们的内容可能在磁盘上不是最新的。
     * （我们不在此处抛出警告；这只会在数据库范围的 ANALYZE 过程中引起冗余。）
     */
    if (RELATION_IS_OTHER_TEMP(onerel)) {
        relation_close(onerel, lockmode);
        return;
    }

    if (RELATION_IS_GLOBAL_TEMP(onerel) && !gtt_storage_attached(RelationGetRelid(onerel))) {
        relation_close(onerel, ShareUpdateExclusiveLock);
        return;
    }

    /*
     * 我们可以对任何表执行 ANALYZE，除了 pg_statistic。参见 update_attstats
     */
    if (RelationGetRelid(onerel) == StatisticRelationId) {
        AssertEreport(RelationIsNonpartitioned(onerel), MOD_OPT, "pg_statistic 不应为分区表。");

        if (!IsInitdb && !IS_SINGLE_NODE) {
            elog(WARNING, "系统目录 pg_statistic 不能进行分析，将跳过。");
        }

        relation_close(onerel, lockmode);
        return;
    }

    /*
     * 检查是否为普通表或外部表；我们以前在 get_rel_oids() 中进行了此检查，但在锁定关系之后检查似乎更安全。
     */
    if (onerel->rd_rel->relkind == RELKIND_RELATION ||
        onerel->rd_rel->relkind == RELKIND_MATVIEW) {
        /* 普通表，所以我们将使用常规的行获取函数 */
        /* 还会获取普通表的大小 */
        if (RelationIsPartitioned(onerel)) {
            Partition part = NULL;
            ListCell* partCell = NULL;

            partList = relationGetPartitionList(onerel, lockmode);

            foreach (partCell, partList) {
                part = (Partition)lfirst(partCell);
                relpages += PartitionGetNumberOfBlocks(onerel, part);
            }
        } else {
            relpages = RelationGetNumberOfBlocks(onerel);
        }
    } else if (onerel->rd_rel->relkind == RELKIND_FOREIGN_TABLE 
               || onerel->rd_rel->relkind == RELKIND_STREAM) {
        /*
         * @hdfs
         * 对于外部表，调用 FDW 的钩子函数来检查是否支持分析。
         */
        bool retValue = false;
        FdwRoutine* fdwroutine = GetFdwRoutineForRelation(onerel, false);

        /* 是否支持分析操作 */
        if (NULL != fdwroutine->AnalyzeForeignTable) {
            /* 是否实现了 GetFdwType 接口，以及文件类型是否为 HDFS_ORC */
            if (isObsOrHdfsTableFormTblOid(RelationGetRelid(onerel)) ||
                (IS_OBS_CSV_TXT_FOREIGN_TABLE(RelationGetRelid(onerel)) && !isWriteOnlyFt(RelationGetRelid(onerel)))) {
                /* 传递 AnalyzeForeignTable 所需的数据 */
                retValue = fdwroutine->AnalyzeForeignTable(
                    onerel, &acquirefunc, &relpages, (void*)vacstmt->HDFSDnWorkFlow, false);
            } else {
                /* 其他类型的外部表 */
                retValue = fdwroutine->AnalyzeForeignTable(onerel, &acquirefunc, &relpages, 0, false);
            }

            if (!retValue) {
                /* 对于 mysql_fdw，抑制警告信息 */
                messageLevel = isMysqlFDWFromTblOid(RelationGetRelid(onerel)) ? LOG : messageLevel;
                ereport(messageLevel,
                    (errmsg(
                        "跳过 \"%s\" --- 无法对该外部表进行分析。", RelationGetRelationName(onerel))));
                relation_close(onerel, lockmode);
                return;
            }

        } else {
            ereport(messageLevel,
                (errmsg("表 %s 不支持分析操作。", RelationGetRelationName(onerel))));
            relation_close(onerel, lockmode);
            return;
        }
    } else {
        /* 如果在 VACUUM 过程中已经有相应的警告，无需再次输出 WARNING */
        if (!(vacstmt->options & VACOPT_VACUUM))
            ereport(messageLevel,
                (errmsg("跳过 \"%s\" --- 无法分析非表或特殊系统表",
                    RelationGetRelationName(onerel))));

        if (RelationIsPartitioned(onerel)) {
            releasePartitionList(onerel, &partList, lockmode);
        }

        relation_close(onerel, lockmode);
        return;
    }

    /*
     * 好了，开始分析。首先告诉其他后端我在进行 ANALYZE。
     */
    LWLockAcquire(ProcArrayLock, LW_EXCLUSIVE);
    t_thrd.pgxact->vacuumFlags |= PROC_IN_ANALYZE;
    LWLockRelease(ProcArrayLock);

    /* 同时获取普通表的大小 */
    if (RelationIsPartitioned(onerel)) {
        vacstmt->partList = partList;
    }

    /*
     * 执行常规的非递归 ANALYZE。
     */
    do_analyze_rel(onerel, vacstmt, relpages, false, elevel, analyzemode, pstHdfsSampleRows);

    /*
     * 如果有子表，则执行递归的 ANALYZE。
     */
    if (RelationIsPAXFormat(onerel))
        do_analyze_rel(onerel, vacstmt, relpages, true, elevel, ANALYZECOMPLEX, pstHdfsSampleRows);

    /*
     * 现在关闭源关系，但保留锁，以便在提交之前没有人删除它。
     * （如果有人这样做，他们将无法清除我们在 pg_statistic 中创建的条目。
     * 此外，在提交之前释放锁会使我们暴露于 update_attstats 中的并发更新失败。）
     */
    if (RelationIsPartitioned(onerel)) {
        releasePartitionList(onerel, &partList, NoLock);
    }

    relation_close(onerel, NoLock);

    /*
     * 重置我的 PGXACT 标志。注意：我们需要在此处进行，而不是在 vacuum_rel 中，因为 end-of-xact 代码会清除 vacuum 标志。
     */
    LWLockAcquire(ProcArrayLock, LW_EXCLUSIVE);
    t_thrd.pgxact->vacuumFlags &= ~PROC_IN_ANALYZE;
    LWLockRelease(ProcArrayLock);
}

你可能感兴趣的:(OpenGauss,postgresql,数据库,gaussdb)

MySQL中查询JSON数组字段包含特定字符串的方法一勺菠萝丶 mysql json 数据库
问题背景在MySQL数据库中，当某个字段存储的是JSON数组（如["喷绘","2.6m喷绘","M喷绘","直喷","双透","气模"]），需要查询数组中包含特定字符串（如’气模’）的记录时，传统的LIKE语句无法直接使用。本文介绍两种高效的解决方案。解决方案对比1.精确匹配方案（推荐）当需要完全匹配数组中的元素时（如精确查找"气模"）：SELECT*FROMprocess_unit_prices
学生选课系统(11457) codercode2022 visual studio code spring boot 开发语言 matlab java laravel objective-c
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
解析大数据领域结构化数据的管理模式大数据洞察大数据 ai
解码结构化数据：大数据时代的高效管理模式与实践指南关键词结构化数据、大数据管理、数据建模、分布式数据库、数据仓库、数据治理、性能优化摘要在大数据的洪流中，结构化数据犹如隐藏在波涛之下的磐石，虽然不如非结构化数据那般引人注目，却是企业决策的基石。本文深入剖析了大数据环境下结构化数据的管理模式，从传统关系型数据库到现代分布式系统，从数据建模到存储架构，全面解读了结构化数据管理的核心技术与实践方法。通过
ClickHouse【理论篇】01：什么是ClickHouse
ClickHouse是一款开源的列式数据库管理系统（Column-OrientedDBMS），专为高性能实时数据分析（OLAP,OnlineAnalyticalProcessing）场景设计。它由俄罗斯搜索引擎公司Yandex开发（2016年开源），目前由独立基金会ClickHouse,Inc.维护，广泛应用于大数据分析、日志处理、用户行为洞察等领域。一、核心定位：OLAP场景的“性能标杆”传统关
Node.js特训专栏-实战进阶：13. ORM/ODM工具选型与使用爱分享的程序员 Node.js javascript 前端 node.js
欢迎来到Node.js实战专栏！在这里，每一行代码都是解锁高性能应用的钥匙，让我们一起开启Node.js的奇妙开发之旅！Node.js特训专栏主页专栏内容规划详情ORM/ODM工具选型与使用在当今的软件开发领域，数据库交互是众多应用程序的核心环节。无论是Web应用、移动后端，还是数据分析平台，高效、可靠地操作数据库至关重要。对象关系映射（ORM）和对象文档映射（ODM）工具应运而生，它们简化了数据
2025年的前后端一体化CMS框架优选方案 skywalk8163 多媒体 web cms
以下是结合技术生态、开发效率和商业落地验证，整理的2025年前后端一体化CMS框架优选方案：一、‌主流成熟框架组合‌1.‌React+Node.js(Express/Next.js)‌‌前端‌：React生态成熟，配合Redux状态管理，适合复杂后台界面开发‌78。‌后端‌：Express轻量灵活，Next.js支持SSR优化SEO，无缝对接MongoDB/PostgreSQL‌810。‌案例‌：
【大数据入门核心技术-DolphinScheduler】（二）DolphinScheduler安装部署-集群模式 forest_long 大数据技术入门到21天通关大数据 spark hive hadoop 交互 flink mapreduce
目录一、部署模式1、单机模式2、伪集群模式3、集群模式二、部署安装1、下载2、创建mysql元数据库3、配置一键部署脚本4、初始化数据库5、一键部署DolphinScheduler6、访问DolphinSchedulerUI三、启停命令一、部署模式DolphinScheduler支持多种部署模式，包括单机模式（Standalone）、伪集群模式（PseudoCluster）、集群模式（Cluste
利用已有的 PostgreSQL 和 ZooKeeper 服务，启动dolphinscheduler-standalone-server3.1.9 镜像云游大数据平台 zookeeper docker postgresql 工作流任务调度
ApacheDolphinScheduler是一个分布式易扩展的可视化DAG工作流任务调度开源系统。适用于企业级场景，提供了一个可视化操作任务、工作流和全生命周期数据处理过程的解决方案。ApacheDolphinScheduler旨在解决复杂的大数据任务依赖关系，并为应用程序提供数据和各种OPS编排中的关系。解决数据研发ETL依赖错综复杂，无法监控任务健康状态的问题。DolphinSchedule
基于PHP音乐交流论坛的设计与实现(含源文件) 设计源码分享 java
欢迎添加微信互相交流学习哦！项目源码：https://gitee.com/oklongmm/biye摘要本系统采用PHP语言，在Windows平台上设计实现一个网络论坛，实现了论坛的的基本功能：账户申请、登陆、帖子分类管理、查看、发帖、回帖、送花、加好友、发短信；用户界面亲切友善，便于使用；后台管理简单。本系统之所以坚持PHP与MySQL数据组合，因为在众多的数据库中，MySQL数据库有着特殊的魅
Python 爬虫入门（九）：Scrapy安装及使用「详细介绍」 blues_C Python爬虫实战 python 爬虫 scrapy
Python爬虫入门（九）：Scrapy安装及使用「详细介绍」前言1.Scrapy简介2.Scrapy的安装2.1环境准备2.2安装Scrapy3.创建Scrapy项目3.1创建项目3.2项目结构简介4.编写爬虫4.1创建爬虫4.2解析数据4.3运行爬虫5.存储数据5.1存储为JSON文件5.2存储到数据库5.2.1MongoDB6.处理请求和响应6.1请求头设置6.2处理响应7.高级功能7.1使
光伏发电园区管理系统 - Three.js + Django 实现方案小赖同学啊 test Technology Precious javascript django 开发语言
光伏发电园区管理系统-Three.js+Django实现方案我将设计一个基于Three.js和Django的光伏发电园区管理系统，包含3D可视化、实时监控和数据分析功能。系统架构设计API请求数据存储数据存储数据存储获取获取前端-Three.jsDjango后端数据库外部API光伏设备数据气象数据发电数据实时天气电价信息技术栈与依赖前端：Three.js(r128)-3D渲染Chart.js-数据
SQLiteC/C++接口详细介绍sqlite3_stmt类（二）界忆数据库 SQLite C与c++sqlite 数据库
返回目录：SQLite—免费开源数据库系列文章目录上一篇：SQLiteC/C++接口详细介绍sqlite3_stmt类简介下一篇：SQLiteC/C++接口详细介绍sqlite3_stmt类（三）sqlite3_reset()功能：重置一个准备好执行的SQL语句的状态，使其可以重复执行或进行新的绑定。在SQLite3准备执行一个SQL语句之前，需要进行一系列的准备工作，包括将SQL语句编译成字节码
SQLiteC/C++接口详细介绍sqlite3_stmt类（一）界忆数据库 SQLite C与c++sqlite 数据库
返回目录：SQLite—免费开源数据库系列文章目录上一篇：SQLiteC/C++接口详细介绍sqlite3_stmt类简介下一篇：SQLiteC/C++接口详细介绍sqlite3_stmt类（二）序言：本文开始了SQLite的第二个类的详细介绍了，有兴趣的朋友可以关注更新一下。1、sqlite3_prepare_v2()`sqlite3_prepare_v2`是SQLite库中的一个函数，用于将一
电商API性能优化：策略体系与实施要点 Joe13265449558 性能优化电商返回值淘宝 API 接口京东
电商API性能优化策略介绍在电商领域，API（应用程序编程接口）作为连接电商平台与外部系统、服务或应用的关键桥梁，其性能直接关系到用户体验、业务效率以及系统的整体稳定性。随着电商业务的快速发展，API接口面临着高并发、大数据量处理等挑战，因此，对电商API进行性能优化显得尤为重要。本文将从多个维度探讨电商API性能优化的策略。一、数据库优化策略数据库是电商API接口的核心组件之一，其性能直接影响A
网络资源模板--基于Android Studio 实现的喝水提醒App 编程乐学 Android 网络项目模板 android studio android ide 安卓大作业移动端开发大作业喝水提醒
目录一、测试环境说明二、项目简介三、项目演示四、部设计详情（部分)注册页面首页统计页五、项目源码一、测试环境说明二、项目简介本应用采用经典的MVC（Model-View-Controller）架构，将数据模型（Model）、视图（View）和控制器（Controller）分离，提高代码的可维护性和可扩展性。Model：负责数据的存储和处理，包括用户信息、饮水记录等。使用Room数据库来实现数据的持
设计模式简单汇总花王江不语设计模式设计模式
设计模式是软件工程中广泛使用的一套解决方案，用于解决常见问题并提高代码的质量。它们分为创建型、结构型和行为型三类，共23种模式。以下是各类别及其常见模式的详细说明：目录创建型模式结构型模式行为型模式创建型模式这些模式关注对象的创建机制，帮助控制实例化过程。单例模式（Singleton）：确保一个类只有一个实例，并提供全局访问点。应用场景：数据库连接管理、缓存系统等，避免资源浪费和潜在冲突。工厂方法
网络资源模板--基于Android Studio 实现的天气预报App 编程乐学 Android 网络项目模板安卓课设安卓大作业 androidstudio android 天气预报
目录一、环境说明二、项目简介三、项目演示四、部设计详情（部分)注册页面首页五、项目源码一、环境说明二、项目简介该项目是一个基于Android平台的天气预报应用，使用AndroidStudio开发工具和Java编程语言完成。项目采用了SQLite数据库存储用户数据和地区信息，通过OkHttp实现网络请求获取天气数据，并结合Gson解析JSON格式的天气信息。界面方面使用MaterialDesign设
《Spring 中上下文传递的那些事儿》Part 5：分布式链路追踪——SkyWalking 实战指南大手你不懂 Spring 中上下文传递的那些事儿 Java项目实战 spring 分布式 skywalking
Part5：分布式链路追踪——SkyWalking实战指南随着微服务架构的广泛应用，分布式系统的链路追踪和性能监控变得尤为重要。在之前的文章中，我们探讨了如何使用Sleuth和Zipkin实现基本的链路追踪。今天，我们将介绍另一种强大的工具——ApacheSkyWalking，它不仅提供了全面的链路追踪功能，还支持JVM、数据库、消息队列等多方面的监控。本文将带你了解SkyWalking的核心概念
数据分析全流程：从收集到可视化的高效实战晨曦543210 python
1.数据收集来源：数据库、API、传感器、日志文件、社交媒体、问卷调查等。工具：Python（requests、Scrapy）、SQL、Excel、Kafka（实时流数据）。2.数据清洗处理缺失、重复、错误或不一致的数据：缺失值：删除、填充（均值/中位数/众数）、插值或预测。异常值：使用箱线图、Z-score或IQR方法检测并处理。格式标准化：统一日期、单位、文本格式（如大小写、去除空格）。去重：
greenplum查询超时_Greenplum常用SQL查询
抽空网上收罗Greenplum常用SQL查询语句整理备忘。欢迎各位留言补充。都是SQL命令以及数据字典的使用。熟悉数据字典非常重要。三个重要的schema:pg_catalog,pg_toolkit,information_schema,其中information_schema中的数据字典都在视图中目录一、查看表某模式所有分布键信息二、数据库运行状态查询管理1.greenplum查询正在运行的sq
PostgreSQL连接池监控与优化：pg_stat_activity详解及连接阻塞排查指南
1.引言PostgreSQL是一款功能强大的开源关系型数据库，广泛应用于各类企业级应用。在高并发场景下，数据库连接池的管理和监控至关重要。如果连接池使用不当，可能会导致连接泄漏、阻塞甚至数据库崩溃。本文将详细介绍如何使用pg_stat_activity监控PostgreSQL连接状态，并针对连接卡住、阻塞等问题提供解决方案。2.使用pg_stat_activity监控连接状态pg_stat_act
PostgreSQL 的 WAL 与 Oracle 的 Redo Log 的全方面对比喝醉酒的小白 DBA PG postgresql oracle 数据库
目录标题一、共同点（相同点）二、不同点三、在复制与高可用中的角色四、具体技术细节差异五、性能影响与优化点六、使用示例PostgreSQLWAL使用示例OracleRedo使用示例⚫总结对比表PostgreSQL的WAL（Write-AheadLogging）和Oracle的RedoLog是两个数据库系统在保证数据持久性与事务一致性方面的关键机制。尽管它们的核心思想类似，都是“先写日志，再写数据”，
巅峰对话在线研讨 Q&A：Oracle Database 21c vs openGauss 2.0新特性解读和架构演进小兰 � 国产数据库技术文章数据库 oracle 华为
2021年11月11日，墨天轮《巅峰对话》栏目邀请到了两位数据库领域的巅峰人物：云和恩墨创始人盖国强老师，和来自清华大学计算机与技术系的李国良教授，为大家带来了在线研讨《OracleDatabase21cvsopenGauss2.0新特性解读和架构演进》，并对数据库技术演进和生态发展进行深入探讨。两位老师一共围绕10个特性作了深入、独到的解读，强强联手、共创了一场精彩的技术盛宴。当天的直播间吸引了
postgresql|数据库|只读用户的创建和删除（备忘）
CREATEUSERread_onlyWITHPASSWORD'密码'--连接到xxx数据库\cxxx--授予对xxx数据库的只读权限GRANTCONNECTONDATABASExxxTOread_only;GRANTUSAGEONSCHEMApublicTOread_only;GRANTSELECTONALLTABLESINSCHEMApublicTOread_only;GRANTEXECUTE
DM 数据库操作全指南 2301_82150492 数据库
一、DM数据库安装系统要求检查确保操作系统满足DM数据库的要求，例如，对于Linux系统，检查内核版本、内存、磁盘空间等。以CentOS7为例，推荐内存至少1GB，磁盘空间剩余5GB以上。检查是否安装了必要的依赖库，如glibc等。下载DM数据库安装包从达梦官方网站（武汉达梦数据库股份有限公司）下载适合操作系统的DM数据库安装包，如DM8的Linux版安装包。安装步骤以root用户登录系统，进入安
DM 数据库概述 2301_82150492 数据库
目录DM数据库概述安装DM数据库实例配置详解备份与还原策略DM数据库函数运用SQL查询语句实战DMSQL程序设计总结与展望引言达梦数据库（DM）是一款国产的高性能数据库管理系统，具有丰富的功能和良好的兼容性，广泛应用于各类企业级应用场景。它支持多种操作系统，如Windows、Linux等，并提供了完善的数据库管理工具和开发接口。安装DM数据库系统准备在安装DM数据库之前，需要确保目标系统满足一定的
Oracle DB和PostgreSQL,OpenGauss主外键一致性的区别 __风__ 数据库 oracle postgresql
针对于unique索引在主外键上的表现，o和PG的行为确实不一致，测试样例：PG:测试1：test=#CREATETABLEgdb_editingtemplates(objectidINTEGERNOTNULL,globalidVARCHAR(38)DEFAULT'{00000000-0000-0000-0000-000000000000}'NOTNULL,typeSMALLINTNOTNULL,
喜讯 | Navicat 蝉联 2025 年 DBTA 100 强名单 Navicat中国 Navicat 17 焕新上市 navicat 数据库
Navicat在“DBTA1002025-数据领域最重要的公司”榜单中获得表彰。该奖项旨在表彰在数据管理与分析领域的领先创新者。数据库趋势与应用集团出版人TomHogan表示：“企业正寻求扩大人工智能的应用范围，采用新的技术与应用，增加数据分析/商业智能的使用，并对现有应用进行现代化改造”，“每年，《数据库趋势与应用》杂志都会推出DBTA100榜单，旨在表彰具有创新精神、能够为客户带来新产品新体验
实战演练 | Navicat 中英文模式切换 Navicat中国 Navicat 技术智库数据库管理员数据库 mysql dba sql
本章节教大家在你的Navicat数据库管理工具中切换语言模式，soeasy!以下是中文模式中的切换路径，大家应该很容易掌握！-点击菜单栏-工具-选项-常规中设置语言即可自由切换！以下是英文模式中的切换路径，给你更直观的操作指南。-点击Tools-Options-General-Language即可自由切换！如果你想试用Navicat16，可以在这里下载Navicat的14天全功能免费试用版。往期回
分布式数据库设计——分布式数据库的基础概念庄小焱数据库域数据库
摘要分布式数据库设计系列将分为四个大的部分。将从以下四方面让大家对分布式数据库的设计和使用有深入的理解。模块一，分布式数据历史演变及其核心原理。从历史背景出发，讲解了分布式数据库要解决的问题、应用场景，以及核心技术特点。模块二，分布式数据库的高性能保证——存储引擎。这是专栏的亮点内容，简要展示了现代数据库的存储引擎，比如典型存储引擎、分布式索引、数据文件与日志结构存储、事务处理。其中，我会特别介绍
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round