J.Kuchiki

【 OpenGauss源码学习 —— 列存储（analyze）(二)】

列存储（analyze）

概述
analyze_get_relation 函数
- VacuumStmt 结构体
- Relation 结构体
- 代码段解读
- try_relation_open 函数
- ConditionalLockRelationOid 函数
analyze_rel_internal 函数
- BufferAccessStrategy 结构体
- GBLSTAT_HDFS_SAMPLE_ROWS 结构体
- do_analyze_rel 函数

声明：本文的部分内容参考了他人的文章。在编写过程中，我们尊重他人的知识产权和学术成果，力求遵循合理使用原则，并在适用的情况下注明引用来源。
本文主要参考了 OpenGauss1.1.0 的开源代码和《OpenGauss数据库源码解析》一书以及OpenGauss社区学习文档

概述

在OpenGauss中，“ANALYZE” 是一个用于数据库优化的关键操作，它用于收集表中统计信息，以便优化查询性能。对于列存储表，ANALYZE 功能的作用是分析表中的数据分布、值的密度和其他统计信息，以便查询优化器能够更好地决定执行计划，从而提高查询的执行效率。其相关知识在【 OpenGauss源码学习 —— 列存储（analyze）(一)】中进行了大致描述，在先前的章节中，我们大致了解了 vacuum 函数的相关操作。其中，函数 analyze_rel 函数用于执行分析操作（ANALYZE）或者清理操作（VACUUM）的入口函数，它接收一个关系（表）的对象标识符（OID）、分析或清理的语句信息、以及缓冲区访问策略作为参数，然后根据这些参数执行相应的操作。
我们在前一章中已经大致介绍了 analyze_rel 函数，其中 analyze_get_relation 和 analyze_rel_internal 函数分别负责打开指定的关系（表），以便进行分析操作和执行实际的表分析操作，包括收集统计信息、更新系统表等。在本文中，我们重点来学习这两个函数。

analyze_get_relation 函数

analyze_get_relation 函数是用于在进行分析操作（analyze 或 vacuum）之前，打开要分析的关系（表），并获取适当的锁来确保分析的正确执行。

入参：

Oid relid：表示待获取的关系的对象ID。这个参数指定了要获取哪个具体的关系。

VacuumStmt* vacstmt：这是一个指向 VacuumStmt 结构的指针，用于表示执行 ANALYZE 或 VACUUM 命令的上下文。VacuumStmt 结构中包含了执行命令的相关信息，例如要分析的关系、分析选项等。

返回值：

Relation 类型，表示获取到的关系的 RelationData 结构。这个结构包含了关于关系的元数据和缓存信息，供后续操作使用。

analyze_get_relation 函数源码如下：（路径：src/gausskernel/optimizer/commands/analyze.cpp）

/*
 * analyze_get_relation() -- get one relation by relid before do analyze.
 * 从 relid 获取一个关系（表），用于在执行分析之前。
 * @in relid - the relation id for analyze or vacuum
 * @in vacstmt - the statment for analyze or vacuum command
 */
Relation analyze_get_relation(Oid relid, VacuumStmt* vacstmt)
{
	// 存储获取到的关系的 RelationData 结构
    Relation onerel = NULL;
    // 表示是否需要获取锁
    bool GetLock = false;
    // 声明一个名为 lockmode 的变量，用于存储获取锁的模式。
    // 该行代码使用三元条件运算符根据 NEED_EST_TOTAL_ROWS_DN(vacstmt) 的结果来确定锁的模式。
    // 如果 NEED_EST_TOTAL_ROWS_DN(vacstmt) 为真，表示需要获取共享锁（AccessShareLock），否则获取排他锁（ShareUpdateExclusiveLock）。
    LOCKMODE lockmode = NEED_EST_TOTAL_ROWS_DN(vacstmt) ? AccessShareLock : ShareUpdateExclusiveLock;

    /*
     * Check for user-requested abort.
     * 检查是否有用户请求的中断信号。
     */
    CHECK_FOR_INTERRUPTS();

    /*
     * Open the relation, getting ShareUpdateExclusiveLock to ensure that two
     * ANALYZEs don't run on it concurrently.  (This also locks out a
     * concurrent VACUUM, which doesn't matter much at the moment but might
     * matter if we ever try to accumulate stats on dead tuples.)
     * 打开关系（表），获取 ShareUpdateExclusiveLock 锁，以确保不会并发运行两个 ANALYZE 操作。
     * 这也会锁定并发的 VACUUM 操作，虽然目前不是很重要，但在将来可能会在死元组上累积统计信息时变得重要。
     * 如果关系已被删除，我们无需处理它。
     */
    if ((vacuumRelation(vacstmt->flags) || vacuumMainPartition(vacstmt->flags)) &&
        !(vacstmt->options & VACOPT_NOWAIT)) {
        onerel = try_relation_open(relid, lockmode);
        GetLock = true;
    } else if ((vacuumRelation(vacstmt->flags) || vacuumMainPartition(vacstmt->flags)) &&
               ConditionalLockRelationOid(relid, lockmode)) {
        onerel = try_relation_open(relid, NoLock);
        GetLock = true;
    }

    if (!GetLock) {
        onerel = NULL;
        if (IsAutoVacuumWorkerProcess() && u_sess->attr.attr_storage.Log_autovacuum_min_duration >= 0)
            ereport(LOG,
                (errcode(ERRCODE_LOCK_NOT_AVAILABLE),
                    errmsg("skipping analyze of \"%s\" --- lock not available", vacstmt->relation->relname)));
    }

    return onerel;
}

VacuumStmt 结构体

VacuumStmt 结构体是在 PostgreSQL 数据库中用于表示 VACUUM 和 ANALYZE 命令的数据结构。它在数据库源代码中定义，用于存储 VACUUM 和 ANALYZE 命令的各种参数和选项。以下是 VacuumStmt 结构体的定义：（路径：src/include/nodes/parsenodes.h）

typedef struct VacuumStmt {
    NodeTag type;            /* 结构体类型标签 */
    int options;             /* VacuumOption 标志的按位 OR */
    int flags;               /* 用于区分分区或 B 树的标志 */
                             /* 这些标志的值在 vacuum.h 中定义 */
    Oid rely_oid;            /* 对于 B 树，是堆 B 树的 OID，否则为 InvalidOid */
    int freeze_min_age;      /* 最小冻结年龄，-1 表示使用默认值 */
    int freeze_table_age;    /* 扫描整个表的年龄 */
    RangeVar* relation;      /* 要处理的单个表，或者为 NULL */
    List* va_cols;           /* 列名列表，为 NIL 表示所有列 */

    Relation onepartrel;     /* 用于跟踪已打开的关系 */
    Partition onepart;       /* 用于跟踪已打开的分区 */
    List* partList;          /* 分区列表 */
#ifdef PGXC
    void* HDFSDnWorkFlow;    /* @hdfs HDFSDnWorkFlow 存储分析操作相关信息 */
#endif
    bool isForeignTables;     /* @hdfs 当运行 "analyze [verbose] foreign table;" 命令时为 true */
    bool isPgFdwForeignTables; /* 当外部表的 fdw 是 gc_fdw 时为 true */
#ifdef ENABLE_MOT
    bool isMOTForeignTable;   /* 当前是否是 MOT 外部表 */
#endif

    /*
     * @hdfs
     * 参数 totalFileCnt 和 nodeNo 是由 CNSchedulingForAnalyze 设置的
     * CNSchedulingForAnalyze(
     *     int *totalFilesCnt,
     *     int *nodeNo,
     *     Oid foreignTableId)
     */
    unsigned int totalFileCnt; /* @hdfs 分析外部表操作中要采样的文件数 */
    int nodeNo;                /* @hdfs 哪个数据节点将执行分析操作，
                                  @global 统计：其他协调器将从哪个协调器节点获取统计信息。 */

    /*
     * @hdfs 数据节点总数，我们使用这个数字来调整存储在 pg_class 中的 reltuples 数量
     * 例如：我们执行操作 "analyze tablename"，有 x 个数据节点，而 tablename 是一个 HDFS 外部表。
     * 数据节点完成分析命令，协调器从数据节点获取元组数信息。这个数是总元组数的 1/x。在协调器中将这个数值调整为真实值。
     */
    unsigned int DnCnt;

    /*
     * 添加全局统计的参数。
     */
    DestReceiver* dest;       /* 用于数据节点将样本行发送到协调器。 */
    int num_samples;          /* 从数据节点接收的样本行数。 */
    HeapTuple* sampleRows;    /* 从数据节点接收的样本行。 */
    TupleDesc tupleDesc;      /* 普通表的样本行的元组描述符。 */
    int tableidx;             /* 设置当前需要设置样本率或总行数的表索引 */
    GlobalStatInfoEx pstGlobalStatEx[ANALYZE_MODE_MAX_NUM - 1]; /* 全局统计的辅助信息，扩展以识别 HDFS 表。 */
    unsigned int orgCnNodeNo; /* 标识哪个协调器从客户端接收分析命令，其他协调器需要从它获取统计信息。 */
    List* hdfsforeignMapDnList; /* 标识属于分片映射的一些数据节点，用于协调器从它们获取总 reltuples。 */
    bool sampleTableRequired;   /* 需要样本表以获取统计信息。 */
    List* tmpSampleTblNameList; /* 在调试期间识别样本表名称。 */
    bool isAnalyzeTmpTable;     /* 如果分析的表是临时表，则为 true。 */
#ifdef PGXC
    DistributionType disttype; /* 分析表的分布类型。 */
#endif
    AdaptMem memUsage;         /* 分配给语句的自适应内存 */
    Oid curVerifyRel;          /* 当前的关系用于数据库模式以发送远程查询 */
    bool isCascade;            /* 用于验证表 */
} VacuumStmt;

Relation 结构体

RelationData 结构体包含了关系的各种属性，如物理标识符、缓存信息、元组描述、索引信息、触发器信息等。这个数据结构在数据库系统中用于管理关系的元数据和缓存信息，以提高查询性能和管理操作的效率。下面详细解释一下 RelationData 数据结构的作用：

元数据存储： RelationData 存储了关系的元数据，如物理标识符、元组描述、关系的对象ID等。这些信息对于数据库的正常操作是必需的，它们被用于查询优化、访问控制、数据完整性维护等。

缓存管理：关系的部分数据被缓存在 RelationData 中，以提高查询性能。例如，索引元组、触发器信息等可能被缓存在这个数据结构中，避免了频繁的磁盘访问。

查询优化：关系的统计信息、索引信息等可以帮助查询优化器选择最优的查询计划。RelationData 中的信息可以帮助数据库系统评估不同查询计划的代价，并选择最佳的执行路径。

元数据操作：数据库系统需要在运行时处理与关系相关的操作，如表的创建、删除、修改等。RelationData 中的元数据信息可以帮助数据库系统执行这些操作，确保数据的一致性和完整性。

缓存管理与复用：数据库系统会缓存 RelationData 数据结构，避免了频繁的元数据查询和磁盘访问。这样可以减少系统开销，提高操作的效率。

触发器和约束管理： RelationData 存储了关于触发器、约束和重写规则的信息，这些信息在数据修改时起着关键作用。例如，插入、更新或删除数据时，系统需要检查关联的触发器和约束，确保数据的一致性。

统计信息收集：数据库系统需要收集关于关系的统计信息，以便查询优化器进行成本估算和执行计划选择。这些统计信息可以存储在 RelationData 中，供系统使用。

分布式数据库管理：对于分布式数据库系统，RelationData 可以包含与分布式定位、切片映射等相关的信息。这有助于系统进行查询路由和数据分布。

Relation 结构体函数源码如下：（路径：src/include/utils/rel.h）

typedef struct RelationData* Relation;

typedef struct RelationData {

    RelFileNode rd_node; // 关系的物理标识符
    struct SMgrRelationData* rd_smgr; // 缓存的文件句柄，或者为NULL
    int rd_refcnt; // 引用计数
    BackendId rd_backend; // 拥有该临时关系的后端ID
    bool rd_isscannable; // 关系是否可被扫描
    bool rd_isnailed; // 关系是否固定在缓存中
    bool rd_isvalid; // 关系缓存条目是否有效
    char rd_indexvalid; // rd_indexlist的状态: 0 = 无效, 1 = 有效, 2 = 临时强制
    bool rd_islocaltemp; // 关系是否是本会话的临时关系

    SubTransactionId rd_createSubid; // 关系在当前事务中被创建的最高子事务ID
    SubTransactionId rd_newRelfilenodeSubid; // 关系文件节点变更在当前事务中生存的最高子事务ID

    Form_pg_class rd_rel; // RELATION元组
    TupleDesc rd_att; // 元组描述
    Oid rd_id; // 关系的对象ID

    LockInfoData rd_lockInfo; // 锁管理器用于锁定关系的信息
    RuleLock* rd_rules; // 重写规则
    MemoryContext rd_rulescxt; // rd_rules的私有内存上下文，如果有的话
    TriggerDesc* trigdesc; // 触发器信息，如果关系没有触发器则为NULL
    struct RlsPoliciesDesc* rd_rlsdesc; // 行级安全策略，如果没有则为NULL
    List* rd_indexlist; // 关系上的索引OID列表
    Oid rd_oidindex; // 唯一索引的OID，如果有的话
    Oid rd_refSynOid; // 映射关系的参考同义词OID，如果有的话

    Bitmapset* rd_indexattr; // 用于标识在索引中使用的列
    Bitmapset* rd_idattr; // 在复制标识索引中的列

    Oid rd_replidindex; // 关系的复制标识索引的OID，只有在调用RelationGetIndexList/rd_indexvalid > 0时才会设置

    bytea* rd_options; // 解析后的pg_class.reloptions

    Oid rd_partHeapOid; // 分区索引的分区OID
    Form_pg_index rd_index; // 描述该索引的pg_index元组
    struct HeapTupleData* rd_indextuple; // 所有pg_index元组
    Form_pg_am rd_am; // 用于索引的pg_am元组
    int rd_indnkeyatts; // 索引关系的索引键数量
    TableAmType rd_tam_type; // 表访问器方法类型

    MemoryContext rd_indexcxt; // 用于这些信息的私有内存上下文
    RelationAmInfo* rd_aminfo; // 在pg_am中找到的函数的查找信息
    Oid* rd_opfamily; // 每个索引列的操作族OID
    Oid* rd_opcintype; // 每个操作类声明的输入数据类型的OID
    RegProcedure* rd_support; // 支持函数的OID
    FmgrInfo* rd_supportinfo; // 支持函数的查找信息
    int16* rd_indoption; // 每列的AM特定标志
    List* rd_indexprs; // 索引表达式树，如果有的话
    List* rd_indpred; // 索引谓词树，如果有的话
    Oid* rd_exclops; // 排除运算符的OID，如果有的话
    Oid* rd_exclprocs; // 排除运算符的处理函数的OID，如果有的话
    uint16* rd_exclstrats; // 排除运算符的策略编号，如果有的话
    void* rd_amcache; // 索引AM可用的缓存数据
    Oid* rd_indcollation; // 索引的排序规则OID

    struct FdwRoutine* rd_fdwroutine; // 缓存的函数指针，或者为NULL

    Oid rd_toastoid; // 真实TOAST表的OID，或者为InvalidOid
    Oid rd_bucketoid; // 在pg_hashbucket中的bucket OID

    RelationBucketKey* rd_bucketkey; // 指示哪些键用于计算哈希值的bucket键信息

    PartitionMap* partMap; // 分区映射信息
    Oid parentId; // 如果由partitionGetRelation构建，这是分区OID，否则为InvalidOid

    struct PgStat_TableStatus* pgstat_info; // 统计信息收集区域

#ifdef PGXC
    RelationLocInfo* rd_locator_info; // 分布式表定位信息
    PartitionMap* sliceMap; // 切片映射信息
#endif
    Relation parent; // 父关系

    dlist_node node; // 双向链表节点，分区和bucket关系将存储在资源所有者的fakerels列表中

    Oid rd_mlogoid; // mlog的OID
} RelationData;

代码段解读

    /*
     * Open the relation, getting ShareUpdateExclusiveLock to ensure that two
     * ANALYZEs don't run on it concurrently.  (This also locks out a
     * concurrent VACUUM, which doesn't matter much at the moment but might
     * matter if we ever try to accumulate stats on dead tuples.) If the rel
     * has been dropped since we last saw it, we don't need to process it.
     */
    if ((vacuumRelation(vacstmt->flags) || vacuumMainPartition(vacstmt->flags)) &&
        !(vacstmt->options & VACOPT_NOWAIT)) {
        onerel = try_relation_open(relid, lockmode);
        GetLock = true;
    } else if ((vacuumRelation(vacstmt->flags) || vacuumMainPartition(vacstmt->flags)) &&
               ConditionalLockRelationOid(relid, lockmode)) {
        onerel = try_relation_open(relid, NoLock);
        GetLock = true;
    }

这段代码是函数 analyze_get_relation 中的一部分，用于根据一些条件获取关系的 RelationData 结构，并根据需要获取锁。以下是逐行解释：

此行开始一个条件判断块。它首先检查 vacstmt->flags 是否表示需要进行 VACUUM 操作，或者是否需要针对主分区执行 VACUUM 操作。同时，它还检查 vacstmt->options 是否未设置 VACOPT_NOWAIT 标志，以确定是否可以进行等待式的操作。

if ((vacuumRelation(vacstmt->flags) || vacuumMainPartition(vacstmt->flags)) &&
    !(vacstmt->options & VACOPT_NOWAIT)) {

如果上述条件为真，表示满足进行 VACUUM 操作的条件，且不需要立即操作（即允许等待），那么这段代码尝试以指定的锁模式打开关系。try_relation_open 是一个函数，用于尝试打开关系并返回关系的 RelationData 结构。同时，将 GetLock 标志设置为 true，表示成功获取锁。

onerel = try_relation_open(relid, lockmode);
GetLock = true;

如果上述条件不满足，这里开始另一个条件判断块。它再次检查是否满足进行 VACUUM 操作的条件，同时尝试使用 ConditionalLockRelationOid 函数以指定的锁模式对关系进行条件性加锁。

} else if ((vacuumRelation(vacstmt->flags) || vacuumMainPartition(vacstmt->flags)) &&
           ConditionalLockRelationOid(relid, lockmode)) {

如果上述条件为真，表示虽然无法立即获取锁，但满足进行 VACUUM 操作的条件，那么这段代码尝试以无锁模式打开关系。然后将 GetLock 标志设置为 true，表示成功获取锁。

onerel = try_relation_open(relid, NoLock);
GetLock = true;

在这段代码中，根据不同的情况，会尝试以不同的锁模式打开关系，从而为后续的操作获取关系的 RelationData 结构。

try_relation_open 函数

try_relation_open 函数的作用是尝试以指定的锁模式打开一个数据库关系（表、索引等）。与普通的 relation_open 不同，try_relation_open 不会在关系不存在时抛出错误，而是返回 NULL。这在一些情况下很有用，例如在执行某些操作之前，需要确认关系是否存在，如果存在则打开关系并执行操作，如果不存在则不进行任何操作。
try_relation_open 函数源码如下：（路径：src/gausskernel/storage/access/heap/heapam.cpp）

/* ----------------
 *		try_relation_open - open any relation by relation OID
 *
 *		Same as relation_open, except return NULL instead of failing
 *		if the relation does not exist.
 * ----------------
 */
Relation try_relation_open(Oid relationId, LOCKMODE lockmode)
{
    Relation r;

    Assert(lockmode >= NoLock && lockmode < MAX_LOCKMODES);

    /* Get the lock first */
    if (lockmode != NoLock) {
        LockRelationOid(relationId, lockmode);
    }

    /*
     * Now that we have the lock, probe to see if the relation really exists
     * or not.
     */
    if (!SearchSysCacheExists1(RELOID, ObjectIdGetDatum(relationId))) {
        /* Release useless lock */
        if (lockmode != NoLock) {
            UnlockRelationOid(relationId, lockmode);
        }

        return NULL;
    }

    /* Should be safe to do a relcache load */
    r = RelationIdGetRelation(relationId);
    if (!RelationIsValid(r)) {
        ereport(ERROR,
                (errcode(ERRCODE_RELATION_OPEN_ERROR), errmsg("could not open relation with OID %u", relationId)));
    }

    /* Make note that we've accessed a temporary relation */
    if (RelationUsesLocalBuffers(r)) {
        t_thrd.xact_cxt.MyXactAccessedTempRel = true;
    }
    /* Make note that we've accessed a repliacted relation */
    if (r->rd_locator_info != NULL && IsRelationReplicated(r->rd_locator_info)) {
        t_thrd.xact_cxt.MyXactAccessedRepRel = true;
    }
    pgstat_initstats(r);

    return r;
}

ConditionalLockRelationOid 函数

ConditionalLockRelationOid 函数是用于在非阻塞的情况下尝试获取指定关系的锁，并在成功获取锁时返回 true，否则返回 false。这种非阻塞的锁获取适用于那些不希望等待的场景，以避免出现长时间的阻塞。ConditionalLockRelationOid 函数源码如下：（路径：src/gausskernel/storage/lmgr/lmgr.cpp）

/*
 *		ConditionalLockRelationOid
 *
 * As above, but only lock if we can get the lock without blocking.
 * Returns TRUE iff the lock was acquired.
 *
 * NOTE: we do not currently need conditional versions of all the
 * LockXXX routines in this file, but they could easily be added if needed.
 */
bool ConditionalLockRelationOid(Oid relid, LOCKMODE lockmode)
{
    LOCKTAG tag;
    LockAcquireResult res;
	
	// 设置锁标签，标识要锁定的关系，这里使用关系的对象标识符作为锁的标签。
    SetLocktagRelationOid(&tag, relid);

	// 尝试获取指定标签和锁模式的锁
    res = LockAcquire(&tag, lockmode, false, true);
    if (res == LOCKACQUIRE_NOT_AVAIL) {
        return false;
    }

    /*
     * Now that we have the lock, check for invalidation messages; see notes
     * in LockRelationOid.
     */
    // 检查锁获取的结果，如果结果是 LOCKACQUIRE_NOT_AVAIL，表示锁不可用，无法立即获取，因此返回 false。
    if (res != LOCKACQUIRE_ALREADY_HELD || u_sess->inval_cxt.deepthInAcceptInvalidationMessage > 0)
        AcceptInvalidationMessages();

    return true;
}

analyze_rel_internal 函数

analyze_rel_internal 函数用于分析一个关系（表），它接收一个待分析的关系、分析或清理命令的语句信息、缓冲区访问策略、分析类型以及用于 DFS 表、增量表或复杂表的样本行信息作为参数。
换句话说，analyze_rel_internal 函数的主要作用是执行对指定的关系（表或索引）进行分析操作。分析操作旨在更新关系的统计信息，以便优化查询执行计划，提高数据库查询性能。通过分析关系的数据分布、数据密度等信息，数据库系统可以更好地选择查询执行计划，从而避免不必要的磁盘访问和资源浪费。
analyze_rel_internal 函数源码如下：（路径：src/gausskernel/optimizer/commands/analyze.cpp）

/*
 * Description: 分析单个关系的入口函数。
 *
 * Parameters:
 *  @in onerel: 待分析的关系
 *  @in vacstmt: 分析或清理命令的语句信息
 *  @in bstrategy: 缓冲区访问策略对象
 *  @in analyzemode: 表的分析类型（普通表、DFS 表或增量表）
 *  @in pstHdfsSampleRows: 用于 DFS 表、增量表或复杂表的样本行信息
 */
static void analyze_rel_internal(Relation onerel, VacuumStmt* vacstmt, BufferAccessStrategy bstrategy,
    AnalyzeMode analyzemode, GBLSTAT_HDFS_SAMPLE_ROWS* pstHdfsSampleRows)
{
	// 定义一个函数指针变量，用于指向获取样本行数据的函数
    AcquireSampleRowsFunc acquirefunc = NULL;
    // 初始化错误级别和消息级别
    int elevel;
    int messageLevel;
    // 初始化关系页面数和分区列表
    BlockNumber relpages = 0;
    List* partList = NIL;
    // 根据是否需要估算总行数，选择适当的锁模式
    LOCKMODE lockmode = NEED_EST_TOTAL_ROWS_DN(vacstmt) ? AccessShareLock : ShareUpdateExclusiveLock;

    AssertEreport(onerel, MOD_OPT, "在进行分析时 onerel 不应为 NULL");

    /* 设置静态变量 */
    u_sess->analyze_cxt.vac_strategy = bstrategy;
	
	// 设置日志消息级别为 WARNING
    messageLevel = WARNING;
    // 当需要输出日志消息时，消息的严重程度将设置为 DEBUG2
    elevel = DEBUG2;

    if (vacstmt->options & VACOPT_VERBOSE) {
        messageLevel = VERBOSEMESSAGE;
        elevel = VERBOSEMESSAGE;
    }

    /*
     * 检查权限，这应与 VACUUM 的检查相匹配！
     */
    // 检查当前用户是否具有执行 VACUUM 操作的权限
    AclResult aclresult = pg_class_aclcheck(RelationGetPgClassOid(onerel, false), GetUserId(), ACL_VACUUM);
    // 如果用户没有执行 VACUUM 操作的权限，并且不满足下面几种特殊情况，将输出相应的警告信息
    if (aclresult != ACLCHECK_OK && !(pg_class_ownercheck(RelationGetPgClassOid(onerel, false), GetUserId()) ||
            (pg_database_ownercheck(u_sess->proc_cxt.MyDatabaseId, GetUserId()) && !onerel->rd_rel->relisshared) ||
                (isOperatoradmin(GetUserId()) && u_sess->attr.attr_security.operation_mode))) {
        /* 如果在 VACUUM 过程中已经有相应的警告，无需再次输出 WARNING */
        if (!(vacstmt->options & VACOPT_VACUUM)) {
            if (onerel->rd_rel->relisshared)
                ereport(messageLevel,
                    (errmsg("跳过 \"%s\" --- 只有系统管理员可以对其进行分析", RelationGetRelationName(onerel))));
            else if (onerel->rd_rel->relnamespace == PG_CATALOG_NAMESPACE)
                ereport(messageLevel,
                    (errmsg("跳过 \"%s\" --- 只有系统管理员或数据库所有者可以对其进行分析",
                        RelationGetRelationName(onerel))));
            else
                ereport(messageLevel,
                    (errmsg("跳过 \"%s\" --- 只有表或数据库所有者可以对其进行分析",
                        RelationGetRelationName(onerel))));
        }

        relation_close(onerel, lockmode);

        return;
    }

    /*
     * 静默地忽略其他后端的临时表 --- 对它们进行分析相当无意义，因为它们的内容可能在磁盘上不是最新的。
     * （我们不在此处抛出警告；这只会在数据库范围的 ANALYZE 过程中引起冗余。）
     */
    if (RELATION_IS_OTHER_TEMP(onerel)) {
        relation_close(onerel, lockmode);
        return;
    }

    if (RELATION_IS_GLOBAL_TEMP(onerel) && !gtt_storage_attached(RelationGetRelid(onerel))) {
        relation_close(onerel, ShareUpdateExclusiveLock);
        return;
    }

    /*
     * 我们可以对任何表执行 ANALYZE，除了 pg_statistic。参见 update_attstats
     */
    // 检查当前关系是否是 pg_statistic 表
    if (RelationGetRelid(onerel) == StatisticRelationId) {
    	// 断言 pg_statistic 表不应该是分区表
        AssertEreport(RelationIsNonpartitioned(onerel), MOD_OPT, "pg_statistic 不应为分区表。");

        if (!IsInitdb && !IS_SINGLE_NODE) {
            elog(WARNING, "系统目录 pg_statistic 不能进行分析，将跳过。");
        }

		// 关闭当前关系并释放对应的锁，然后返回
        relation_close(onerel, lockmode);
        return;
    }

    /*
     * 检查是否为普通表或外部表；我们以前在 get_rel_oids() 中进行了此检查，但在锁定关系之后检查似乎更安全。
     */
    if (onerel->rd_rel->relkind == RELKIND_RELATION ||
        onerel->rd_rel->relkind == RELKIND_MATVIEW) {
        /* 普通表，所以我们将使用常规的行获取函数 */
        /* 还会获取普通表的大小 */
        if (RelationIsPartitioned(onerel)) {
            Partition part = NULL;
            ListCell* partCell = NULL;

            partList = relationGetPartitionList(onerel, lockmode);

            foreach (partCell, partList) {
                part = (Partition)lfirst(partCell);
                relpages += PartitionGetNumberOfBlocks(onerel, part);
            }
        } else {
            relpages = RelationGetNumberOfBlocks(onerel);
        }
    } else if (onerel->rd_rel->relkind == RELKIND_FOREIGN_TABLE 
               || onerel->rd_rel->relkind == RELKIND_STREAM) {
        /*
         * @hdfs
         * 对于外部表，调用 FDW 的钩子函数来检查是否支持分析。
         */
        bool retValue = false;
        FdwRoutine* fdwroutine = GetFdwRoutineForRelation(onerel, false);

        /* 是否支持分析操作 */
        if (NULL != fdwroutine->AnalyzeForeignTable) {
            /* 是否实现了 GetFdwType 接口，以及文件类型是否为 HDFS_ORC */
            if (isObsOrHdfsTableFormTblOid(RelationGetRelid(onerel)) ||
                (IS_OBS_CSV_TXT_FOREIGN_TABLE(RelationGetRelid(onerel)) && !isWriteOnlyFt(RelationGetRelid(onerel)))) {
                /* 传递 AnalyzeForeignTable 所需的数据 */
                retValue = fdwroutine->AnalyzeForeignTable(
                    onerel, &acquirefunc, &relpages, (void*)vacstmt->HDFSDnWorkFlow, false);
            } else {
                /* 其他类型的外部表 */
                retValue = fdwroutine->AnalyzeForeignTable(onerel, &acquirefunc, &relpages, 0, false);
            }

            if (!retValue) {
                /* 对于 mysql_fdw，抑制警告信息 */
                messageLevel = isMysqlFDWFromTblOid(RelationGetRelid(onerel)) ? LOG : messageLevel;
                ereport(messageLevel,
                    (errmsg(
                        "跳过 \"%s\" --- 无法对该外部表进行分析。", RelationGetRelationName(onerel))));
                relation_close(onerel, lockmode);
                return;
            }

        } else {
            ereport(messageLevel,
                (errmsg("表 %s 不支持分析操作。", RelationGetRelationName(onerel))));
            relation_close(onerel, lockmode);
            return;
        }
    } else {
        /* 如果在 VACUUM 过程中已经有相应的警告，无需再次输出 WARNING */
        if (!(vacstmt->options & VACOPT_VACUUM))
            ereport(messageLevel,
                (errmsg("跳过 \"%s\" --- 无法分析非表或特殊系统表",
                    RelationGetRelationName(onerel))));

        if (RelationIsPartitioned(onerel)) {
            releasePartitionList(onerel, &partList, lockmode);
        }

        relation_close(onerel, lockmode);
        return;
    }

    /*
     * 好了，开始分析。首先告诉其他后端我在进行 ANALYZE。
     */
    LWLockAcquire(ProcArrayLock, LW_EXCLUSIVE);
    t_thrd.pgxact->vacuumFlags |= PROC_IN_ANALYZE;
    LWLockRelease(ProcArrayLock);

    /* 同时获取普通表的大小 */
    if (RelationIsPartitioned(onerel)) {
        vacstmt->partList = partList;
    }

    /*
     * 执行常规的非递归 ANALYZE。
     */
    do_analyze_rel(onerel, vacstmt, relpages, false, elevel, analyzemode, pstHdfsSampleRows);

    /*
     * 如果有子表，则执行递归的 ANALYZE。
     */
    if (RelationIsPAXFormat(onerel))
        do_analyze_rel(onerel, vacstmt, relpages, true, elevel, ANALYZECOMPLEX, pstHdfsSampleRows);

    /*
     * 现在关闭源关系，但保留锁，以便在提交之前没有人删除它。
     * （如果有人这样做，他们将无法清除我们在 pg_statistic 中创建的条目。
     * 此外，在提交之前释放锁会使我们暴露于 update_attstats 中的并发更新失败。）
     */
    if (RelationIsPartitioned(onerel)) {
        releasePartitionList(onerel, &partList, NoLock);
    }

    relation_close(onerel, NoLock);

    /*
     * 重置我的 PGXACT 标志。注意：我们需要在此处进行，而不是在 vacuum_rel 中，因为 end-of-xact 代码会清除 vacuum 标志。
     */
    LWLockAcquire(ProcArrayLock, LW_EXCLUSIVE);
    t_thrd.pgxact->vacuumFlags &= ~PROC_IN_ANALYZE;
    LWLockRelease(ProcArrayLock);
}

函数 analyze_rel_internal 的入参解释如下：

Relation onerel: 要进行统计分析的目标关系（表或索引）的 Relation 结构。它包含了关于该关系的元数据和状态信息。

VacuumStmt* vacstmt: VACUUM 或 ANALYZE 命令的信息和选项。它是对 VACUUM 或 ANALYZE 命令的解析和处理的结果，包含了执行这些操作所需的信息。

BufferAccessStrategy bstrategy: 缓冲区访问策略对象，用于执行缓冲区管理相关操作，如预读取数据块。

AnalyzeMode analyzemode: 统计分析模式，表示当前是进行正常的统计分析还是其他特定模式，比如针对列存表的特殊分析。源码定义如下：（路径：src/include/nodes/parsenodes.h）

/*
 * Currently, the HDFS table need collect three statistics information
 * in pg_statistic. we define AnalyzeMode enum strunct to realize global
 * analyze.
 * ANALYZENORMAL：普通的分析模式，执行常规的分析命令。
 * ANALYZEMAIN：主要模式，在执行全局分析时，仅收集 HDFS 表的统计信息。
 * ANALYZEDELTA：增量模式，在执行全局分析时，仅收集 Delta 表的统计信息。
 * ANALYZECOMPLEX：复合模式，在执行全局分析时，同时收集 HDFS 表和 Delta 表的统计信息。
 */
typedef enum AnalyzeMode { ANALYZENORMAL = 0, ANALYZEMAIN = 1, ANALYZEDELTA = 2, ANALYZECOMPLEX = 3 } AnalyzeMode;

GBLSTAT_HDFS_SAMPLE_ROWS* pstHdfsSampleRows: 一个结构体指针，用于保存特定于列存表分析的信息。在正常情况下，对于非列存表的分析，该参数通常为 NULL。

BufferAccessStrategy 结构体

BufferAccessStrategy 结构体用于管理一个循环的共享缓冲区，以便进行重用。这个结构体中存储了私有（非共享）状态，用于实现缓冲区访问策略。函数源码如下：（路径：src/include/storage/buf/bufmgr.h）

/*
 * Buffer access strategy objects.
 */
typedef struct BufferAccessStrategyData* BufferAccessStrategy;


/*
 * Private (non-shared) state for managing a ring of shared buffers to re-use.
 * This is currently the only kind of BufferAccessStrategy object, but someday
 * we might have more kinds.
 */
typedef struct BufferAccessStrategyData {
    /* Overall strategy type */
    // 缓冲区访问策略的类型
    BufferAccessStrategyType btype;
    /* Number of elements in buffers[] array */
    // 循环缓冲区中的槽数量
    int ring_size;

    /*
     * Index of the "current" slot in the ring, ie, the one most recently
     * returned by GetBufferFromRing.
     */
    // 当前槽位在循环缓冲区中的索引，即最近由 GetBufferFromRing 返回的槽位
    int current;

    /* Number of elements to flush behind current */
    // 刷新当前槽位后面的槽位数量
    int flush_rate;

    /*
     * True if the buffer just returned by StrategyGetBuffer had been in the
     * ring already.
     */
    // 一个标志位，表示最近由 StrategyGetBuffer 返回的缓冲区是否已经存在于循环缓冲区中
    bool current_was_in_ring;

    /*
     * Array of buffer numbers.  InvalidBuffer (that is, zero) indicates we
     * have not yet selected a buffer for this ring slot.  For allocation
     * simplicity this is palloc'd together with the fixed fields of the
     * struct.
     */
    // 一个数组，存储着缓冲区的编号
    Buffer buffers[FLEXIBLE_ARRAY_MEMBER]; /* VARIABLE SIZE ARRAY */
} BufferAccessStrategyData;

GBLSTAT_HDFS_SAMPLE_ROWS 结构体

GBLSTAT_HDFS_SAMPLE_ROWS 结构体用于存储全局统计信息中的 HDFS 表的样本行数据。这个结构体的作用是在执行全局统计分析时，收集 HDFS 表的样本数据，以便计算并更新统计信息。
GBLSTAT_HDFS_SAMPLE_ROWS 结构体的目的是在进行全局统计分析时，有效地管理和存储 HDFS 表的样本数据，以便后续计算和更新全局统计信息。样本数据对于估计表的大小、选择查询计划等都非常重要，因此结构体的设计有助于高效地收集和管理这些关键信息。函数源码如下：（路径：src/include/nodes/parsenodes.h）

/* All sample rows of HDFS table for global stats. */
typedef struct {
	// 用于存储样本行数据的内存上下文。在执行全局统计分析时，会在这个上下文中分配内存来存储样本行数据
    MemoryContext hdfs_sample_context;                 /* using to save sample rows. */
    // 总样本行计数，包括 DFS 表和 Delta 表的样本行数量。用于记录样本行的总数，以便后续在计算统计信息时使用。
    double totalSampleRowCnt;                          /* total sample row count include dfs table and delta table */
    // 一个数组，包含了不同模式（包括 HDFS 表和 Delta 表）下的样本行数据。ANALYZECOMPLEX 表示复合模式，其中包含 HDFS 表和 Delta 表的样本数据。
    HDFS_SAMPLE_ROWS stHdfsSampleRows[ANALYZECOMPLEX]; /* sample rows include dfs table and delta table. */
} GBLSTAT_HDFS_SAMPLE_ROWS;

do_analyze_rel 函数

do_analyze_rel 函数的作用是对给定的表进行分析（analyze）操作。do_analyze_rel 函数是分析过程中的核心部分，负责对指定表进行统计分析，获取样本数据并计算统计信息，然后更新相关的系统表信息。这个函数在分析过程中处理了许多细节，包括以下主要步骤：

初始化准备：设置函数中需要用到的各种变量，如属性统计信息、索引信息、目标行数等。根据分析模式确定表的索引。

检查权限：检查当前用户是否有足够的权限对表进行分析。如果没有权限，根据情况输出相应的警告信息。

排除特殊表：如果正在分析的是统计信息表（pg_statistic），则输出警告并跳过分析，因为统计信息表不应该是分区表。

获取目标行数：根据分析模式、表的属性信息等，计算需要分析的目标行数。

获取样本行数据：根据目标行数，从表中获取样本行数据用于统计分析。如果需要在数据节点上获取样本行数据，则从数据节点获取。

计算统计信息：对样本行数据进行统计分析，计算各列的统计信息，包括最小值、最大值、均值等。

更新统计信息：将计算得到的统计信息更新到系统目录表 pg_statistic 中。

更新 pg_class 信息：更新表的 pg_class 表中的统计信息，包括行数、死行数等。

报告进度：根据需要，向统计收集器报告分析进度。

清理操作：根据分析选项进行必要的清理，关闭索引等。

记录日志：如果自动分析进程启动且满足日志记录条件，则记录分析操作的日志。

完成分析：完成分析操作，包括回收资源和上下文。

do_analyze_rel 函数源码如下：（路径：src/gausskernel/optimizer/commands/analyze.cpp）

入参解释：

Relation onerel：要分析的关系（表）的 Relation 结构体，表示要对哪个关系执行分析操作。

VacuumStmt* vacstmt：包含有关分析的信息和选项的结构体，这些信息包括要分析的对象、分析选项等。

BlockNumber relpages：关系（表）的总块数（页数），表示该表的大小。

bool inh：指示是否对整个继承树进行分析，即是否包括所有子表。

int elevel：用于指定在错误报告和日志消息中使用的错误级别，表示消息的重要性。

AnalyzeMode analyzemode：分析模式的枚举，指示分析的类型，如NORMAL、MAIN、DELTA等。

GBLSTAT_HDFS_SAMPLE_ROWS* pstHdfsSampleRows：一个结构体指针，用于保存全局统计信息和样本行数据，特别是用于处理 HDFS 表的情况。

/*
 *	do_analyze_rel() -- analyze one relation, recursively or not
 *
 * Note that "acquirefunc" is only relevant for the non-inherited case.
 * If we supported foreign tables in inheritance trees,
 * acquire_inherited_sample_rows would need to determine the appropriate
 * acquirefunc for each child table.
 */
static void do_analyze_rel(Relation onerel, VacuumStmt* vacstmt, BlockNumber relpages, bool inh, int elevel,
    AnalyzeMode analyzemode, GBLSTAT_HDFS_SAMPLE_ROWS* pstHdfsSampleRows)
{
	// 初始化各种变量和上下文信息
	int attr_cnt = 0;                        // 属性数量初始化为0
	int i = 0;                               // 循环计数器初始化为0
	Relation* Irel = NULL;                   // 索引关系（表）指针数组初始化为NULL
	int nindexes = 0;                        // 索引数量初始化为0
	bool hasindex = false;                   // 是否有索引初始化为false
	VacAttrStats** vacattrstats = NULL;      // 属性统计信息指针数组初始化为NULL
	AnlIndexData* indexdata = NULL;          // 索引统计信息指针初始化为NULL
	int64 numrows = 0;                       // 估计的总行数初始化为0
	int64 targrows = 0;                      // 目标采样行数初始化为0
	double totalrows = 0;                    // 总行数初始化为0
	double totaldeadrows = 0;                // 死亡行数初始化为0
	HeapTuple* rows = NULL;                  // 堆元组指针数组初始化为NULL
	PGRUsage ru0;                            // 进程资源使用情况结构体
	TimestampTz starttime = 0;               // 起始时间初始化为0
	MemoryContext caller_context = NULL;     // 调用者上下文初始化为NULL
	Oid save_userid = 0;                     // 保存用户ID初始化为0
	int save_sec_context = 0;                // 保存安全上下文初始化为0
	int save_nestlevel = 0;                  // 保存嵌套层级初始化为0
	
	// 根据不同的分析模式设置对应的表索引
	int tableidx = (analyzemode == ANALYZENORMAL) ? analyzemode : (analyzemode - 1);
	vacstmt->tableidx = tableidx;

	/*
	 * (1) 针对复制表
	 * 不支持复制表的百分比采样模式，
	 * 而我们在扩展统计信息中需要使用这种模式，
	 * 所以，当检测到扩展统计信息时，我们让数据节点使用百分比采样模式，
	 * 这样协调节点可以从数据节点获取统计信息。
	 *
	 * (2) 检查扩展统计信息的可用性
	 */
	bool replicate_needs_extstats = false; // 标识复制表是否需要扩展统计信息
	// 检查扩展统计信息的可用性
	es_check_availability_for_table(vacstmt, onerel, inh, &replicate_needs_extstats);

    if (inh)
        ereport(elevel,
            (errmsg("analyzing \"%s.%s\" inheritance tree",
                get_namespace_name(RelationGetNamespace(onerel)),
                RelationGetRelationName(onerel))));
    else
        ereport(elevel,
            (errmsg("analyzing \"%s.%s\"",
                get_namespace_name(RelationGetNamespace(onerel)),
                RelationGetRelationName(onerel))));

    caller_context = do_analyze_preprocess(onerel->rd_rel->relowner,     // 当前关系的所有者
	    &ru0,                // 存储资源使用情况信息的结构体
	    &starttime,          // 分析开始时间
	    &save_userid,        // 保存的用户 ID
	    &save_sec_context,   // 保存的安全上下文信息
	    &save_nestlevel,     // 保存的嵌套级别
	    analyzemode,         // 分析模式（NORMAL、MAIN、DELTA、COMPLEX）
	    pstHdfsSampleRows    // HDFS 表的全局样本行信息
);

    /* Ready and construct for all attributes info in order to compute statistic. */
    /* 准备并构建用于计算统计信息的所有属性信息。 */
    vacattrstats =
        get_vacattrstats_by_vacstmt(onerel, vacstmt, &attr_cnt, &nindexes, &indexdata, &hasindex, inh, &Irel);

	/*
	 * 如果没有初始化的 VacAttrStats 实例，停止分析过程。
	 * 这会发生在使用 'analyze t ((a, b))' 收集扩展统计信息时，
	 * 当将 default_statistics_target 设置为正数时。
	 */
	if (attr_cnt <= 0) {
	    // 关闭索引并进行最终处理
	    vac_close_indexes(nindexes, Irel, NoLock);
	
	    // 完成分析的最终处理，包括内存上下文和安全上下文的恢复
	    do_analyze_finalize(caller_context, save_userid, save_sec_context, save_nestlevel, analyzemode);
	
	    // 如果分析模式小于等于 ANALYZEMAIN
	    if (analyzemode <= ANALYZEMAIN) {
	        // 如果 default_statistics_target 大于等于 0
	        if (default_statistics_target >= 0)
	            // 输出提示信息，建议将 default_statistics_target 设置为负值以收集扩展统计信息
	            elog(INFO, "Please set default_statistics_target to a negative value to collect extended statistics.");
	        else
	            // 输出提示信息，指示没有可用于收集统计信息的列
	            elog(INFO, "No columns in %s can be used to collect statistics.", NameStr(onerel->rd_rel->relname));
	    }
	    // 返回，结束分析过程
	    return;
	}

	/*
	 * 确定需要采样的行数，使用所有可分析列中的最差情况。
	 * 我们使用最低为100行，以避免在Vitter算法中可能出现的溢出情况。
	 * （注意：在没有可分析列的情况下，这也将是目标行数。）
	 */
	targrows = 100;
	
	// 对于每个可分析列，找到最小行数的列，并将其作为目标行数
	for (i = 0; i < attr_cnt; i++) {
	    if (targrows < vacattrstats[i]->minrows)
	        targrows = vacattrstats[i]->minrows;
	}
	
	// 对于每个索引，找到其可分析列中最小行数的列，并将其作为目标行数
	for (int ind = 0; ind < nindexes; ind++) {
	    AnlIndexData* thisdata = &indexdata[ind];
	
	    for (i = 0; i < thisdata->attr_cnt; i++) {
	        if (targrows < thisdata->vacattrstats[i]->minrows)
	            targrows = thisdata->vacattrstats[i]->minrows;
	    }
	}

	 /*
	 * 如果表位于系统范围内或者需要从数据节点获取样本行数据
	 */
	if (onerel->rd_id < FirstNormalObjectId || NEED_GET_SAMPLE_ROWS_DN(vacstmt)) {
	    /*
	     * 协调节点已完成样本率计算，数据节点获取总行数和样本。
	     * 如果样本率大于等于0，表示协调节点应从数据节点获取样本行数据。
	     */
	    if (NEED_GET_SAMPLE_ROWS_DN(vacstmt)) {
	        // 判断是否应使用百分比方式计算样本行数
	        bool use_percent = whether_use_percent(vacattrstats, attr_cnt, nindexes, indexdata);
	
	        if (use_percent) {
	            // 获取总行数、样本行数和其他信息
	            rows = get_total_rows<true>(onerel,
	                vacstmt,
	                relpages,
	                inh,
	                elevel,
	                vacattrstats,
	                attr_cnt,
	                targrows,
	                &totalrows,
	                &totaldeadrows,
	                &numrows,
	                pstHdfsSampleRows,
	                analyzemode);
	            // 将总行数存储在vacstmt结构体中的pstGlobalStatEx字段中
	            vacstmt->pstGlobalStatEx[vacstmt->tableidx].totalRowCnts = totalrows;
	    	}

        // 计算实际的目标行数（targrows）
        targrows =
            get_target_rows(onerel, vacattrstats, attr_cnt, nindexes, indexdata, totalrows, targrows, use_percent);
    	}

        /*
         * 仅为系统表或所有数据节点上的样本率大于1的情况获取目标行数
         */
        rows = get_total_rows<false>(onerel,
            vacstmt,
            relpages,
            inh,
            elevel,
            vacattrstats,
            attr_cnt,
            targrows,
            &totalrows,
            &totaldeadrows,
            &numrows,
            pstHdfsSampleRows,
            analyzemode);
    }

	/*
	 * 如果 sampleRate 为 -1，表示数据节点将估计的总行数发送给协调节点（CN）。
	 */
	if (NEED_EST_TOTAL_ROWS_DN(vacstmt)) {
	    /* 除了 HDFS 和 Delta 复杂模式外，我们应该将估计的总行数发送给协调节点。 */
	    if (analyzemode < ANALYZECOMPLEX) {
	        /* 获取估计的总行数。 */
	        rows = get_total_rows<true>(onerel,
	            vacstmt,
	            relpages,
	            inh,
	            elevel,
	            vacattrstats,
	            attr_cnt,
	            targrows,
	            &totalrows,
	            &totaldeadrows,
	            &numrows,
	            pstHdfsSampleRows,
	            analyzemode);
	
	        // 将估计的总行数保存到 pstGlobalStatEx 结构中
	        vacstmt->pstGlobalStatEx[vacstmt->tableidx].totalRowCnts = totalrows;
	
	        // 计算内存大小（KB），数据节点需要发送给协调节点
	        vacstmt->pstGlobalStatEx[vacstmt->tableidx].topMemSize =
	            compute_com_size(vacstmt, onerel, vacstmt->tableidx) * GetOneTupleSize(vacstmt, onerel) / 1024;
	
	        // 如果是 ANALYZENORMAL 或 ANALYZEMAIN 模式，发送估计的总行数到协调节点
	        if ((analyzemode == ANALYZENORMAL) || (analyzemode == ANALYZEMAIN)) {
	            send_totalrowcnt_to_cn(vacstmt, analyzemode, totalrows);
	        }
	    }

		/*
		 * 如果不是继承关系（非分区表），关闭索引并进行分析后续处理。
		 */
        if (!inh) {
            vac_close_indexes(nindexes, Irel, NoLock);
        }
		
		// 完成分析后的清理工作
        do_analyze_finalize(caller_context, save_userid, save_sec_context, save_nestlevel, analyzemode);

        return;
    }

    /*
     * We need do analyze to compute statistic for sample rows only on datanode or
     * required sample rows on coordinator.
     *
     * collect extended statistic for replicate table will use 'sampletable' method in data-node
     * 如果需要分析样本行数据，且不是为了收集复制表的扩展统计信息
     */
    if (NEED_ANALYZE_SAMPLEROWS(vacstmt) && (!replicate_needs_extstats)) {
	    /*
	     * 计算统计数据。在计算每列的过程中，临时结果存储在子上下文中。
	     * 计算例程负责确保存储在 VacAttrStats 结构中的任何内容都分配在 u_sess->analyze_cxt.analyze_context 中。
	     */
        bool ret = do_analyze_samplerows(onerel,
            vacstmt,
            attr_cnt,
            vacattrstats,
            hasindex,
            nindexes,
            indexdata,
            inh,
            Irel,
            &totalrows,
            &numrows,
            rows,
            analyzemode,
            pstHdfsSampleRows,
            caller_context,
            save_userid,
            save_sec_context,
            save_nestlevel);
	    /*
	     * 如果在本地分析过程中修改了关系的属性，
	     * 则需要返回，因为 caller_context 已经被 finalize。
	     */
        if (!ret) {
            return;
        }
    } else if (NEED_ANALYZE_SAMPLETABLE(vacstmt) || replicate_needs_extstats) {
        if (vacstmt->pstGlobalStatEx[vacstmt->tableidx].totalRowCnts > 0) {
            /*
             * There is a concurrency condition:
             * coordinator received estimate totalRowCnts from all datanodes then estimate sample rate
             * for the first step. And there is insert or delete rows concurrency before coordinator
             * received real totalRowCnts from all datanodes.
             * The sampleRate is not match with the final totalRowCnts, it will result to compute
             * error samplerows and error statistics. So we should compute right sampleRate again.
             */
            (void)compute_sample_size(vacstmt, 0, NULL, onerel->rd_id, vacstmt->tableidx);
            numrows = ceil(vacstmt->pstGlobalStatEx[vacstmt->tableidx].totalRowCnts *
                           vacstmt->pstGlobalStatEx[vacstmt->tableidx].sampleRate);
            totalrows = vacstmt->pstGlobalStatEx[vacstmt->tableidx].totalRowCnts;

            /* Decide analyze each column with execute query for dfs/delta table.  */
            if (analyzemode == ANALYZEMAIN || analyzemode == ANALYZEDELTA) {
                set_doquery_flag(vacstmt->pstGlobalStatEx);
            }

            /*
             * We need do analyze to compute statistic for sample table only
             * required sample table on coordinator.
             *
             * We only collect extended statistics for replicate table when it is not empty
             */
            if (vacstmt->pstGlobalStatEx[vacstmt->tableidx].exec_query ||
                (replicate_needs_extstats && numrows > 0 && totalrows > 0)) {
                vacstmt->pstGlobalStatEx[vacstmt->tableidx].exec_query = true;
                do_analyze_sampletable(onerel,
                    vacstmt,
                    attr_cnt,
                    vacattrstats,
                    hasindex,
                    nindexes,
                    indexdata,
                    inh,
                    Irel,
                    totalrows,
                    numrows,
                    analyzemode,
                    pstHdfsSampleRows);
            }
        } else {
            /*
             * Supported replicate table uses query to collect statistics,
             * set 'exec_query' to mark it's analyze mode even it is empty
             */
            if (replicate_needs_extstats) {
                vacstmt->pstGlobalStatEx[vacstmt->tableidx].exec_query = true;
            }

            /* We still insert a record to pg_statistic for extended stats even the table is empty */
            for (i = 0; i < attr_cnt; ++i) {
                VacAttrStats* stats = vacattrstats[i];
                if (stats->num_attrs > 1) {
                    stats->stats_valid = true;
                    update_attstats(RelationGetRelid(onerel), STARELKIND_CLASS, inh, 1, &stats,
                                    RelationGetRelPersistence(onerel));
                }
            }
        }
    }

    if (!inh) {
        /* Update the pg_class for relation and index */
        update_pages_and_tuples_pgclass(onerel,
            vacstmt,
            attr_cnt,
            vacattrstats,
            hasindex,
            nindexes,
            indexdata,
            Irel,
            relpages,
            totalrows,
            totaldeadrows,
            numrows,
            inh);

		/*
		 * 向统计信息收集器报告 ANALYZE 信息。但是，如果正在进行继承的统计信息收集，
		 * 我们不应该报告，因为统计信息收集器仅跟踪每个表的统计信息。
		 */
        pgstat_report_analyze(onerel, totalrows, totaldeadrows);
    }

	/*
	 * 如果不是 VACUUM ANALYZE 的一部分，让索引 AMs 进行清理操作
	 */
	if (!(vacstmt->options & VACOPT_VACUUM)) {
	    cleanup_indexes(nindexes, Irel, onerel, elevel);
	}
	
	/* 索引处理完毕，关闭索引 */
	vac_close_indexes(nindexes, Irel, NoLock);
	
	/* 如果适当，记录操作日志 */
	if (IsAutoVacuumWorkerProcess() && u_sess->attr.attr_storage.Log_autovacuum_min_duration >= 0) {
	    if (u_sess->attr.attr_storage.Log_autovacuum_min_duration == 0 ||
	        TimestampDifferenceExceeds(
	            starttime, GetCurrentTimestamp(), u_sess->attr.attr_storage.Log_autovacuum_min_duration))
	        ereport(LOG,
	            (errmsg("automatic analyze of table \"%s.%s.%s\" system usage: %s",
	                get_and_check_db_name(u_sess->proc_cxt.MyDatabaseId),
	                get_namespace_name(RelationGetNamespace(onerel)),
	                RelationGetRelationName(onerel),
	                pg_rusage_show(&ru0))));
	}
	
	/* 执行分析完成后的清理操作 */
	do_analyze_finalize(caller_context, save_userid, save_sec_context, save_nestlevel, analyzemode);

    return;
}

你可能感兴趣的:(OpenGauss,postgresql,gaussdb,数据库)

将MySQL数据同步到Elasticsearch作为全文检索数据的实战指南格子先生Lab 全文检索 mysql elasticsearch
在现代应用中，全文检索是一个非常重要的功能，尤其是在处理大量数据时。Elasticsearch是一个强大的分布式搜索引擎，能够快速地进行全文检索、分析和可视化。而MySQL作为传统的关系型数据库，虽然能够处理结构化数据，但在全文检索方面的性能不如Elasticsearch。因此，将MySQL中的数据同步到Elasticsearch中，可以充分发挥两者的优势。本文将介绍如何将MySQL中的数据同步到
算法之魂：深入剖析数据结构中的七大排序算法 GeminiGlory 数据结构数据结构排序算法算法
目录1.冒泡排序（BubbleSort）2.选择排序（SelectionSort）3.插入排序（InsertionSort）4.希尔排序（ShellSort）5.快速排序（QuickSort）6.归并排序（MergeSort）7.堆排序（HeapSort）在计算机科学领域，排序是一项基础但至关重要的操作。无论你是处理数据库查询结果还是优化搜索效率，了解不同的排序算法及其适用场景都至关重要。本文将介
Oracle数据库与Java全栈开发一篇搞定（指南式教学） Aphelios380 Oracle 数据库 oracle java
一、基础操作篇1.数据定义语言（DDL）核心操作1.1表结构设计技巧--电商用户表设计示例CREATETABLEtb_users(user_idNUMBER(10)PRIMARYKEY,usernameVARCHAR2(30)UNIQUENOTNULL,passwordCHAR(32)DEFAULT'e10adc3949ba59abbe56e057f20f883e',emailVARCHAR2(5
在 Spring Boot 结合 MyBatis 的项目中，实现字段脱敏（如手机号、身份证号、银行卡号等敏感信息的部分隐藏）可以通过以下方案实现冷冷清清中的风风火火笔记 springboot spring boot mybatis 后端
在SpringBoot结合MyBatis的项目中，实现字段脱敏（如手机号、身份证号、银行卡号等敏感信息的部分隐藏）可以通过以下方案实现。以下是分步说明和完整代码示例：一、实现方案选择1.方案一：自定义注解+Jackson序列化脱敏适用场景：数据返回给前端时动态脱敏，数据库存储原始数据。优点：无侵入性，通过注解灵活控制脱敏字段，与业务逻辑解耦。核心实现：利用Jackson的JsonSerialize
MQ总结 java
一.如何实现消息可靠性1.发送到MQ失败，重试策略2.生产者确认机制Confirm机制每个消息都有自己的一个Confirm机制消息正确到达交换机，返回ack。未到达交换机，返回nack。Return机制消息未正确到达队列，此时会通过PublisherConfirm返回ack，会通过PublisherReturn回调方法返回异常信息。全局只有一个失败后把消息写入数据库表，后期通过定时任务扫描，再次发
Neo4j GDS-02-graph-data-science 插件库安装实战笔记老马啸西风 neo4j neo4j 笔记数据库图数据结构算法
neo4japoc系列Neo4jAPOC-01-图数据库apoc插件介绍Neo4jAPOC-01-图数据库apoc插件安装neo4jonwindows10Neo4jAPOC-03-图数据库apoc实战使用使用Neo4jAPOC-04-图数据库apoc实战使用使用apoc.path.spanningTree最小生成树Neo4jAPOC-05-图数据库apoc实战使用使用labelFilterNeo4
Neo4j GDS-02-graph-data-science 简单聊一聊图数据科学插件库老马啸西风 neo4j neo4j 数据库算法图数据库开源
neo4japoc系列Neo4jAPOC-01-图数据库apoc插件介绍Neo4jAPOC-01-图数据库apoc插件安装neo4jonwindows10Neo4jAPOC-03-图数据库apoc实战使用使用Neo4jAPOC-04-图数据库apoc实战使用使用apoc.path.spanningTree最小生成树Neo4jAPOC-05-图数据库apoc实战使用使用labelFilter详细介绍
linux上安装postgresql9.5 crayon-shin-chan #postgresql surprise #linux linux ubuntu PostgreSQL 数据库
1.查看源版本czy@Mint~$sudoapt-getupdateczy@Mint~$apt-cachemadisonpostgresqlpostgresql|9.5+173ubuntu0.3|http://archive.ubuntu.com/ubuntuxenial-updates/mainamd64Packagespostgresql|9.5+173ubuntu0.3|http://arc
Linux 上安装 PostgreSQL lsx202406 开发语言
Linux上安装PostgreSQL引言PostgreSQL是一款功能强大、性能卓越的开源关系型数据库管理系统。它支持多种操作系统，包括Linux。本文将详细介绍如何在Linux系统上安装PostgreSQL，帮助您快速入门。准备工作在开始安装之前，请确保您的Linux系统满足以下条件：系统版本：Linux发行版，如Ubuntu、CentOS等。网络连接：确保您的系统可以访问互联网。用户权限：具有
MySQL数据库基本命令 Java从零开始数据库 mysql
1.CMD链接数据库：mysql-uroot-p2.打开全部数据库：showdatabases;3.切换数据库:use（school库）；4.显示数据库中所有表的信息：describe（student表）；5.查看数据库中所有的表：showtables；6.创建一个数据库：createdatabase（westos库）；7.SHOWCREATEDATABASEgoods：查看创建goods数据库的
双一流软件工程大二听闻 Java 前景堪忧，是否该转C++或人工智能或者读研？程序员yt java c++人工智能
今天给大家分享的是一位粉丝的提问，双一流软件工程大二听闻Java前景堪忧，是否该转C++或人工智能或者读研？接下来把粉丝的具体提问和我的回复分享给大家，希望也能给一些类似情况的小伙伴一些启发和帮助。同学提问：yt老师好，我是双一流软件工程的大二学生，一直在学习java方向，目前掌握了数据库，spring框架等内容，大一暑假在老家一个小公司找了段实习，有蓝桥杯java组b组国一，专业排名前2（保研名
常见的应用对应的传输层协议和端口号数据链路摸索者网路安全网络
常见的应用对应的传输层协议和端口号如下：服务端口号协议http80TCPhttps443TCPFTP21（控制）TCP20（数据）TCPTFTP69UDPTelent23TCPSSH22TCPSMTP25TCPPOP3110TCPSNMP161UDPNTP123UDPDNS53TCP+UDPDHCP67和68UDPOracle数据库1521TCP终端服务3389TCP
MongoDB z小天才b MongoDB mongodb 数据库
一、MongoDB简介1.1什么是MongoDB？MongoDB是一个基于分布式文件存储的开源NoSQL数据库系统，由C++语言编写，旨在为Web应用提供可扩展的高性能数据存储解决方案。MongoDB将数据存储为一个文档，数据结构由键值对组成，类似于JSON对象，字段值可以包含其他文档、数组及文档数组。1.2MongoDB的核心特性文档型数据库：数据以BSON（BinaryJSON）格式存储灵活的
跟着黑马学MySQL基础篇笔记(1)-概述与SQL 小杜不吃糖 mysql 笔记 sql
03.安装与启动启动netstartmysql80netstopmysql80客户端连接mysql[-h127.0.0.1][-P3306]-uroot-p04.mysql数据模型关系型数据库RDBMS05.通用语法及分类DDL：数据定义语言，用来定义数据库对象（数据库，表，字段）DML：数据操作语言，用来对数据库表中的数据进行增删改DQL：数据查询语言，用来查询数据库中表的记录DCL：数据控制语
adb 如何导出手机的文件风继续吹.. 工具类 Uni-App adb 智能手机 uniapp sqlite
目录1.开启USB调试2.连接设备3.启动ADB4.导出文件使用adbpull命令5.可视化工具预览adb（AndroidDebugBridge）是Android开发中常用的一个工具，它允许开发者通过电脑与Android设备进行通信。如果你想通过adb导出手机上的文件，你可以按照以下步骤业务需求:前端通过使用uni-app的sqlite(关系型数据库系统),存储了大量的机密数据在手机上,直接通过代
PostgreSQL_数据使用与日数据分享程序猿与金融与科技数据库 postgresql
目录前置：1使用1.1获取前复权因子1.2查询股票的纵向数据1.3查询股票的横向数据2日数据分享（截止至：2025-03-21）总结前置：本博文是一个系列。在本人“数据库专栏”-》“PostgreSQL_”开头的博文。本文为该系列最后一篇。1使用1.1获取前复权因子访问优矿官网ticker_list=[]field_list=['secID','tradeDate','accumAdjFactor
PostgreSQL_实例项目总述程序猿与金融与科技数据库 postgresql
目录前置：实例项目总述：前置：1最近新入PostgreSQL，打算用PostgreSQL存储股票日数据，以此为实例记录整个PostgreSQL使用过程2所以这次的博文是一个序列，都放在数据库专栏里，以PostgreSQL_打头3PostgreSQL的安装在这个系列里就不赘述了，安装过程简单。（如果有人实在搞不懂怎么安装，可以留言）实例项目总述：项目描述：股票日数据仓库数据来源：优矿1数据表结构设计
SSM卫生人员评审专家申报系统浅浅学姐课程设计毕业设计服务器运维 java 开发语言数据库后端
点赞+收藏+关注→添加文档最下方联系方式咨询本源代码、数据库本人在Java毕业设计领域有多年的经验，陆续会更新更多优质的Java实战项目希望你能有所收获，少走一些弯路。关注我不迷路项目视频SSM347的卫生人员项目申报评审管理系统资料介绍一、设计说明1.1研究背景面对大量的信息，传统的管理系统，都是通过笔记的方式进行详细信息的统计，后来出现电脑，通过电脑输入软件将纸质的信息统计到电脑上，这种方式比
SSM卫生人员评审专家申报系统 Plume98 课程设计毕业设计服务器运维 java 开发语言数据库后端
点赞+收藏+关注→添加文档最下方联系方式咨询本源代码、数据库本人在Java毕业设计领域有多年的经验，陆续会更新更多优质的Java实战项目希望你能有所收获，少走一些弯路。关注我不迷路项目视频SSM347的卫生人员项目申报评审管理系统资料介绍一、设计说明1.1研究背景面对大量的信息，传统的管理系统，都是通过笔记的方式进行详细信息的统计，后来出现电脑，通过电脑输入软件将纸质的信息统计到电脑上，这种方式比
数据库事务：确保数据一致性的关键机制可儿·四系桜数据库 java #MySQL 数据库 java 后端
1.什么是数据库事务定义：事务（Transaction）是数据库管理系统中的一个逻辑工作单元，用于确保一组相关操作要么全部成功执行，要么全部不执行，从而维护数据的一致性和完整性。重要性：在多用户环境下，当多个事务并发执行时，为了保证数据的完整性和一致性，事务的概念变得至关重要。例如，在银行转账系统中，从一个账户扣款并给另一个账户加款这两个操作必须同时成功或者同时失败，否则就会导致资金账目混乱。2.
【业务场景实战】JWT实现用户登录仰望-星空~~ java
在我们平时登录注册的过程中，我们的信息都会由浏览器发送给后端进行处理，然后再插入到数据库中，下次我们进行登录的时候，只需要输入用户名和密码就可以登录成功进入网站进行操作了。但个人信息暴露在大众面前这是极其不安全的，对于我们的隐私，我们并不希望被别人知道。所以我们在登录的时候，浏览器中进行传递的数据有些是会脱敏、有些是需要进行加密之后才能进行传递的。一、JWT简介JWT（全称JSONWEBToken
【业务场景实战】数据增量同步仰望-星空~~ android
时间过得真快，又是一年求职季，再过几个月我也要找暑假实习了，最近比较忙加上自身状态也不是很好，导致我的博客断更了很长时间。之后我尽量每周一更，好了，今天我们来讲讲关于数据增量同步。在一些比较大、用户量比较多、实时性要求比较高的的系统中，我们通常需要进行数据同步。这不只是为了提高系统的并发量，降低数据库访问的压力，提升用户的体验。同时也是为了让系统能够稳定运行，满足特定的场景需求。对于一些购物网站实
基于 Redis 的分布式锁实现与优化 Blossom.118 分布式系统与高性能计算领域 redis 分布式数据库 python3.11 算法数据结构推荐算法
在分布式系统中，锁机制是保障数据一致性和并发控制的关键技术之一。Redis作为一种高性能的内存数据库，常被用于实现分布式锁。本文将详细介绍基于Redis的分布式锁的实现原理、代码示例以及优化策略，帮助读者更好地理解和应用这一技术。一、分布式锁的概念与需求在单机系统中，锁的实现相对简单，可以通过操作系统的同步机制或编程语言提供的锁机制来完成。然而，在分布式系统中，多个进程或线程可能运行在不同的机器上
摄影工作室预约管理系统基于Spring BootSSM QQ1978519681计算机程序 spring boot 后端 java 毕业设计计算机毕设
目录摘要一、系统架构二、功能模块2.1用户管理模块2.2摄影师管理模块2.3预约管理模块2.4商品管理模块2.5管理员管理模块三.数据库设计四.技术栈五.安全性与性能六.用户界面与体验七.扩展性与可维护性摘要在数字化与信息化飞速发展的当下，人们的生活节奏日益加快，对于各类服务便捷性、高效性的需求也愈发强烈。摄影服务作为记录生活美好瞬间、留存珍贵回忆的重要方式，深受大众喜爱。然而，传统的摄影工作室预
深入解析 Redis 实现分布式锁的最佳实践煜bart 机器人 redis python
前言在分布式系统中，多个进程或线程可能会同时访问同一个共享资源，这就可能导致数据不一致的问题。为了保证数据的一致性，我们通常需要使用分布式锁。Redis作为高性能的内存数据库，提供了一种简单高效的方式来实现分布式锁。本文将深入探讨如何使用Redis来实现分布式锁，并介绍一些优化技巧和最佳实践。---一、为什么需要分布式锁？在单机环境下，我们可以使用synchronized、Lock等方式来控制并发
SQL Server数据库表删除分区 MartinYangHJ SQL Server 数据库
在SQLServer中删除分区并将表恢复到非分区状态，需按以下步骤操作：一、合并所有分区1.检查现有分区结构首先确认表的分区方案和分区函数：--查看分区方案SELECT*FROMsys.partition_schemes;--查看分区函数SELECT*FROMsys.partition_functions;2.合并所有分区将所有分区合并为一个，使数据集中在单个分区中：--假设分区函数名为`pf_D
【数据库】MySQL数据类型decimal详解以及对于float和double两种类型精度问题的探索明璐花生牛奶数据库 mysql 数据库经验分享
引言或许很多同学都很好奇为什么在数据库里要引入decimal这一种数据类型来表示小数？使用float和double这两种数据类型来表示小数为什么不可以？那是因为float和double这两种类型可能会出现精度问题如果本文出现了错误，还请路过的大佬在评论区指出，您的批评是我前进的动力！谢谢！decimal数据类型参考文献：https://cloud.tencent.com/developer/art
稳定运行的以Microsoft Azure Cosmos DB数据库为数据源和目标的ETL性能变差时提高性能方法和步骤 weixin_30777913 microsoft azure 数据仓库 etl 性能优化
在以MicrosoftAzureCosmosDB数据库为数据源和目标的ETL(提取、转换、加载)过程中，性能变差时，可能有多种原因。提高以MicrosoftAzureCosmosDB为数据源和目标的ETL性能，通常涉及数据库配置、查询优化、并发执行、数据传输优化和使用CosmosDB特性等多个方面。通过以下方法和步骤，可以显著改善ETL性能：增加RU设置、优化分区策略；优化查询、使用批量操作；提高
Systemd 是 Linux 系统的 ‌核心服务管理工具‌，负责管理系统的启动、服务生命周期和资源分配潇锐killer linux 运维服务器
Systemd是Linux系统的‌核心服务管理工具‌，负责管理系统的启动、服务生命周期和资源分配。它替代了传统的SysVinit系统，提供更高效、统一的服务管理方式。以下是它的核心作用：一、核心功能‌功能‌‌作用说明‌‌服务生命周期管理‌启动、停止、重启服务（如Nginx/MySQL）‌依赖关系管理‌自动处理服务之间的依赖关系（例如：先启动数据库再启动Web服务）‌开机自启管理‌通过enable/
MySQL Connector / Python weixin_30369087
MySQLConnector/Python允许Python程序使用符合Python数据库API规范v2.0（PEP249）的API访问MySQL数据库。MySQLConnector/Python包括对以下内容的支持：几乎所有MySQLServer提供的功能都包括MySQLServer版本5.7。Connector/Python8.0也支持XDevAPI。有关使用XDevAPI的MySQLConne
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l