数据库集簇、数据库和表

数据库集簇、数据库和表

  • 了解数据库集簇的逻辑、物理结构
  • 堆表文件的内部布局
  • 从表中读取数据的方式
    参考文档:http://www.interdb.jp/pg/pgsql01.html

1. 数据库集簇

  • 数据库集簇逻辑结构


    数据库集簇逻辑结构.png

    数据库集簇是openGauss服务管理的数据库的集合,数据库是数据库对象的集合,数据库对象包括了表,索引,视图,函数,序列等等。

  • 数据库集簇逻辑结构


    数据库集簇逻辑结构.png

    gs_initdb初始化新的数据库集簇,PGDATA环境变量指定了数据库集簇的目录,其中base目录下的子目录是数据库的目录,配置相关信息在postgresql.conf文件中,还有一些系统表相关的目录及表空间相关的目录。
    数据库对象目录及文件名关联数据库对象的OID,如数据库目录名关联数据库的OID。

postgres=# SELECT datname, oid FROM pg_database WHERE datname ='postgres';
 datname  |  oid
----------+-------
 postgres | 15098
(1 row)

postgres=# SELECT datname, oid FROM pg_database WHERE datname ='template1';
  datname  | oid
-----------+-----
 template1 |   1
(1 row)
base目录.png
  • 数据库布局
    数据库目录下包含了表文件,索引文件,空闲空间映射文件,可见性映射文件。
    表文件、索引文件名为表、索引OID,如有多个文件,会以OID.1,OID.2编号下去。文件名后缀为_fsm为空闲空间映射文件,文件名后缀为_vm为可见性映射文件。
    对象具体存储的路径可由函数pg_relation_filepath查询。
postgres=# create table t1(id int);
CREATE TABLE
postgres=# select pg_relation_filepath('t1'::regclass);
 pg_relation_filepath
----------------------
 base/15098/40981
(1 row)
  • 表空间
    openGauss支持创建表空间
postgres=# create tablespace test location '/data/gsdata2';
CREATE TABLESPACE

表空间创建成功后,在数据库集簇初始化目录下的pg_tblspc会创建一个软链接,链接到表空间的真实目录。

[root@localhost /]# cd data/gsdata/pg_tblspc/
[root@localhost pg_tblspc]# ll
total 0
lrwxrwxrwx. 1 gs gs 20 Jun 17 09:08 16384 -> /data/gsdata1/gstest
lrwxrwxrwx. 1 gs gs 13 Jun 18 18:40 40984 -> /data/gsdata2

如果创建表时指定了该表空间,则表相关文件会存放在新表空间目录下。

postgres=# create table t2(id int) tablespace test;
CREATE TABLE
postgres=# SELECT pg_relation_filepath('t2');
                pg_relation_filepath
-----------------------------------------------------
 pg_tblspc/40984/PG_9.2_201611171_cctest/15098/40985
(1 row)

2. 堆表文件的内部布局

堆表文件的内部布局.png

堆文件内部由多个页(块)组成,页默认大小为8K,当页空闲空间不足里,会初始化新的页,增加文件大小,页由0开始顺序编号。
页的内部布局包括头部信息,行指针,空闲空间,堆元组。

  • 堆元组
    从页的底部开始写入。
  • 行指针
    指向堆元组的指针,从1开始顺序编号。当新元组写入页时,同时新增指向该元组的行指针。
  • 头部信息
    pd_lsn:存储该页最新更改的XLOG记录的LSN。
    pg_checksum:存储该页的校验和。
    pg_lower:指向行指针的尾部。
    pg_upper:指向堆元组的头部。
    pg_lower位置到pg_upper位置中间这部分为页的空闲空间。

3. 从表中读取数据的方式

  • 顺序扫描
    全表扫描时,会按页编号顺序,行指针编号顺序读取所有数据。
  • B树索引扫描
    索引文件中存储了索引信息,包括索引字段、值及对应堆表文件中的TID信息。如果在索引文件中扫描到对应的TID,openGauss从根据TID查询出堆表文件中的数据。
    如下图中TID=(block=7,Offset=2),指的是第7个页,第2个行指针指向的元组。


    从表中读取数据的方式.png

你可能感兴趣的:(数据库集簇、数据库和表)