╰つ栺尖篴夢ゞ

华为云原生之数据仓库服务GaussDB(DWS)的深度使用与应用实践

一、GaussDB（DWS）简介

① 什么是 GaussDB（DWS）？

数据仓库服务 GaussDB(DWS) 是一种基于华为云基础架构和平台的在线数据处理数据库，提供即开即用、可扩展且完全托管的分析型数据库服务。
GaussDB(DWS) 是基于华为融合数据仓库 GaussDB 产品的云原生服务，兼容标准 ANSI SQL 99 和 SQL 2003，同时兼容 PostgreSQL/Oracle 数据库生态，为各行业 PB 级海量大数据分析提供有竞争力的解决方案。

GaussDB(DWS) 基于 Shared-nothing 分布式架构，具备 MPP (Massively Parallel Processing) 大规模并行处理引擎，由众多拥有独立且互不共享的 CPU、内存、存储等系统资源的逻辑节点组成。在这样的系统架构中，业务数据被分散存储在多个节点上，数据分析任务被推送到数据所在位置就近执行，并行地完成大规模的数据处理工作，实现对数据处理的快速响应。

② 数据仓库类型

云数仓：高性价比，支持冷热数据分析，存储、计算弹性伸缩，并按需、按量计价。适用于“库、仓、市、湖”一体化的融合分析业务，适合 50 节点以内的中小型数据仓库。
标准数仓：高性能、高扩展、高可用、易运维的企业级数据仓库，支持 2048 节点、20PB 级超大规模数据分析能力，适用于大型企业数仓，上云后体验不变。
IoT 数仓：在标准数仓基础上，提供高效的时序计算和 IoT 分析能力，支持实时和历史数据关联，适用于物联网、IoT 等实时分析场景。
实时数仓：在大规模数据查询和分析能力基础上，提供高并发、高性能、低时延的事务处理能力。适用于 HTAP 混合负载场景，“一库两用，生产即分析”。
- 实时数仓单机模式不支持演进到分布式模式，因此不支持扩缩容、逻辑集群等操作；
- 实时数仓单机模式暂不支持快照、DMS 监控、资源池队列等功能；
- 实时数仓单机模式中，原有指定分布列语法将被忽略，此外暂不支持 job 定时任务、sequence 等功能。

③ GaussDB（DWS）的应用场景

数据仓库迁移：

大数据融合分析：

增强型 ETL 和实时 BI 分析：

实时数据分析：

④ GaussDB（DWS）优势

易使用：一站式可视化便捷管理、与大数据无缝集成、提供一键式异构数据库迁移工具；
高性能：云化分布式架构、查询高性能万亿数据秒级响应、数据加载快；
易扩展：按需扩展、扩容后性能线性提升、扩容不中断业务；
高可靠：支持分布式事务 ACID 数据强一致保证、全方位 HA 设计、数据安全可靠；
低成本：按需付费、门槛低。

⑤ GaussDB（DWS）功能

（A）企业级数据仓库和标准 SQL 的支持

GaussDB（DWS）提供 PB（petabyte）级高性能数据库，主要体现在：
- MPP 大规模并行处理框架，支持行列混存、向量化执行，实现万亿数据关联分析秒级响应；
- 内存计算，基于 Bloom Filter 的 Hash Join 优化，性能提升 2~10 倍；
- 基于电信技术优化的大规模集群通信，提升计算节点间的传输效率；
- 基于代价的智能优化器，根据集群规模、数据量、生成最优计划，提高执行效率。
GaussDB（DWS）具有完备的 SQL 能力：
- 支持 SQL 92、SQL 2003 标准，支持存储过程，支持 GBK 和 UTF-8 字符集，支持 SQL 标准函数与 OLAP 分析函数；
- 兼容 PostgreSQL 生态，与主流第三方数据库 ETL，BI（business intelligence）工具厂商对接认证。

（B）多样化的数据导入方式

从 OBS（对象存储服务）并行导入数据；
使用 GDS（General Data Service）从远端服务器导入数据；
通过 INSERT 语句直接写入数据；
使用 COPY FROM STDIN 导入数据；
使用 gsql 元命令导入数据；
从 MRS（MapReduce 服务）导入数据到集群；
从 DIS（数据接入服务）导入流式数据到 GaussDB(DWS)；
使用 CDM（云数据迁移服务）迁移数据到 GaussDB(DWS)；
使用 DSC 工具迁移 SQL 脚本；
支持主流第三方 ETL 工具进行数据导入。

（C）应用程序接口

支持调用 JDBC（Java database connectivity）接口；
支持调用 ODBC（Open Database Connectivity）接口；
支持 Python 第三方库 psycopg2 等标准接口。

（D）支持多种数据库工具

支持 gsql 工具；
支持 Data Studio 工具；
支持 GDS 工具；
支持 DSC SQL 语法迁移工具。

二、GaussDB(DWS) 使用流程

① 准备工作

在创建 GaussDB(DWS) 集群时需要指定一个端口供 SQL 客户端或应用程序通过该端口访问集群；
如果客户端机器位于防火墙之后，则需要有一个可用的开放端口，这样才能从 SQL 客户端工具连接到集群并进行查询分析；
如果不了解可用的开放端口，则请联系网络管理员，在防火墙中确定一个开放端口，GaussDB(DWS) 支持的端口范围为 8000～30000；
在集群创建之后无法更改集群的端口号，请务必确保在集群创建过程中指定的端口为可用的开放端口。

② 创建集群

单击左侧导航栏的“集群管理”，再选择“创建数据仓库集群”：

选择”区域“，在选择“产品类型”、“CPU架构”和“节点规格”：

填写“集群配置”参数：

配置“网络”：

设置高级配置，选择“自定义”时，可以设置以下高级配置参数，若选择“默认配置”，再购买相应的折扣套餐即可创建成功集群：

最后单击“立即创建”，进入“规格详情”页面，然后提交即可。

③ 连接集群

如果已经成功创建 GaussDB(DWS) 集群，就可以使用 SQL 客户端工具或者 JDBC（Java database connectivity）/ODBC（Open Database Connectivity）等第三方驱动程序连接集群，访问集群中的数据库。
进入 GaussDB(DWS) 控制台的“连接管理”页面，就可以下载 SQL 客户端工具和 JDBC/ODBC 驱动程序。

（A）获取集群连接地址

在 GaussDB(DWS) 的管理控制台的左侧导航栏中，单击“连接管理”，在“数据仓库连接信息”区域，选择一个可用的集群名称（只能选择状态为可用的集群）：

查看并获取集群的连接信息：“内网访问地址”、“公网访问地址”、“弹性负载均衡地址”、“JDBC 连接字符串（内网）”、“JDBC 连接字符串（公网）”、“ODBC 连接字符串”。

（B）使用 Data Studio 连接到集群数据库

GaussDB(DWS) 提供基于 Windows 平台的 Data Studio 图形界面客户端，该工具依赖 JDK，需先在客户端主机上安装 JDK。
登录 GaussDB(DWS) 管理控制台，单击“连接管理”，在“下载客户端和驱动”页面，下载“Data Studio 图形界面客户端”：

解压下载的客户端软件包（32 位或 64 位）到需要安装的路径，打开安装目录，双击 Data Studio，启动 Data Studio 客户端：

在主菜单中选择 “文件>新建连接”：

在弹出的“新建/选择数据库连接”页面中，如下图所示，输入连接参数：

单击“确定”建立数据库连接：

连接集群后，就可以创建和管理数据库、管理用户及权限、导入或导出数据，以及查询和分析数据（“数据库的操作与管理”请参考下文的“GaussDB（DWS）的基本使用”）。

（C）管理数据库连接

查看最大连接数：

SHOW max_connections;

查看连接到指定用户 dbadmin 的会话连接数上限：

SELECT ROLNAME,ROLCONNLIMIT FROM PG_ROLES WHERE ROLNAME='dbadmin';

查看指定用户 dbadmin 已使用的会话连接数：

SELECT COUNT(*) FROM V$SESSION WHERE USERNAME='dbadmin';

查看连接到指定数据库 gaussdb 的会话连接数上限：

SELECT DATNAME,DATCONNLIMIT FROM PG_DATABASE WHERE DATNAME='gaussdb';

查看指定数据库 gaussdb 上已使用的会话连接数：

SELECT COUNT(*) FROM PG_STAT_ACTIVITY WHERE DATNAME='gaussdb';

查看所有用户已使用的会话连接数：

SELECT COUNT(*) FROM V$SESSION;

④ 管理和监控集群

（A）管理集群

在“大数据”列表中，单击“数据仓库服务”，就可以进入数据仓库服务管理控制台页面。
可以查看集群状态，修改集群配置，添加集群标签，对集群进行扩容、重启、删除等管理操作。

（B）管理快照

快照是对 GaussDB(DWS) 集群在某一时间点的一次全量数据和增量数据的备份，记录了当前数据库的数据以及集群的相关信息，其中包括节点数量、节点规格和管理员用户名称等。
从快照恢复到集群时，GaussDB(DWS) 会根据快照记录的集群信息来创建新集群，然后从快照记录的数据中还原数据库信息。
在左侧导航栏中，单击“快照管理”，在快照列表中，默认显示用户所有的快照：

在快照列表中，可以查看快照的“快照名称”、“快照状态”、：“集群名称”、“快照类型”和“快照创建时间”。

（C）运维与监控

CES 监控集群：
- 登录 GaussDB(DWS) 管理控制台，进入“集群管理”页面，查看集群信息：在集群列表中，在指定集群所在行，单击“查看监控指标”，打开云监控管理控制台（默认显示的是集群监控信息）。可以根据需要，选择指定的监控指标名称以及时间范围，从而显示监控指标的性能曲线。
- 可以在“监控面板”页面，单击右上角的“添加监控视图”，在弹出的“添加监控视图”窗口中，配置标题和监控项：

- 添加成功后，可在“监控面板”区域看到对应的监控视图：

- 还可以创建告警规则：

- 配置告警通知，根据界面提示配置参数：

事件通知：事件是用户集群状态发生变化的记录，它可以是由用户操作触发的（比如审计事件），也有可能是集群服务状态变化引起的（比如集群修复成功或集群修复失败）。
审计日志：
- GaussDB(DWS) 支持对特定数据库操作记录审计日志，包括：日志保留策略、用户越权访问、存储过程以及对数据库对象的 DML、SELECT、COPY 和 DDL 操作。
- 审计日志配置后，当 GaussDB(DWS) 集群状态异常，或根据业务需要，用户可以查询审计信息确定故障原因或定位历史操作记录。
- 通过查看管理控制台审计日志，记录下 GaussDB(DWS) 管理控制台的关键操作事件，比如创建集群、创建快照、重启集群等，记录下的日志可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。

三、GaussDB（DWS）的基本使用

① 设置创建数据库的权限

使用 CREATE USER 和 ALTER USER 可以创建和管理数据库用户，数据库集群包含一个或多个已命名数据库，用户和角色在整个集群范围内是共享的，但是其数据并不共享，即用户可以连接任何数据库，但当连接成功后，任何用户都只能访问连接请求里声明的那个数据库。
在用户登录 GaussDB(DWS) 时会对其进行身份验证，用户可以拥有数据库和数据库对象（例如表），并且可以向用户和角色授予对这些对象的权限以控制谁可以访问哪个对象。
创建用户，可以使用 SQL 语句 CREATE USER，例如创建用户 Kody，并设置用户拥有 CREATEDB 属性，如下所示：

CREATE USER Kody WITH CREATEDB PASSWORD 'password';

创建系统管理员，可以使用带有 SYSADMIN 选项的 CREATE USER 语句：

CREATE USER sysadmin WITH SYSADMIN password "Bigdata@123";

删除现有用户，可以使用 DROP USER：

DROP USER user, [user],...;

更改用户帐户（重命名用户或更改密码），可以使用 ALTER USER：

ALTER USER name [ WITH ] option [ ... ]]

查看用户列表，可以查询视图 PG_USER：

SELECT * FROM pg_user;

查看用户属性，可以查询系统表 PG_AUTHID：

SELECT * FROM pg_authid;

创建具有 INDEPENDENT 属性的私有用户：

CREATE USER user_independent WITH INDEPENDENT IDENTIFIED BY "1234@abc";

② 创建和管理数据库

GaussDB(DWS)包含两个模板数据库 template0、template1，以及一个默认的用户数据库 gaussdb。CREATE DATABASE 实际上通过拷贝模板数据库来创建新数据库，默认情况下拷贝 template1，但要避免使用客户端或其他手段连接及操作两个模板数据库。
创建一个新的数据库 db_MyData：

CREATE DATABASE db_MyData;

当创建成功时，如下所示：

CREATE DATABASE

查看数据库系统的数据库列表：

\l

通过系统表 pg_database 查询数据库列表：

SELECT datname FROM pg_database;

为数据库设置默认的模式搜索路径：

ALTER DATABASE db_MyData SET search_path TO pa_catalog,public;
ALTER DATABASE

修改数据库表空间：

ALTER DATABASE db_MyData SET TABLESPACE MyData;
ALTER DATABASE

为数据库重新命名：

ALTER DATABASE db_MyData RENAME TO human_MyData;
ALTER DATABASE

删除数据库：

DROP DATABASE human_MyData;
DROP DATABASE

③ GaussDB(DWS) 设置存储模型

GaussDB(DWS) 支持行列混合存储，行存储是指将表按行存储到硬盘分区上，列存储是指将表按列存储到硬盘分区上。

默认情况下，GaussDB(DWS) 创建的表为行存储，数据按行进行存储，即一行数据是连续存储，适用于对数据需要经常更新的场景：

CREATE TABLE customer_t1
(
  state_ID   CHAR(2),
  state_NAME VARCHAR2(40),
  area_ID    NUMBER
);

--删除表
DROP TABLE customer_t1;

如果数据按列进行存储，即一列所有数据是连续存储的，单列查询 IO 小，比行存表占用更少的存储空间，适合数据批量插入、更新较少和以查询为主统计分析类的场景，列存表不适合点查询：

CREATE TABLE customer_t2
(
  state_ID   CHAR(2),
  state_NAME VARCHAR2(40),
  area_ID    NUMBER
)
WITH (ORIENTATION = COLUMN);

--删除表
DROP TABLE customer_t2;

④ 创建与管理表

（A）创建表

执行如下命令创建表：

CREATE TABLE customer_t1
(
    c_customer_sk             integer,
    c_customer_id             char(5),
    c_first_name              char(6),
    c_last_name               char(8)
)
with (orientation = column,compression=middle)
distribute by hash (c_last_name);

当创建成功时，如下所示：

CREATE TABLE

(B) 向表中插入数据

建立需要使用的表 table1、table2：

CREATE TABLE table1(id int, a char(6), b varchar(6),c varchar(6)) ;
CREATE TABLE table2(id int, a char(20), b varchar(20),c varchar(20)) ;

向表 customer_t1 中插入一行：
- 数据值是按照这些字段在表中出现的顺序列出的，并且用逗号分隔，通常数据值是文本（常量），但也允许使用标量表达式：

INSERT INTO customer_t1(c_customer_sk, c_customer_id, c_first_name) VALUES (3769, 'hello', 'Grace');

- 如果用户已经知道表中字段的顺序，也可无需列出表中的字段，以下命令与上面的命令效果相同：

INSERT INTO customer_t1 VALUES (3769, 'hello', 'Grace');

- 如果用户不知道所有字段的数值，可以忽略其中的一些，没有数值的字段将被填充为字段的缺省值：

INSERT INTO customer_t1 (c_customer_sk, c_first_name) VALUES (3769, 'Grace');

INSERT INTO customer_t1 VALUES (3769, 'hello');

- 也可以对独立的字段或者整个行明确缺省值：

INSERT INTO customer_t1 (c_customer_sk, c_customer_id, c_first_name) VALUES (3769, 'hello', DEFAULT);

INSERT INTO customer_t1 DEFAULT VALUES;

如果需要在表中插入多行，请使用以下命令：

INSERT INTO customer_t1 (c_customer_sk, c_customer_id, c_first_name) VALUES 
    (6885, 'maps', 'Joes'),
    (4321, 'tpcds', 'Lily'),
    (9527, 'world', 'James');

如果从指定表插入数据到当前表，例如在数据库中创建了一个表 customer_t1 的备份表 customer_t2，现在需要将表 customer_t1 中的数据插入到表 customer_t2 中，则可以执行如下命令：

CREATE TABLE customer_t2
(
    c_customer_sk             integer,
    c_customer_id             char(5),
    c_first_name              char(6),
    c_last_name               char(8)
) ;

INSERT INTO customer_t2 SELECT * FROM customer_t1;

删除备份表：

DROP TABLE customer_t2 CASCADE;

© 更新表中数据

将表 customer_t1 中 c_customer_sk 为 9527 的地域重新定义为 9876：

UPDATE customer_t1 SET c_customer_sk = 9876 WHERE c_customer_sk = 9527;

将表 customer_t1 中 c_customer_sk 为 9527 的地域重新定义为 c_customer_sk + 100：

UPDATE customer_t1 SET c_customer_sk= c_customer_sk + 100 WHERE c_customer_sk= 9527;

将 Public 模式下表 customer_t1 中 c_customer_sk 为 9527 的地域重新定义为 9876：

UPDATE public.customer_t1 SET c_customer_sk= 9876 WHERE c_customer_sk= 9527;

不含 WHERE 子句表示把所有 c_customer_sk 的值增加 100：

UPDATE customer_t1 SET c_customer_sk = c_customer_sk + 100;

将表 customer_t1 中 c_customer_sk 大于 9527 的地域全部重新定义为 9876：

UPDATE customer_t1 SET c_customer_sk = 9876 WHERE c_customer_sk > 9527;

可以在一个 UPDATE 命令中更新更多的字段，方法是在 SET 子句中列出更多赋值，比如：

UPDATE customer_t1 SET  c_customer_id = 'Admin', c_first_name = 'Local' WHERE c_customer_sk

(D) 查看数据

使用系统表 pg_tables 查询数据库所有表的信息：

SELECT * FROM pg_tables;

使用 gsql 的 \d+ 命令查询表的属性：

\d+ customer_t1;

查询表 customer_t1 的数据量：

SELECT count(*) FROM customer_t1;

查询表 customer_t1 的所有数据：

SELECT * FROM customer_t1;

只查询字段 c_customer_sk 的数据：

SELECT c_customer_sk FROM customer_t1;

过滤字段 c_customer_sk 的重复数据：

SELECT DISTINCT( c_customer_sk ) FROM customer_t1;

查询字段 c_customer_sk 为 3869 的所有数据：

SELECT * FROM customer_t1 WHERE c_customer_sk = 3869;

按照字段 c_customer_sk 进行排序：

SELECT * FROM customer_t1 ORDER BY c_customer_sk;

（E）删除表中数据

使用 DELETE 命令删除行，如果删除表 customer_t1 中所有 c_customer_sk 为 3869 的记录：

DELETE FROM customer_t1 WHERE c_customer_sk = 3869;

如果执行如下命令，会删除表中所有的行：

DELETE FROM customer_t1;

TRUNCATE TABLE customer_t1;

删除创建的表：

DROP TABLE customer_t1;

⑤ 创建和管理 schema

（A）创建 schema

创建一个 schema：

CREATE SCHEMA myschema;

创建成功时，如下所示：

CREATE SCHEMA

在创建 schema 时指定 owner：

CREATE SCHEMA myschema AUTHORIZATION dbadmin;

(B) 使用 schema

在 myschema 下创建 mytable 表：

CREATE TABLE myschema.mytable(id int, name varchar(20));
CREATE TABLE

执行如下命令查询 myschema 下 mytable 表的所有数据：

SELECT * FROM myschema.mytable;
id | name 
----+------
(0 rows)

© schema 的搜索路径

查看搜索路径：

SHOW SEARCH_PATH;
 search_path
----------------
 "$user",public
(1 row)

将搜索路径设置为 myschema、public，首先搜索 myschema：

SET SEARCH_PATH TO myschema, public;
SET

(D) schema 权限控制

查看现有的 schema：

SELECT current_schema();
 current_schema 
----------------
 myschema
(1 row)

创建用户 Kody，并将 myschema 的 usage 权限赋给用户 Kody：

CREATE USER Kody IDENTIFIED BY 'Bigdata@123';
GRANT USAGE ON schema myschema TO Kody;

将用户 Kody 对于 myschema 的 usage 权限收回：

REVOKE USAGE ON schema myschema FROM Kody;

(E) 删除 schema

当 schema 为空时，即该 schema 下没有数据库对象，使用 DROP SCHEMA 命令进行删除，删除名为 nullschema 的空 schema：

DROP SCHEMA IF EXISTS nullschema;
DROP SCHEMA

当 schema 非空时，如果要删除一个 schema 及其包含的所有对象，需要使用 CASCADE 关键字，删除 myschema 及该 schema 下的所有对象：

DROP SCHEMA myschema CASCADE;
DROP SCHEMA

删除用户 Kody：

DROP USER Kody;
DROP USER

⑥ 管理分区表

创建分区表：

CREATE TABLE tpcds.customer_address
(
    ca_address_sk       integer                  NOT NULL   ,
    ca_address_id       character(16)            NOT NULL   ,
    ca_street_number    character(10)                       ,
    ca_street_name      character varying(60)               ,
    ca_street_type      character(15)                       ,
    ca_suite_number     character(10)                       ,
    ca_city             character varying(60)               ,
    ca_county           character varying(30)               ,
    ca_state            character(2)                        ,
    ca_zip              character(10)                       ,
    ca_country           character varying(20)               ,
    ca_gmt_offset       numeric(5,2)                        ,
    ca_location_type    character(20)
)
DISTRIBUTE BY HASH (ca_address_sk)
PARTITION BY RANGE (ca_address_sk)
(
        PARTITION P1 VALUES LESS THAN(5000),
        PARTITION P2 VALUES LESS THAN(10000),
        PARTITION P3 VALUES LESS THAN(15000),
        PARTITION P4 VALUES LESS THAN(20000),
        PARTITION P5 VALUES LESS THAN(25000),
        PARTITION P6 VALUES LESS THAN(30000),
        PARTITION P7 VALUES LESS THAN(40000),
        PARTITION P8 VALUES LESS THAN(MAXVALUE)
)
ENABLE ROW MOVEMENT;

将表 tpcds.customer_address 的数据插入到表 tpcds.web_returns_p2 中：

CREATE TABLE tpcds.web_returns_p2
(
    ca_address_sk       integer                  NOT NULL   ,
    ca_address_id       character(16)            NOT NULL   ,
    ca_street_number    character(10)                       ,
    ca_street_name      character varying(60)               ,
    ca_street_type      character(15)                       ,
    ca_suite_number     character(10)                       ,
    ca_city             character varying(60)               ,
    ca_county           character varying(30)               ,
    ca_state            character(2)                        ,
    ca_zip              character(10)                       ,
    ca_country           character varying(20)               ,
    ca_gmt_offset       numeric(5,2)                        ,
    ca_location_type    character(20)
)
DISTRIBUTE BY HASH (ca_address_sk)
PARTITION BY RANGE (ca_address_sk)
(
        PARTITION P1 VALUES LESS THAN(5000),
        PARTITION P2 VALUES LESS THAN(10000),
        PARTITION P3 VALUES LESS THAN(15000),
        PARTITION P4 VALUES LESS THAN(20000),
        PARTITION P5 VALUES LESS THAN(25000),
        PARTITION P6 VALUES LESS THAN(30000),
        PARTITION P7 VALUES LESS THAN(40000),
        PARTITION P8 VALUES LESS THAN(MAXVALUE)
)
ENABLE ROW MOVEMENT;
CREATE TABLE
INSERT INTO tpcds.web_returns_p2 SELECT * FROM tpcds.customer_address;
INSERT 0 0

修改分区表行迁移属性：

ALTER TABLE tpcds.web_returns_p2 DISABLE ROW MOVEMENT;
ALTER TABLE

删除分区 P8：

ALTER TABLE tpcds.web_returns_p2 DROP PARTITION P8;
ALTER TABLE

增加分区 P8，范围为 40000<= P8<=MAXVALUE：

ALTER TABLE tpcds.web_returns_p2 ADD PARTITION P8 VALUES LESS THAN (MAXVALUE);
ALTER TABLE

重命名分区 P8 为 P_9：

ALTER TABLE tpcds.web_returns_p2 RENAME PARTITION P8 TO P_9;
ALTER TABLE

查询分区 P7：

SELECT * FROM tpcds.web_returns_p2 PARTITION (P7);
SELECT * FROM tpcds.web_returns_p2 PARTITION FOR (35888);

查看分区表信息，可使用系统表 dba_tab_partitions：

select * from dba_tab_partitions where table_name='tpcds.customer_address';

删除分区表：

DROP TABLE tpcds.web_returns_p2;
DROP TABLE

⑦ 管理索引

创建分区表索引 tpcds_web_returns_p2_index1，不指定索引分区的名字：

CREATE INDEX tpcds_web_returns_p2_index1 ON tpcds.web_returns_p2 (ca_address_id) LOCAL;

创建分区索引 tpcds_web_returns_p2_index2，并指定索引分区的名字：

CREATE INDEX tpcds_web_returns_p2_index2 ON tpcds.web_returns_p2 (ca_address_sk) LOCAL
(
    PARTITION web_returns_p2_P1_index,
    PARTITION web_returns_p2_P2_index TABLESPACE example3,
    PARTITION web_returns_p2_P3_index TABLESPACE example4,
    PARTITION web_returns_p2_P4_index,
    PARTITION web_returns_p2_P5_index,
    PARTITION web_returns_p2_P6_index,
    PARTITION web_returns_p2_P7_index,
    PARTITION web_returns_p2_P8_index
) TABLESPACE example2;

重命名索引分区：

ALTER INDEX tpcds.tpcds_web_returns_p2_index2 RENAME PARTITION web_returns_p2_P8_index TO web_returns_p2_P8_index_new;

查询系统和用户定义的所有索引：

SELECT RELNAME FROM PG_CLASS WHERE RELKIND='i';

删除索引：

DROP INDEX tpcds.tpcds_web_returns_p2_index1;
DROP INDEX tpcds.tpcds_web_returns_p2_index2;

⑧ 管理视图

创建视图：

CREATE OR REPLACE VIEW MyView AS SELECT * FROM tpcds.web_returns WHERE trunc(wr_refunded_cash) > 10000;
CREATE VIEW

查询视图：

SELECT * FROM MyView;

重建视图：

ALTER VIEW MyView REBUILD;
ALTER VIEW

删除视图：

DROP VIEW MyView;
DROP VIEW

⑨ 管理序列

创建序列：

CREATE SEQUENCE seq1 cache 100;

指定为某一字段的默认值，使该字段具有唯一标识属性：

CREATE TABLE T2 
( 
    id   int not null default nextval('seq1'),
    name text
);

指定序列与列的归属关系：

ALTER SEQUENCE seq1 OWNED BY T2.id;

⑩ 管理定时任务

创建测试表：

CREATE TABLE test(id int, time date);

创建自定义存储过程：

CREATE OR REPLACE PROCEDURE PRC_JOB_1()
AS
N_NUM integer :=1;
BEGIN
FOR I IN 1..1000 LOOP
INSERT INTO test VALUES(I,SYSDATE);
END LOOP;
END;
/

创建任务：

call dbms_job.submit('call public.prc_job_1(); ', sysdate, 'interval ''1 minute''', :a);
job
-----
1
(1 row)

通过视图查看当前用户已创建的任务信息：

select job,dbname,start_date,last_date,this_date,next_date,broken,status,interval,failures,what from user_jobs;
job | dbname |     start_date      |         last_date          |         this_date          |      next_date      | broken | status |      interval       | failures |           what
-----+--------+---------------------+----------------------------+----------------------------+---------------------+--------+--------+---------------------+----------+---------------------------
1 | gaussdb   | 2017-07-18 11:38:03 | 2017-07-18 13:53:03.607838 | 2017-07-18 13:53:03.607838 | 2017-07-18 13:54:03 | n      | s      | interval '1 minute' |        0 | call public.prc_job_1();
(1 row)

停止任务：

call dbms_job.broken(1,true);
broken
--------

(1 row)

启动任务：

call dbms_job.broken(1,false);
broken
--------

(1 row)

删除 JOB：

call dbms_job.remove(1);
remove
--------

(1 row)

四、GaussDB（DWS）模拟数据分析

① 准备工作

使用华为云帐号，且在使用 GaussDB(DWS) 前检查帐号状态，帐号不能处于欠费或冻结状态。
创建访问密钥（AK 和 SK）：
- 登录 GaussDB(DWS) 管理控制台，单击右上角用户名，在下拉菜单中单击“我的凭证”：

- 在左侧导航树单击“访问密钥”，再单击“新增访问密钥”，在弹出的对话框中，输入登录密码和对应验证码，然后单击“确定”：

- 在弹出的“下载确认”提示框中，单击“确定”后，密钥会直接保存到浏览器默认的下载文件夹中，打开下载下来的“credentials.csv”文件即可获取到访问密钥（AK 和 SK）。
按照上文的流程，已成功创建集群，并已使用 Data Studio 连接集群。

② 导入样例数据

创建数据库表：

在 gaussdb 数据库中创建名字为 tpch 的 schema 和对应的数据表：

CREATE schema tpch; 
set current_schema = tpch;

drop table if exists region;
CREATE TABLE REGION
(
        R_REGIONKEY  INT NOT NULL , 
        R_NAME       CHAR(25) NOT NULL ,
        R_COMMENT    VARCHAR(152)
)
with (orientation = column, COMPRESSION=MIDDLE)
distribute by replication;

drop table if exists nation;
CREATE TABLE NATION
(
        N_NATIONKEY  INT NOT NULL, 
        N_NAME       CHAR(25) NOT NULL,
        N_REGIONKEY  INT NOT NULL,
        N_COMMENT    VARCHAR(152)
)
with (orientation = column,COMPRESSION=MIDDLE)
distribute by replication;

drop table if exists supplier;
CREATE TABLE SUPPLIER
(
        S_SUPPKEY     BIGINT NOT NULL,
        S_NAME        CHAR(25) NOT NULL,
        S_ADDRESS     VARCHAR(40) NOT NULL,
        S_NATIONKEY   INT NOT NULL,
        S_PHONE       CHAR(15) NOT NULL,
        S_ACCTBAL     DECIMAL(15,2) NOT NULL,
        S_COMMENT     VARCHAR(101) NOT NULL
)
with (orientation = column,COMPRESSION=MIDDLE)
distribute by hash(S_SUPPKEY);

drop table if exists customer;
CREATE TABLE CUSTOMER
(
        C_CUSTKEY     BIGINT NOT NULL,
        C_NAME        VARCHAR(25) NOT NULL,
        C_ADDRESS     VARCHAR(40) NOT NULL, 
        C_NATIONKEY   INT NOT NULL, 
        C_PHONE       CHAR(15) NOT NULL, 
        C_ACCTBAL     DECIMAL(15,2)   NOT NULL,
        C_MKTSEGMENT  CHAR(10) NOT NULL, 
        C_COMMENT     VARCHAR(117) NOT NULL
)
with (orientation = column,COMPRESSION=MIDDLE)
distribute by hash(C_CUSTKEY);

drop table if exists part;
CREATE TABLE PART
(
        P_PARTKEY     BIGINT NOT NULL, 
        P_NAME        VARCHAR(55) NOT NULL, 
        P_MFGR        CHAR(25) NOT NULL, 
        P_BRAND       CHAR(10) NOT NULL, 
        P_TYPE        VARCHAR(25) NOT NULL,
        P_SIZE        BIGINT NOT NULL,
        P_CONTAINER   CHAR(10) NOT NULL,
        P_RETAILPRICE DECIMAL(15,2) NOT NULL,
        P_COMMENT     VARCHAR(23) NOT NULL
)
with (orientation = column,COMPRESSION=MIDDLE)
distribute by hash(P_PARTKEY);

drop table if exists partsupp;
CREATE TABLE PARTSUPP
(
        PS_PARTKEY     BIGINT NOT NULL,
        PS_SUPPKEY     BIGINT NOT NULL, 
        PS_AVAILQTY    BIGINT NOT NULL,
        PS_SUPPLYCOST  DECIMAL(15,2)  NOT NULL, 
        PS_COMMENT     VARCHAR(199) NOT NULL
)
with (orientation = column,COMPRESSION=MIDDLE)
distribute by hash(PS_PARTKEY);

drop table if exists orders;
CREATE TABLE ORDERS
(
        O_ORDERKEY       BIGINT NOT NULL,
        O_CUSTKEY        BIGINT NOT NULL, 
        O_ORDERSTATUS    CHAR(1) NOT NULL, 
        O_TOTALPRICE     DECIMAL(15,2) NOT NULL,
        O_ORDERDATE      DATE NOT NULL , 
        O_ORDERPRIORITY  CHAR(15) NOT NULL, 
        O_CLERK          CHAR(15) NOT NULL , 
        O_SHIPPRIORITY   BIGINT NOT NULL,
        O_COMMENT        VARCHAR(79) NOT NULL
)
with (orientation = column,COMPRESSION=MIDDLE)
distribute by hash(O_ORDERKEY);

drop table if exists lineitem;
CREATE TABLE LINEITEM
(
        L_ORDERKEY    BIGINT NOT NULL,
        L_PARTKEY     BIGINT NOT NULL, 
        L_SUPPKEY     BIGINT NOT NULL,
        L_LINENUMBER  BIGINT NOT NULL,
        L_QUANTITY    DECIMAL(15,2) NOT NULL, 
        L_EXTENDEDPRICE  DECIMAL(15,2) NOT NULL,
        L_DISCOUNT    DECIMAL(15,2) NOT NULL,
        L_TAX         DECIMAL(15,2) NOT NULL, 
        L_RETURNFLAG  CHAR(1) NOT NULL,
        L_LINESTATUS  CHAR(1) NOT NULL,
        L_SHIPDATE    DATE NOT NULL, 
        L_COMMITDATE  DATE NOT NULL ,
        L_RECEIPTDATE DATE NOT NULL, 
        L_SHIPINSTRUCT CHAR(25) NOT NULL, 
        L_SHIPMODE     CHAR(10) NOT NULL, 
        L_COMMENT      VARCHAR(44) NOT NULL
)
with (orientation = column,COMPRESSION=MIDDLE)
distribute by hash(L_ORDERKEY);

创建外表，用于识别和关联 OBS 上的源数据：

CREATE schema tpchobs;
set current_schema='tpchobs';
drop FOREIGN table if exists region;
CREATE FOREIGN TABLE REGION
(
        like tpch.region
)                    
SERVER gsmpp_server 
OPTIONS (
        encoding 'utf8',
        location 'obs:///tpch/region.tbl',
        format 'text',
        delimiter '|',
        access_key '',
        secret_access_key '',
        chunksize '64',
        IGNORE_EXTRA_DATA 'on'
);
 
drop FOREIGN table if exists nation;
CREATE FOREIGN TABLE NATION
(
        like tpch.nation
)
SERVER gsmpp_server 
OPTIONS (
         encoding 'utf8',
         location 'obs:///tpch/nation.tbl',
         format 'text',
         delimiter '|',
         access_key '',
         secret_access_key '',
         chunksize '64',
         IGNORE_EXTRA_DATA 'on'
);
 
drop FOREIGN table if exists supplier;
CREATE FOREIGN TABLE SUPPLIER
(
        like tpch.supplier
)
SERVER gsmpp_server 
OPTIONS (
        encoding 'utf8',
        location 'obs:///tpch/supplier.tbl',
        format 'text',
        delimiter '|',
        access_key '',
        secret_access_key '',
        chunksize '64',
        IGNORE_EXTRA_DATA 'on'
);
 
drop FOREIGN table if exists customer;
CREATE FOREIGN TABLE CUSTOMER
(
        like tpch.customer
)
SERVER gsmpp_server 
OPTIONS (
        encoding 'utf8',
        location 'obs:///tpch/customer.tbl',
        format 'text',
        delimiter '|',
        access_key '',
        secret_access_key '',
        chunksize '64',
        IGNORE_EXTRA_DATA 'on'
);
drop FOREIGN table if exists part;
CREATE FOREIGN TABLE PART
(
        like tpch.part

)
SERVER gsmpp_server 
OPTIONS (
        encoding 'utf8',
        location 'obs:///tpch/part.tbl',
        format 'text',
        delimiter '|',
        access_key '',
        secret_access_key '',
        chunksize '64',
        IGNORE_EXTRA_DATA 'on'
);
drop FOREIGN table if exists partsupp;
CREATE FOREIGN TABLE PARTSUPP
(
        like tpch.partsupp
)
SERVER gsmpp_server 
OPTIONS (
        encoding 'utf8',
        location 'obs:///tpch/partsupp.tbl',
        format 'text',
        delimiter '|',
        access_key '',
        secret_access_key '',
        chunksize '64',
        IGNORE_EXTRA_DATA 'on'
);
drop FOREIGN table if exists orders;
CREATE FOREIGN TABLE ORDERS
(
        like tpch.orders
)
SERVER gsmpp_server 
OPTIONS (
        encoding 'utf8',
        location 'obs:///tpch/orders.tbl',
        format 'text',
        delimiter '|',
        access_key '',
        secret_access_key '',
        chunksize '64',
        IGNORE_EXTRA_DATA 'on'
);
drop FOREIGN table if exists lineitem;
CREATE FOREIGN TABLE LINEITEM
(
        like tpch.lineitem
)
SERVER gsmpp_server 
OPTIONS (
        encoding 'utf8',
        location 'obs:///tpch/lineitem.tbl',
        format 'text',
        delimiter '|',
        access_key '',
        secret_access_key '',
        chunksize '64',
        IGNORE_EXTRA_DATA 'on'
);

将 OBS 外表的数据通过 insert 命令导入 GaussDB(DWS) 的数据库表中，数据库内核对应的操作为 OBS 数据高速并发导入 GaussDB(DWS) ：

insert into tpch.lineitem select * from tpchobs.lineitem;
insert into tpch.part select * from tpchobs.part;
insert into tpch.partsupp select * from tpchobs.partsupp;
insert into tpch.customer select * from tpchobs.customer;
insert into tpch.supplier select * from tpchobs.supplier;
insert into tpch.nation select * from tpchobs.nation;
insert into tpch.region select * from tpchobs.region;
insert into tpch.orders select * from tpchobs.orders;

③ 数据分析

在进行数据查询之前，请先执行“Analyze”命令生成与数据库表相关的统计信息，统计信息存储在系统表 PG_STATISTIC 中，执行计划生成器会使用这些统计数据，以生成最有效的查询执行计划。
执行 TPCH-Q5 语句进行查询（带有分组、排序、聚集操作并存的多表连接查询操作），可以获得某地区供货商为公司带来的收入（收入按照 sum( l_extendedprice * (1 - l_discount)) 计算）：

set current_schema='tpch';
Select
n_name,
sum(l_extendedprice * (1 - l_discount)) as revenue
from
customer,
orders,
lineitem,
supplier,
nation,
region
where
c_custkey = o_custkey
and l_orderkey = o_orderkey
and l_suppkey = s_suppkey
and c_nationkey = s_nationkey
and s_nationkey = n_nationkey
and n_regionkey = r_regionkey
and r_name = 'ASIA'
and o_orderdate >= '2022-01-01'::date
and o_orderdate < '2022-01-01'::date + interval '1 year'
group by
n_name
order by
revenue desc;

执行 TPCH-Q16 语句进行查询（带有分组、排序、聚集、去重、NOT IN子查询操作并存的多表连接操作），可以获得能够以指定的贡献条件供应零件的供货商数量：

set current_schema='tpch';
select
p_brand,
p_type,
p_size,
count(distinct ps_suppkey) as supplier_cnt
from
partsupp,
part
where
p_partkey = ps_partkey
and p_brand <> 'Brand#45'
and p_type not like 'MEDIUM POLISHED%'
and p_size in (49, 14, 23, 45, 19, 3, 36, 9)
and ps_suppkey not in (
        select
        s_suppkey
        from
        supplier
        where
        s_comment like '%Customer%Complaints%'
)
group by
p_brand,
p_type,
p_size
order by
supplier_cnt desc,
p_brand,
p_type,
p_size
limit 100;

执行 TPCH-Q17 语句进行查询（带有聚集、聚集子查询操作并存的两表连接操作），可以获得收入损失：

set current_schema='tpch';
select
sum(l_extendedprice) / 7.0 as avg_yearly
from
lineitem,
part
where
p_partkey = l_partkey
and p_brand = 'Brand#23'
and p_container = 'MED BOX'
and l_quantity < (
        select 0.2 * avg(l_quantity)
        from lineitem
        where l_partkey = p_partkey
);

五、GaussDB（DWS）工作负载管理

当有多个数据库用户同时在 GaussDB(DWS) 上执行 SQL 作业时，可能出现以下情况：
- 一些复杂 SQL 可能会长时间占用集群资源，从而影响其他查询的性能。例如一组数据库用户不断提交复杂、耗时的查询，而另一组用户经常提交短查询，在这种情况下，短时查询可能不得不在队列中等待耗时查询完成。
- 一些 SQL 由于数据倾斜、执行计划未调优等原因，占用过多内存空间，导致其他语句因申请不到内存而报错，或占用过多磁盘空间，导致磁盘满而触发集群只读，无法进行写入。
为了提高系统整体吞吐量，避免坏 SQL 影响系统整体运行，可以使用 GaussDB(DWS)工作负载管理功能处理这类问题，例如，将经常提交复杂查询作业的数据库用户分为一类，为这类用户创建一个工作负载队列并给这个队列分配多一些的资源，之后将这类用户添加至这个队列中，那么这类用户所提交的复杂作业只能使用所创建队列拥有的资源；同时再创建一个占用资源较少的队列分配给执行短查询的用户使用，这样两种作业就能够同时执行互不影响。
继续使用上文中”GaussDB（DWS）数据模拟分析“中，创建的集群并使用 Data Studio 连接集群连接集群的示例，来进行工作负载管理的分析。为有效进行资源管控，将报表分析和核心交易业务进行数据库用户分离，例如核心交易业务使用数据库用户 budget_config_user，报表分析业务使用数据库用户 report_user，针对交易用户和报表用户分别进行 CPU 资源和并发数控制以保障数据库稳定运行。
结合报表分析业务的负载调研、日常监控和测试验证，50并发以内的复杂报表 SQL 不会引起服务器资源争抢，不会引起业务系统卡慢，配置报表用户可使用 20% 的CPU资源。结合核心交易业务的负载调研、日常监控和测试验证，100 并发以内的查询 SQL 不会对系统造成持续压力，配合交易用户可使用 60% 的 CPU 资源：
- 报表用户资源配置（对应负载队列 queue_1）：CPU=20%，内存=20%，存储=1024000MB，并发=20;
- 交易用户资源配置（对应负载队列 queue_2）：CPU=60%，内存=60%，存储=1024000MB，并发=200；
设置单个语句最大内存使用量，超过使用量则报错退出，避免单个语句占用过多内存，异常规则中设置阻塞时间=1200S，执行所消耗时间 1800s，强制终止。
首先创建核心交易用户 budget_config_user 和报表用户 report_user：

CREATE USER budget_config_user PASSWORD‘password’;
CREATE USER report_user PASSWORD‘password’;

为测试需要，将 tpch 模式下所有表的所有权限授予两个用户：

GRANT ALL PRIVILEGES ON ALL TABLES IN SCHEMA tpch to budget_config_user,report_user;

查看当前两个用户的资源分配情况：

SELECT * FROM PG_TOTAL_USER_RESOURCE_INFO where username in ('budget_config_user' , 'report_user');

修改异常规则：单击创建好的 queue_1 队列，在异常规则中，修改“阻塞时间”和“执行所消耗时间”分别为 1200s 和 1800s，然后保存（重复以上步骤，修改 queue_2）：

关联用户，点击“queue_1”队列 -> “关联用户”右侧的“添加”，勾选报表业务对应的用户 report_user，然后确定（重复以上步骤，将核心交易的用户 budget_config_user 添加入 queue_2 的队列中）：

你可能感兴趣的:(人工智能与云原生,GaussDB数据库,GaussDB,DWS使用流程,GaussDB,DWS基本操作,GaussDB模拟数据分析,GaussDB的工作负载管理)

transformer中seq_len参数的设置 yuweififi transformer 深度学习人工智能
在Transformer模型中，seq_len（序列长度）是一个关键的超参数，下面从不同方面详细介绍它的具体含义和作用：一、基本定义seq_len表示输入到Transformer模型中的序列所允许的最大长度。在自然语言处理任务里，文本会被拆分成一个个的单词、子词或者字符，这些元素构成了一个序列。seq_len就是对这个序列中元素数量的上限规定，它决定了模型输入和输出的维度。二、具体使用输入处理文本
pytorch基础 nn.embedding yuweififi pytorch 人工智能 nlp
nn.Embedding是PyTorch中的一个模块，用于创建嵌入层（embeddinglayer），它将离散的索引（例如词汇表中的单词索引）映射为固定大小的稠密向量。这是许多NLP模型（包括Transformer）中的基本组件。示例用法：importtorchimporttorch.nnasnn#定义一个嵌入层vocab_size=10000#词汇表大小embedding_dim=512#嵌入向
pytorch基础-layernormal 与 batchnormal yuweififi pytorch 人工智能 python
nn.LayerNorm（层归一化）和nn.BatchNorm（批量归一化）是深度学习中常用的两种归一化方法，都有助于提高模型的训练效率和稳定性，但它们在归一化维度、应用场景、计算方式等方面存在明显区别，以下为你详细介绍：1、归一化维度nn.LayerNorm：对单个样本的特征维度进行归一化。无论输入数据的形状如何，它会计算每个样本在特征维度上的均值和方差，然后进行归一化。例如，对于一个形状为(b
javaweb将上传的图片保存在项目文件webapp下的upload文件夹下 yuren_xia 后端技术前端技术 web app java tomcat eclipse
前端HTML表单(upload.html)首先，创建一个HTML页面，允许用户选择并上传图片。图片上传上传图片注意：表单的method设置为"post"，enctype需设置成"multipart/form-data"2.后端Servlet(UploadServlet.java)接下来，创建一个Servlet来处理文件上传请求，并将上传的图片保存到webapp/load目录下。packagecom
anaconda 创建虚拟环境 yuweififi 环境搭建
1.打开AnacondaPrompt2.创建环境condacreate--nametorchpython=3.62.输入activatetorch安装的anacondapython虚拟环境打开，torch为创建的env名字3.condainfo--env查看所有创建的环境4.关闭环境deactivate切记先激活环境
通俗理解闭包 yuren_xia 前端技术 javascript
JavaScript在ES6之前并没有类的概念，但通过原型链和闭包，开发者可以实现类似继承和封装的功能（原型链实现继承，闭包实现封装）。ES6引入了类语法，但闭包仍然是实现私有数据封装的重要手段之一。另外，使用闭包还可用于保存上下文信息等场景。一、定义从函数角度闭包是指有权访问另一个函数作用域中的变量的函数。即使外部函数已经返回，闭包仍然可以访问外部函数内部的变量。例如：functionouter
【Multipath网络层协议】MPTCP工作原理码上为赢 Multipath精通之路 multipath MPTCP
常见网络层多路径协议介绍MPTCP（MultipathTCP）MPTCP是在传统TCP基础上进行扩展的协议，它允许在源端和目的端之间建立多个TCP子流，这些子流可以通过不同的网络路径传输数据。例如，一台笔记本电脑同时连接了Wi-Fi网络和以太网网络，当使用MPTCP进行数据传输时，它可以将数据分别通过Wi-Fi和以太网这两条不同的路径发送到目标服务器，从而充分利用两条链路的带宽。LISP（Loca
最好Wordpree+Apache+PHP安装教程伶星37 apache php 开发语言
前提需要PHP的安装最少需要7.4以上Mysql的安装，直接默认最新版就行APache服务器（HTTP服务器，只有用这个你的软件才能在服务器上运行）安装apache安装sudoaptinstallapache2查看防火墙sudoufwapplist如果有Apache那么就可以直接访问安装PHP版本7.4就可以sudoaptinstallphp-mysqlsudosystemctlrestartap
【C++】：STL详解 —— list类 -元清- 重制C++版 c++开发语言
目录list的概念list的构造函数list的大小size()resize()empty()list的插入push_front()和emplace_front()push_back()和emplace_back()insert()和emplace()list的删除pop_front()pop_back()erase()remove()remove_if()unique()clear()list的拼
后端开发技巧：提升代码质量与系统性能 wenbin_java java spring boot maven mybatis
引言后端开发是构建高效、稳定应用的核心环节。无论是处理复杂的业务逻辑，还是优化系统性能，后端开发者都需要掌握一系列技巧和最佳实践。本文将分享一些实用的后端开发技巧，帮助你提升代码质量、优化系统性能并确保应用的安全性。1.提升代码质量的技巧1.1遵循编码规范统一风格：使用工具（如Checkstyle、ESLint）确保代码风格一致。命名规范：变量、函数、类名应具有描述性，避免使用缩写。1.2模块化与
【面试实战】Spring基础、IoC、AOP、MVC、Mybatis、Spring Boot Sivan_Xin 技术实战专栏（已上云）面试 mvc spring
version：1.0文章目录SpringSpring基础/IoC‍♂️面试官：举例Spring的模块？‍♂️面试官：Spring、SpringMVC、SpringBoot关系？‍♂️面试官：说说对SpringIoC的了解？‍♂️面试官：什么是SpringBean？‍♂️面试官：Bean的作用域？‍♂️面试官：Bean的生命周期？‍♂️面试官：单例Bean的线程安全问题了解吗？‍♂️面试官：@Co
SQL注入原理即sqli-labs搭建，sql注入简单实战 Cwillchris 网络安全全栈课程渗透测试 web安全安全 sql
一、SQL注入概述1、SQL注入原理用户登录的基本SQL语句：select*fromuserswhereusername='用户输入的用户名'andpassword='用户输入的密码'用户输入的内容是可控的，例如我们可以在用户名中输入'or1=1--空格select*fromuserswhereusername=''or1=1--空格'andpassword='用户输入的密码'此时我们输入的第一个
我在广州学 Mysql 系列——存储过程与存储函数详解练小杰数据库相关 mysql android 数据库学习 adb sql
ℹ️大家好，我是练小杰，今天周五了，一周就这样从手上溜走了，还有两星期过年！！本文将学习MYSQL中存储过程与存储函数的概念~~回顾：【索引详解】【索引相关练习】数据库专栏【数据库专栏】~想要了解更多内容，主页【练小杰的CSDN】文章目录存储过程与存储函数存储过程（StoredProcedure）存储函数（StoredFunction）⚠️主要区别选择存储过程还是存储函数创建存储过程命令解释创建存
我在广州学 Mysql 系列——数据表查询命令详解练小杰数据库相关 mysql 数据库学习经验分享 adb 后端
ℹ️大家好，我是LXJ，今天星期二了，本文将讲述MYSQL查询数据的详细命令以及相关例题~~复习：《Mysql函数的练习题》同时，数据库相关内容查看专栏【数据库专栏】~想要了解更多内容请点击我的主页:【练小杰的CSDN】“倒霉，倒霉，倒霉！”——龙叔文章目录前言基本查询语句单个表格查询查询所有字段查询指定字段查询指定记录带IN关键字的查询带BETWEENAND的范围查询带LIKE的字符匹配查询查询
c++_sort函数惊讶的猫 c语言算法 c++
sort介绍在C/C++中，要想应用排序算法，可以使用c语言的qsort，也可以使用c++的sort。1)qsort是C标准库提供的一个通用排序函数，位于stdlib.h头文件中。qsort适用于C语言中的数组。2)sort是C++中STL的泛型算法（即函数）sort可以排数组，vector(以及其他的容器)sort可以自定义排序规则。引入：#include排静态数组c语言中arr是一个数组名作为
通过TensorFlow实现简单深度学习模型（2） yyc_audio 人工智能深度学习 python 机器学习
前文我们已经实现了对每批数据的训练，下面继续实现一轮完整的训练。完整的训练循环一轮训练就是对训练数据的每个批量都重复上述训练步骤，而完整的训练循环就是重复多轮训练。deffit(model,images,labels,epochs,batch_size=128):forepoch_counterinrange(epochs):print(f"Epoch{epoch_counter}")batch_
小程序中头像昵称填写葱头的故事小程序小程序
官方文档参考小程序用户头像昵称获取规则调整公告新的小程序版本不能通过wx.getUserProfile和wx.getUserInfo获取用户信息注意昵称填写，同时绑定了input和change事件（input是用户输入时触发，change是直接选择微信昵称时触发）getAvater(event){console.log(9,event);console.log('event',event.deta
多边形顺逆时针判定算法详解 wangzy1982 算法
多边形顺逆时针判定解决的问题是给一个多边形的顶点列表或者边列表，判断该多边形是顺时针还是逆时针。多边形顺逆时针判定算法在几何算法中应用十分广泛。因为很多几何算法都需要要根据几何的拓扑结构，为了方便，往往规定外环多边形是逆时针，内环多边形是顺时针。除了介绍算法，作者还会关于误差对算法稳定性影响有详细介绍。更多几何算法，欢迎关注作者gongzhonghao：几何算法算法一：用最远顶点判断顺逆时针边不包
php composer 私有包,手把手教你如何搭建Composer私有仓库超级小嬲 php composer 私有包
现在网上到处充斥这各种搭建私有仓库文档，但对于新手来说，总是有那么多的坑。这里我把我的摸索历程写出来给大家参考，希望大家能少踩一些坑。现在网上到处充斥这各种搭建私有仓库文档，但对于新手来说，总是有那么多的坑。这里我把我的摸索历程写出来给大家参考，希望大家能少踩一些坑。一，安装ComposerComposer的安装已经有很完善的教程，这里我就不重复造轮子了。安装Composer安装好之后就能直接在命
【AI+智造】基于阿里云Ubuntu24.04系统，使用Ollama部署开源DeepSeek模型并集成到企业微信邹工转型手札 Duodoo开源 Odoo18开源企业信息化制造人工智能数据分析
作者：Odoo技术开发/资深信息化负责人日期：2025年2月28日本方案结合了本地部署与云服务调用的技术路径，涵盖部署步骤、集成逻辑及关键问题点，适用于企业级AI应用场景。一、方案背景与架构设计1.技术选型背景DeepSeek模型：作为开源大模型，支持文本生成、智能问答等场景，适合企业知识库与自动化服务。Ollama工具：轻量化本地模型部署框架，支持一键拉取模型镜像并启动API服务。企业微信集成：
c语言概率产生字母,智邮普创c语言面试题 ---- 字母概率(示例代码) 飞跃思考 c语言概率产生字母
题目描述小明最近对概率问题很感兴趣。一天，小明和小红一起玩一个概率游戏，首先小明给出一个字母和一个单词，然后由小红计算这个字母在这个单词中出现的概率。字母不区分大小写。例如，给定的字母是a，单词是apple，那么概率是0.20000。输入输入包含多组测试数据。每组数据包含一个字母和一个单词。单词的长度不超过200。输出对于每一个输入，输出对应的概率，结果保留5位小数。样例输入aapplecCand
c语言字母概率,C/C++知识点之智邮普创c语言面试题 ---- 字母概率 OK up c语言字母概率
本文主要向大家介绍了C/C++知识点之智邮普创c语言面试题----字母概率，通过具体的内容向大家展示，希望对大家学习C/C++知识点有所帮助。题目描述小明最近对概率问题很感兴趣。一天，小明和小红一起玩一个概率游戏，首先小明给出一个字母和一个单词，然后由小红计算这个字母在这个单词中出现的概率。字母不区分大小写。例如，给定的字母是a，单词是apple，那么概率是0.20000。输入输入包含多组测试数据
Nginx 请求转发配置指南 web13093320398 面试学习路线阿里巴巴 nginx linux 运维
Nginx请求转发配置指南1.简介Nginx是一款高性能的HTTP和反向代理服务器，也是一个IMAP/POP3/SMTP代理服务器。本文档将介绍如何使用Nginx配置请求转发，并解释一些常用的配置参数。2.Nginx安装在配置之前，确保你的系统已经安装了Nginx。如果未安装，可以使用以下命令进行安装：在CentOS/RHEL上：sudoyuminstallnginx-y在Ubuntu/Debia
自动化脚本在Xshell中的应用这多冒昧啊运维 github git 运维自动化自动化脚本脚本
Xshell是一款功能强大的终端模拟软件，主要用于远程连接和管理服务器。它支持多种协议，包括SSH、Telnet、SFTP等，使用户能够通过命令行界面对远程服务器进行操作。Xshell提供了丰富的功能和特点，使其成为系统管理员、开发人员和网络工程师的得力工具。目录一、概述二、自动化脚本在Xshell中的应用案例案例一：自动化系统更新与维护案例二：自动化备份与恢复案例三：自动化网络安全检查三、总结一
AI加速回归测试：如何用大模型预测哪些模块最容易出问题测试者家园人工智能测试开发和测试质量效能人工智能质量效能软件测试软件研发大模型预测回归测试风险预测
用ChatGPT做软件测试回归测试是软件开发过程中必不可少的环节，尤其是在持续集成和快速迭代的开发环境下。随着软件系统变得日益复杂，传统的回归测试面临着显著的挑战：测试覆盖面广、执行周期长、资源消耗大，而测试人员又常常无法准确预测哪些模块会出现问题。为了提高回归测试的效率和精准性，AI，特别是大模型技术的引入，为回归测试的智能化提供了前所未有的机遇。通过大模型的预测能力，测试团队能够更加高效地识别
说说 Spring MVC 的执行流程？浮生带你学Java Java面试题 Spring spring mvc java
高频面试题：说说SpringMVC的执行流程？大家好，我是浮生，一个工作了十四年的java程序员！昨天，一个工作2年的粉丝在面试的时候，面试官要求他说SpringMVC的执行流程。他没回答上来，错过了这个offer。一、问题解析SpringMVC的执行流程，一个面试频率超级高的问题，但是缺难倒了无数的程序员。这个问题的考察范围主要是3~5年，甚至5年以上都会问到。和它同类型的问题还有Bean的加载
-字母概率- -JMY- C++题库 c++
题目描述小明最近对概率问题很感兴趣。一天，小明和小红一起玩一个概率游戏，首先小明给出一个字母和一个单词，然后由小红计算这个字母在这个单词中出现的概率。字母不区分大小写。例如，给定的字母是a，单词是apple，那么概率是0.20。输入输入包含多组测试数据。每组数据包含一个字母和一个单词。单词的长度不超过200。输出对于每一个输入，输出对应的概率，结果保留2位小数。样例输入aapple样例输出0.20
15天大厂真题带刷day1 练习时长两年半1 算法数据结构
牛客网在线编程_算法面试_15天大厂真题带刷(nowcoder.com)ZT123年OPPO-a的翻转描述数字a翻转数位得到数字b，计算+a+b。输入描述：一个正整数 (1⩽⩽109)a(1⩽a⩽109)。保证a在十进制下每一位都非00。输出描述：一个正整数表示答案。示例1输入：12输出：33说明：正整数=12a=12，翻转得到=21b=21，+=33a+b=33。示例2输入：23输出：55im
蓝桥杯二分题练习时长两年半1 算法数据结构 java 蓝桥杯
P1083[NOIP2012提高组]借教室题目描述在大学期间，经常需要租借教室。大到院系举办活动，小到学习小组自习讨论，都需要向学校申请借教室。教室的大小功能不同，借教室人的身份不同，借教室的手续也不一样。面对海量租借教室的信息，我们自然希望编程解决这个问题。我们需要处理接下来n天的借教室信息，其中第i天学校有ri个教室可供租借。共有m份订单，每份订单用三个正整数描述，分别为,,dj,sj,tj，
SpringCloud/Boot集成LogBack azoon.top spring cloud logback spring log4j slf4j
一.简要介绍什么是SLF4J？官网介绍：SimpleLoggingFacadeforJava（SLF4J）充当简单的各种日志记录框架的Facade或抽象（e.g.java.util.logging、logback、log4j）允许最终用户在部署时插入所需的日志记录框架。类似java中的接口，如果只集成SLF4J，日志只能输出在控制台，并没有输出到文件的能力，要实现真正的日志能力，需要引入其实现层：
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo

华为云原生之数据仓库服务GaussDB(DWS)的深度使用与应用实践

一、GaussDB（DWS）简介

① 什么是 GaussDB（DWS）？

② 数据仓库类型

③ GaussDB（DWS）的应用场景

④ GaussDB（DWS）优势

⑤ GaussDB（DWS）功能

（A）企业级数据仓库和标准 SQL 的支持

（B）多样化的数据导入方式

（C）应用程序接口

（D）支持多种数据库工具

二、GaussDB(DWS) 使用流程

① 准备工作

② 创建集群

③ 连接集群

（A）获取集群连接地址

（B）使用 Data Studio 连接到集群数据库

（C）管理数据库连接

④ 管理和监控集群

（A）管理集群

（B）管理快照

（C）运维与监控

三、GaussDB（DWS）的基本使用

① 设置创建数据库的权限

② 创建和管理数据库

③ GaussDB(DWS) 设置存储模型

④ 创建与管理表

（A）创建表

(B) 向表中插入数据

© 更新表中数据

(D) 查看数据

（E）删除表中数据

⑤ 创建和管理 schema

（A）创建 schema

(B) 使用 schema

© schema 的搜索路径

(D) schema 权限控制

(E) 删除 schema

⑥ 管理分区表

⑦ 管理索引

⑧ 管理视图

⑨ 管理序列

⑩ 管理定时任务

四、GaussDB（DWS）模拟数据分析

① 准备工作

② 导入样例数据

③ 数据分析

五、GaussDB（DWS） 工作负载管理

你可能感兴趣的:(人工智能与云原生,GaussDB数据库,GaussDB,DWS使用流程,GaussDB,DWS基本操作,GaussDB模拟数据分析,GaussDB的工作负载管理)

五、GaussDB（DWS）工作负载管理