Free World

GP基本命令

su - gpadmin
gpstart #正常启动
gpstop #正常关闭
gpstop -M fast #快速关闭
gpstop –r #重启
gpstop –u #重新加载配置文件

登陆与退出Greenplum
#正常登陆
psql gpdb
psql -d gpdb -h gphostm -p 5432 -U gpadmin
#使用utility方式
PGOPTIONS="-c gp_session_role=utility" psql -h -d dbname hostname -p port
#退出
在psql命令行执行\q

参数查询
psql -c 'SHOW ALL;' -d gpdb
gpconfig --show max_connections

创建数据库
createdb -h localhost -p 5432 dhdw

创建GP文件系统
# 文件系统名
gpfsdw
# 子节点，视segment数创建目录
mkdir -p /gpfsdw/seg1
mkdir -p /gpfsdw/seg2
chown -R gpadmin:gpadmin /gpfsdw
# 主节点
mkdir -p /gpfsdw/master
chown -R gpadmin:gpadmin /gpfsdw
gpfilespace -o gpfilespace_config
gpfilespace -c gpfilespace_config

创建GP表空间
psql gpdb
create tablespace TBS_DW_DATA filespace gpfsdw;
SET default_tablespace = TBS_DW_DATA;

删除GP数据库
gpdeletesystem -d /gpmaster/gpseg-1 -f

查看segment配置
select * from gp_segment_configuration;

文件系统
select * from pg_filespace_entry;

磁盘、数据库空间
SELECT * FROM gp_toolkit.gp_disk_free ORDER BY dfsegment;
SELECT * FROM gp_toolkit.gp_size_of_database ORDER BY sodddatname;

日志
SELECT * FROM gp_toolkit.__gp_log_master_ext;
SELECT * FROM gp_toolkit.__gp_log_segment_ext;

表描述
/d+

表分析
VACUUM ANALYZE tablename;

表数据分布
SELECT gp_segment_id, count(*) FROM GROUP BY gp_segment_id;

表占用空间
SELECT relname as name, sotdsize/1024/1024 as size_MB, sotdtoastsize as toast, sotdadditionalsize as other
FROM gp_toolkit.gp_size_of_table_disk as sotd, pg_class
WHERE sotd.sotdoid = pg_class.oid ORDER BY relname;

索引占用空间
SELECT soisize/1024/1024 as size_MB, relname as indexname
FROM pg_class, gp_toolkit.gp_size_of_index
WHERE pg_class.oid = gp_size_of_index.soioid
AND pg_class.relkind='i';

OBJECT的操作统计
SELECT schemaname as schema, objname as table, usename as role, actionname as action, subtype as type, statime as time
FROM pg_stat_operations
WHERE objname = '';

锁
SELECT locktype, database, c.relname, l.relation, l.transactionid, l.transaction, l.pid, l.mode, l.granted, a.current_query
FROM pg_locks l, pg_class c, pg_stat_activity a
WHERE l.relation=c.oid
AND l.pid=a.procpid
ORDER BY c.relname;

队列
SELECT * FROM pg_resqueue_status;

加载（LOAD）数据到Greenplum数据库
gpfdist外部表
# 启动服务
gpfdist -d /share/text -p 8081 –l /share/text/gpfdist.log &

# 创建外部表，分隔符为’/t’
drop EXTERNAL TABLE TD_APP_LOG_BUYER;
CREATE EXTERNAL TABLE TD_APP_LOG_BUYER (
IP text,
ACCESSTIME text,
REQMETHOD text,
URL text,
STATUSCODE int,
REF text,
name text,
VID text)
LOCATION ('gpfdist://gphostm:8081/xxx.txt')
FORMAT 'TEXT' (DELIMITER E'/t'
FILL MISSING FIELDS) SEGMENT REJECT LIMIT 1 percent;

# 创建普通表
create table test select * from TD_APP_LOG_BUYER;

# 索引
# CREATE INDEX idx_test ON test USING bitmap (ip);

# 查询数据
select ip , count(*) from test group by ip order by count(*);
gpload
# 创建控制文件
# 加载数据
gpload -f my_load.yml
copy
COPY country FROM '/data/gpdb/country_data'
WITH DELIMITER '|' LOG ERRORS INTO err_country
SEGMENT REJECT LIMIT 10 ROWS;
从Greenplum数据库卸载（UNLOAD）数据

gpfdist外部表
# 创建可写外部表
CREATE WRITABLE EXTERNAL TABLE unload_expenses
( LIKE expenses )
LOCATION ('gpfdist://etlhost-1:8081/expenses1.out',
'gpfdist://etlhost-2:8081/expenses2.out')
FORMAT 'TEXT' (DELIMITER ',')
DISTRIBUTED BY (exp_id);

# 写权限
GRANT INSERT ON writable_ext_table TO ;

# 写数据
INSERT INTO writable_ext_table SELECT * FROM regular_table;

copy
COPY (SELECT * FROM country WHERE country_name LIKE 'A%') TO '/home/gpadmin/a_list_countries.out';

执行sql文件

psql gpdbname –f yoursqlfile.sql
或者psql登陆后执行
\i yoursqlfile.sql

1.GP库的镜像设置参数： gp_fault_action
该参数存在master主机的postgresql.conf配置文件中，该参数的主要作用是当数据库的segment失败的时候，
数据库下一步动作的判断，主要有以下3种：none,readonly和continue。
none是指没有配置mirror，在这种模式下，数据库失败时系统将自动关闭，这时需要恢复失败的segment；
readonly是指任意一个segment实例失败时，系统将不允许任何的DDL和DML命令，在这种模式下，数据库不会关闭，仍然可以查询，恢复失败的segment时需要将系统关闭。
这个模式是默认的模式。
continue模式是指当系统遇到节点失败时，仍然可以允许系统做DDL和DML操作，在失败的segment继续能使用时必须恢复并保证它上面的数据与相对应的镜像节点数据
保持一致，恢复时需要关闭系统。
当segment和镜像同时失败，或者segment的镜像失败时，系统将不能操作直到被恢复。
更改该参数的步骤：
a.$ gpstop
b.编辑postgresql.conf文件，并保存，比如设置 gp_fault_action=readonly；
c.$ gpstart

pg_cancel_backend这个函数主要是用来取消一个查询(进程)，权限必须是管理员或者查询的所有者。
具体使用如下：
首先，查出你要取消的进程号
select procpid from pg_stat_activity where ......;
其次，用这个函数来取消
select pg_cancel_backend(procpid);
这个函数主要是用来回滚事务，但是会话(session)并不会退出去，比如你要用这个函数来终止一个是不可能的。
当一个查询语句查询时间较长时用这个函数偶尔也不好用，这个时候需要多执行几次或去OS上用kill命令来删除这个进程效果就来得快。

可以在master 主机上查看进程，对每个客户端连接，master 都会创建一个进程。
ps -ef |grep -i postgres |grep -i con

定期使用Vacuum analyze tablename 回收垃圾和收集统计信息，尤其在大数据量delete和update，或者导入以后，非常重要。

vacuum分两种，一种是analyze，优化查询计划的。还有一种是清理垃圾数据。

postres删除工作，并不是真正删除数据，而是在被删除的数据上，坐一个标记，
只有执行vacuum后，才会真正的把物理空间释放，这个非常重要，有些经常更新的表，各种查询、更新效率会越来越慢，这个多是因为没有做vacuum的原因。

下面看一个例子
create table dw_temp.category_detail_test as select * from dw_stage.category_detail;

select count(1) from dw_temp.category_detail_test;

--9800

select pg_relation_size('dw_temp.category_detail_test');

--2228224

delete from dw_temp.category_detail_test where category_id<99999;

--查询成功: 共计 3805 行受到影响，耗时: 15 毫秒(ms)。

select pg_relation_size('dw_temp.category_detail_test');

--2228224

vacuum dw_temp.category_detail_test;

select pg_relation_size('dw_temp.category_detail_test');

该动作会消耗系统一定的资源，引起系统的IO上升，对有一定系统瓶颈来说容易造成堵塞，严重会把GP宕掉，造成数据库瞬断。

Table 9-47. Database Object Size Functions

Name   Return Type   Description
pg_column_size(any)   int   Number of bytes used to store a particular value (possibly compressed)
pg_tablespace_size(oid)   bigint   Disk space used by the tablespace with the specified OID
pg_tablespace_size(name)   bigint   Disk space used by the tablespace with the specified name
pg_database_size(oid)   bigint   Disk space used by the database with the specified OID
pg_database_size(name)   bigint   Disk space used by the database with the specified name
pg_relation_size(oid)   bigint   Disk space used by the table or index with the specified OID
pg_relation_size(text)   bigint   Disk space used by the table or index with the specified name. The table name may be qualified with a schema name
pg_total_relation_size(oid)   bigint   Total disk space used by the table with the specified OID, including indexes and toasted data
pg_total_relation_size(text)   bigint   Total disk space used by the table with the specified name, including indexes and toasted data. The table name may be qualified with a schema name
pg_size_pretty(bigint)   text   Converts a size in bytes into a human-readable format with size units

【查询计划和调度】
查询处理顺序：
1. 用户查询请求
2. Master（解析sql、优化sql）
3. Master把任务分配到各个Segment执行
4. 每个segment负责查询自己本节点数据（执行的操作包括：table scan、join、aggregations、sort）
这些都是同时并行执行的、而且都是独立的。
如果某个查询只涉及到单个segment的数据的话，master是不会分配到所有的segment，
仅仅是分配至该segment。例如: 单行的增删改查、通过表的分布键过滤后的少量结果集...等等
5. 查询的结果返回给master
6. master再发送给用户

【查询计划】
查看Query Plan的时是从底至上的。
Motion -- 主要是涉及到多个节点之间完成任务的话，节点之间会发生数据移动。

Slice -- GP在执行查询时为了获得最优性能，把任务进行了切片。一个查询计划是根据motion来进行切分的，每个slice以motion作为边界。

Redistribute Motion -- Segment之间移动数据。这个是非常之消耗性能的。在前期表设计的时候就要避免这样的操作。
Gather Motion -- Segment将数据传给Master。不是所有的查询计划都调用gather motion。例如：CREATE TABLE AS SELECT ...这个就没有gather motion,结果被存储到新表里面是不需要经过master的。
eg：SELECT customer,amount
FROM sales JOIN customer USING (cust_id)
WHERE dateCol = '03-06-2012';

【并行查询】
Query Dispather(QD) -- Master节点查询任务处理，负责创建和分配查询计划、收集传送最终结果
Query Executor(QE) -- Segment节点查询处理，负责完成数据的计算、多个QE之间的中间结果通讯。
为查询计划的每个slice会被分配到至少一个worker process
Gangs -- 工作于相同slice的查询计划的相关process。当一个slice任务完成后,这个gang会把数据向上级gang传递。
内部通信是通过内部进程来控制的。

CREATE TABLE SALES
(
    PROD_ID numeric NOT NULL ,
    CUST_ID numeric NOT NULL ,
    TIME_ID DATE NOT NULL ,
    CHANNEL_ID numeric NOT NULL ,
    PROMO_ID numeric NOT NULL ,
    QUANTITY_SOLD numeric(10,2) NOT NULL ,
    AMOUNT_SOLD numeric(10,2) NOT NULL
)
WITH (appendonly=true,orientation=column,compresstype=QUICKLZ,COMPRESSLEVEL=1)
distributed by (prod_id,cust_id,time_id,channel_id,promo_id)
partition by range(time_id)
(
    START (date '1998-01-01') INCLUSIVE
    EVERY (INTERVAL '1 year'),
    DEFAULT PARTITION other

);

查看每个节点的filespace和location的关系

select a.dbid,a.content,a.role,a.port,a.hostname,b.fsname,c.fselocation from gp_segment_configuration a,pg_filespace b,pg_filespace_entry c where a.dbid=c.fsedbid and b.oid=c.fsefsoid order by content;

dbid | content | role | port | hostname | fsname | fselocation
------+---------+------+-------+----------+-----------+-----------------------
1 | -1 | p | 5432 | cdha | pg_system | /data/master/gpseg-1
2 | 0 | p | 40000 | cdhb | pg_system | /data1/primary/gpseg0
10 | 0 | m | 50000 | cdhc | pg_system | /data1/mirror/gpseg0
3 | 1 | p | 40001 | cdhb | pg_system | /data1/primary/gpseg1
11 | 1 | m | 50001 | cdhc | pg_system | /data1/mirror/gpseg1
4 | 2 | p | 40002 | cdhb | pg_system | /data2/primary/gpseg2
12 | 2 | m | 50002 | cdhc | pg_system | /data2/mirror/gpseg2
5 | 3 | p | 40003 | cdhb | pg_system | /data2/primary/gpseg3
13 | 3 | m | 50003 | cdhc | pg_system | /data2/mirror/gpseg3
6 | 4 | p | 40000 | cdhc | pg_system | /data1/primary/gpseg4
14 | 4 | m | 50000 | cdhb | pg_system | /data1/mirror/gpseg4
15 | 5 | m | 50001 | cdhb | pg_system | /data1/mirror/gpseg5
7 | 5 | p | 40001 | cdhc | pg_system | /data1/primary/gpseg5
16 | 6 | m | 50002 | cdhb | pg_system | /data2/mirror/gpseg6
8 | 6 | p | 40002 | cdhc | pg_system | /data2/primary/gpseg6
17 | 7 | m | 50003 | cdhb | pg_system | /data2/mirror/gpseg7
9 | 7 | p | 40003 | cdhc | pg_system | /data2/primary/gpseg7
(17 rows)

greenplum资源队列李春田
文章来源https://www.cnblogs.com/pl-boke/p/9852439.html官方文档：https://gpdb.docs.pivotal.io/6-8/admin_guide/workload_mgmt.html1、创建资源队列语法Command:CREATERESOURCEQUEUEDescription:createanewresourcequeueforworkloa
makefile工程c语言工程在eclipse下如何配置头文件路径乔丹搞IT
makefile工程c语言工程在eclipse下如何配置头文件路径如果是普通的c工程，没有使用makefile管理，则参考网络上的文章。这里我使用的是eclipsecppIDE导入一个greenplum5.0.0的源码，在查看gpperfmon源码时，发现在ide中无法直接查看apr相关的头文件内容，发现apr相关的头文件在目录/usr/include/apr-1目录中。修改方法：1，修改源码，把
Greenplum数据库用正则表达式进行高效数据匹配与处理中台小A greenplum 数据库正则表达式
利用正则表达式，可以在Greenplum数据库中进行高效的数据匹配和处理。通过正则表达式函数和运算符，可以实现数据的模式匹配、数据提取、数据清洗等操作。这些功能为数据分析、数据清洗和数据转换提供了强大的工具。正则表达式简介正则表达式是一种描述文本模式的字符串。它由各种字符和操作符组成，用于匹配、查找和替换文本中的特定模式。在Greenplum数据库中，可以使用正则表达式进行模式匹配、数据提取、数据
MYSQL的读写扩展 hailang86 mysql 数据库
1.分布式数据库有很多种：采用分库分表方式将数据路由拆分到多个数据库上；以greenplum未代表的mpp数据库架构；以tidb为代表的newSQl数据库架构。2.mpp数据架构是一种处理大规模数据分析任务的分布式数据架构，大规模并行处理。当执行一条SQL语句时，会将语句发送到所有数据节点进行查询处理，利用多节点的计算能力进行计算。3.分库分表主要用于简单的业务场景，OLTP场景，onlinetr
ThreadLocal浅析早点起床晒太阳
1、背景在使用我们的ToolBox(我们公司的数据分析平台)在往greenplum使用goload入数据的时候出现了数据错乱的问题，后来定位问题发现SimpledateFormat在多线程下是线程不安全的，刚开始我用匿名对象去解决这个问题，后来发现还是用ThreadLocal去解决才能提高效率，而且能保证安全2、ThreadLocal作用ThreadLocal提供了线程的局部变量，每个线程都可以通
GreenPlum安装文档瞬即逝转
点点滴滴，简单记录。第一次写，不足之处请多包涵文档说明：1.greenplum-db5.10.2版本安装，网上有很多安装方法，本篇文档也是站在各位大牛肩膀上自己稍微整理了一下2.文档不太美观，从word复制到简述编辑器上，格式无法完美移植。特此说明：加粗处为执行命令，斜体为配置内容1安装说明名称版本操作系统CentOS6.564bitgreenplumgreenplum-db-appliance-
人麻了，刚面试入职就遇到MySQL亿级大表调优... IT邦德 Mysql 面试 mysql 职场和发展
哈喽！大家好，我是【IT邦德】，江湖人称jeames007，10余年DBA及大数据工作经验一位上进心十足的【大数据领域博主】！中国DBA联盟(ACDU)成员，目前服务于工业互联网擅长主流Oracle、MySQL、PG、高斯及Greenplum运维开发，备份恢复，安装迁移，性能优化、故障应急处理等。✨如果有对【数据库】感兴趣的【小可爱】，欢迎关注【IT邦德】❤️❤️❤️感谢各位大可爱小可爱！❤️❤️
从 Greenplum 到 Databend，万全网络数据库平台架构演进 Databend 网络数据库架构
作者：代城万全网络高级工程师，负责万全网络数据平台整体架构研发工作，拥有超过7年的大数据相关技术研发经验，一直关注着开源和云技术的发展。万全网络科技有限公司是一家专注于B端电商物流供应链的公司。致力于为客户提供全面的供应链解决方案，涵盖从产品采购到最终配送的全程服务。公司的服务包括但不限于：供应链管理，仓储与配送，信息技术支持。迁移背景在不断发展的科技环境中，企业往往需要不断调整和优化其技术基础设
StarRocks在千亿级日增数据场景下替换Greenplum的实践 StarRocks_labs 大数据数据库 sql
原Greenplum集群在进行10亿*1亿的关联查询时达到极限，无法支撑更大数据量级的关联查询。使用StarRocks替换Greenplum构建新的集群，在进行736亿*15亿的超大量级数据关联查询时，不仅可以顺利完成，并且耗时很短，对业务的整体提升巨大。一、使用背景1.1选用原因我司原有业务查询使用的数据库为Greenplum，在数据源变更后，数据量从原来的日增千万级别（近百G）暴增至日增千亿（
聊聊Greenplum的那些事 weixin_30859423 数据库 python 运维
开卷有益——作者的话原文来自http://dbaplus.cn/news-21-341-1.html有时候真的感叹人生岁月匆匆，特别是当一个IT人沉浸于某个技术领域十来年后，蓦然回首，总有说不出的万千感慨。笔者有幸从04年就开始从事大规模数据计算的相关工作，08年作为Greenplum早期员工加入Greenplum团队（当时的工牌是“005”，哈哈），记得当时看了一眼Greenplum的架构（嗯，
（转）聊聊Greenplum的那些事 weixin_33908217 数据库 python 运维
开卷有益——作者的话有时候真的感叹人生岁月匆匆，特别是当一个IT人沉浸于某个技术领域十来年后，蓦然回首，总有说不出的万千感慨。笔者有幸从04年就开始从事大规模数据计算的相关工作，08年作为Greenplum早期员工加入Greenplum团队（当时的工牌是“005”，哈哈），记得当时看了一眼Greenplum的架构（嗯，就是现在大家耳熟能详的那个好多个X86框框的图），就义无反顾地加入了，转眼之间，
Spark——Spark读写Greenplum/Greenplum-Spark Connector高速写Greenplum Southwest- Spark spark 大数据分布式
文章目录问题背景解决方式代码实现Spark写GreenplumSpark读Greenplum参考问题背景通过数据平台上的DataX把Hive表数据同步至Greenplum（因为DataX原生不支持GreenplumWriter，只能采用PostgreSQL驱动的方式），但是同步速度太慢了，"jdbc:postgresql://host:5432/db","user"->"u","password"
【无标题】KADB使用DBLINK连接KES验证 littlegirll 数据库 java sql
验证环境KADB版本：GreenplumDatabase6.0.0builddev.V003R002C001B0181.d354cc9215KES版本：KingbaseESV008R006C007B0012DBLINK环境准备KES创建用户KES修改参数，在kingbase.conf文件中，设置password_encryption=md5登录配置文件sys_hba.conf修改登录验证方式为md
KADB使用PXF连接KES验证 littlegirll 数据库
验证环境KADB版本：GreenplumDatabase6.0.0builddev.V003R002C001B0181.d354cc9215KES版本：KingbaseESV008R006C007B0012Java版本：openjdkversion"1.8.0_262"PXF部署以下操作假设KADB和KES已经部署完成并且启动正常，环境变量设置完成设置环境变量在mppadin用户的.bashrc文
《GreenPlum系列》GreenPlum初级教程-05GreenPlum语言DDL&DML&DQL DATA数据猿 Greenplum 数据库 greenplum postgresql
文章目录第五章DDL&DML&DQL1.DDL(DataDefinitionLanguage)数据定义语言1.1创建数据库1.2查询数据库1.3删除数据库1.4创建表1.5修改表1.6清除表1.7删除表2.DML(DataManipulationLanguage)数据操作语言2.1数据导入2.2数据更新和删除2.3数据导出3.DQL(DataQueryLanguage)数据查询语言3.1基础语法及
Oracle 12CR2 RAC部署翻车，bug避坑经历 IT邦德数据库 Oracle oracle bug 数据库
哈喽！大家好，我是【IT邦德】，江湖人称jeames007，10余年DBA及大数据工作经验一位上进心十足的【大数据领域博主】！中国DBA联盟(ACDU)成员，目前服务于工业互联网擅长主流Oracle、MySQL、PG、高斯及Greenplum运维开发，备份恢复，安装迁移，性能优化、故障应急处理等。✨如果有对【数据库】感兴趣的【小可爱】，欢迎关注【IT邦德】❤️❤️❤️感谢各位大可爱小可爱！❤️❤️
【青梅资讯】VMware Greenplum 7 Beta版已正式发布 Greenplum中文社区数据库 postgresql
VMwareGreenplum7.0Beta.0已于2022年12月15日正式发布，随后在2023年2月3日VMwareGreenplum7.0Beta.1也正式上线，现在让我们通过本文一起了解Greenplum7Beta.1和Beta.0版本都引入了哪些新功能和变化。VMwareGreenplum7.0Beta.1发布时间：2023年2月3日VMwareGreenplum7 Beta.1版本现在
技术分享 | OceanBase 集群扩容缩容爱可生开源社区技术分享 OceanBase OceanBase 资源扩缩容
作者：杨文DBA，负责客户项目的需求与维护，会点数据库，不限于MySQL、Redis、Cassandra、GreenPlum、ClickHouse、Elastic、TDSQL等等。本文来源：原创投稿*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。一、环境说明：集群扩容分为两种情况：一种是扩副本，一种是扩资源。原集群部署模式：1-1-1。下面介绍两种扩容方式：扩容副本：
greenplum 6 创建用户问题权限问题异常（创建只查视图用户）圆子_f1fe
greenplum6创建用户问题权限问题异常（创建只查视图用户）解决普通用户默认无限制访问其它数据库问题；解决普通用户可以无限制建表问题；解决普通用户可以用navicat等工具查看系统原表问题；背景：我发现创建一个一个普通用户，在没有做特殊处理的情况下这个用户可以随意访问其它数据库，可以通过navicat等工具随意查看库的表名、函数、视图名等信息（虽然不可编辑，但是也不想让外部无关人员看到无关信息
使用benchmarksql对greenplum压测结果记录 YuVicky
本文将以TPC-C业界标准事务性能测试benchmark来展示Greenplum在事务上的处理能力。TPC-C简介TPC-C是由TPC(TransactionProcessingPerformanceCouncil，事务处理性能委员会)提供的专门针对联机交易处理系统的规范，TPC-C模拟的是一个大型的商品批发销售公司交易负载。这个事务负载主要由9张表组成，主要涉及5类交易类型：新订单生成（New-
【教程】集群搭建准备工作全流程 THE WHY 大数据大数据分布式运维 hadoop 学习
基于VMware创建虚拟机进行集群搭建，适用于hadoop/GreenPlum等集群之前已经创建了三台虚拟机hadoop102，hadoop103，hadoop104来搭建hadoop集群，因为目前学习到了greemplum，因此新建三台虚拟机hadoop105，hadoop106，hadoop107来搭建greenplum集群，整体思路流程大致如下（仅包括虚拟机创建以及环境配置内容，不包括had
从Greenplum一个WARN的排查浅析PostgreSQL MemoryContext内存管理 airfan92 分布式数据库后端 postgresql 数据库内存管理
Greenplum（GP）是一款开源的MPP数据库，兼容PostgreSQL生态。我们尝试基于开源GP支持多个副本，改造让集群从初始的最多只支持一个standbyMaster，到支持多个standby。相关实现并不复杂，内核和工具中没有太多对于standby个数的限制。经过多次的修改后，遗留的问题只剩下了一个：由一行代码引起的、但是找到这行代码花费了很久的WARN。本文就从这个WARN排查的角度，
PostgreSQL 自旋锁浅析 Greenplum中文社区 Greenplum内核机制数据库编程语言 java python 多线程
获得技术资料内容，请访问Greenplum中文社区网站什么是自旋锁经过上次的《PostgreSQL查询优化器详解》中大明和牛二哥对PostgreSQL优化器的概要的讲解，小明感到自己已经深深的爱上了数据库内核，小明在GitChat网站上购买了《PostgreSQL优化器入门》的文字网课，还跑到实体书店买了本《PostgreSQL技术内幕：查询优化深度探索》，每天对照着网课和书上的内容仔细研读Pos
数据库备份脚本嘎嘎香，被秀到了！ IT邦德数据库数据库
哈喽！大家好，我是【IT邦德】，江湖人称jeames007，10余年DBA及大数据工作经验一位上进心十足的【大数据领域博主】！中国DBA联盟(ACDU)成员，目前服务于工业互联网擅长主流Oracle、MySQL、PG、高斯及Greenplum运维开发，备份恢复，安装迁移，性能优化、故障应急处理等。✨如果有对【数据库】感兴趣的【小可爱】，欢迎关注【IT邦德】❤️❤️❤️感谢各位大可爱小可爱！❤️❤️
《GreenPlum系列》GreenPlum初级教程-03GreenPlum系统管理 DATA数据猿 Greenplum 数据库 greenplum postgresql
文章目录第三章GreenPlum系统管理1.关于GreenPlum数据库发布版本号2.启动和停止GreenPlum数据库2.1启动数据库2.2重启数据库2.3仅重新载入配置文件更改2.4停止GreenPlum数据库2.5停止客户端进程3.GreenPlum数据库状态查询4.访问GreenPlum数据库4.1数据库会话参数4.2支持客户端应用4.3psql连接4.4常见的连接问题第三章GreenPl
Greenplum系统配置参数查看与设置 WESTWALL
查看参数数据库：postgres=#showall;系统：gpconfig--showmax_connections原文：https://yq.aliyun.com/articles/145445
GreenPlum的那些事《一》——GreenPlum数据库介绍数据社
1.数据存储行式数据库是按照行存储的，行存储就是各行放入连续的物理位置，就行我们平时写字一样，一行一行的写，读取的时候也是一行一行的读取。像SQLserver,Oracle，mysql等传统的关系型数据库都属于行式数据库范畴。列式数据库是按照列存储的，列存储是把多行数据的每一列按照列存储在磁盘，就像一把数据写入excel表格中，每次按照列读取数据，像Vertica,GreenPlum,HBase(
《GreenPlum系列》GreenPlum详细入门教程02-GreenPlum安装 DATA数据猿 Greenplum greenplum 数据库
文章目录第二章GreenPlum安装1.Docker创建centos容器1.1拉取centos7镜像1.2创建容器1.3进入容器1.4容器和服务器免密操作1.4.1生成密钥1.4.2拷贝密钥1.5安装ssh服务和网络必须应用1.6容器设置root密码1.6.1安装passwd应用1.6.2容器本机root设置密码1.7容器本机免密2.安装GreenPlum2.1准备安装包2.2创建用户及用户组2.
greenplum使用总结之常用SQL及函数 CS枪王 #Greenplum 数据库大数据
---------------------------------------------------建表等-----------------------------------------------------–创建序列–eg:CREATESEQUENCEusers181020_ID_seq2STARTWITH1003INCREMENTBY14NOMINVALUE5NOMAXVALUE6CAC
greenplum 历史拉链表用心一数据仓库数据库 hive
3.1历史拉链表数据仓库定义：是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合，用于支持管理决策。历史拉链表：一种数据模型，主要是针对数据仓库设计中表存储数据的方式而定义的。它记录了一个事物从开始到当前状态的所有变化的信息。避免了按每一天存储所有记录造成的海量存储问题，同事也是处理缓慢变化数据的一种常见方式。3.1.1应用场景描述企业有5000万会员信息，每天有20万会员资料变更，每天
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

GP基本命令

你可能感兴趣的:(Greenplum)