wzy0623

HAWQ技术解析（六） —— 定义对象

HAWQ本质上是一个数据库系统，所以这里所说的对象指的是数据库对象。和其它关系数据库类似，HAWQ中有数据库、表空间、表、视图、自定义数据类型、自定义函数、序列等对象。本篇将简述这些对象的创建与管理。对HAWQ中表的存储方式与分布策略等特性的选择，会对数据库性能产生极大的影响，同时这也是一个复杂的话题，将在下一篇单独讨论。

一、创建和管理数据库
HAWQ中数据库的概念与MySQL类似，一个HAWQ实例中通常会建立多个数据库，这和Oracle中数据库的概念不同。在Oracle体系结构中，数据库是一个“最大”的概念，大多数情况下一个Oracle数据库对应一个实例，RAC是一个数据库对应多个实例。尽管可以在一个HAWQ系统中创建很多数据库，但是客户端程序在某一时刻只能连接到一个数据库，这也决定了HAWQ不能执行跨库的查询。

1. 模板数据库
HAWQ初始化后, 就有了template0和template1两个模板库，开始时这两个库的内容是一样的，并且template0库和template1都不可删除。两者最主要的区别是，缺省时可以连接template1并在其中创建对象，但不能连接template0。
不能删除模板数据库：

gpadmin=# drop database template0;
ERROR:  cannot drop a template database
gpadmin=# drop database template1;
ERROR:  cannot drop a template database
gpadmin=# drop database postgres;
ERROR:  cannot drop a template database

缺省时不能连接template0，但可以连接template1：

gpadmin=# \c template0
FATAL:  database "template0" is not currently accepting connections
Previous connection kept
gpadmin=# \c template1
You are now connected to database "template1" as user "gpadmin".

每一个新创建的数据库都基于一个模板，建库时如果不指定 TEMPLATE属性，默认用的是template1模板库。除非希望某些对象在每一个新创建的数据库中都存在，不要在template1中创建任何对象。
template1是默认模板，并且其中的对象和数据会被克隆到每个以它为模板的新建数据库中：

template1=# create table t1 (a int);
CREATE TABLE
template1=# insert into t1 values (1);
INSERT 0 1
template1=# create database db1;
CREATE DATABASE
template1=# \dt
               List of relations
 Schema | Name | Type  |  Owner  |   Storage   
--------+------+-------+---------+-------------
 public | t1   | table | gpadmin | append only
(1 row)

template1=# select * from t1;
 a 
---
 1
(1 row)

HAWQ还有一个模板库postgres。不要修改template0或postgres，HAWQ内部需要使用它们。以template0为模板可以创建一个完全干净的数据库，其中只包含HAWQ在初始化时预定义的标准对象。如果修改了template1，可能就需要这么做。
指定以template0为模板创建数据库：

template1=# create database db2 with template template0;
CREATE DATABASE

通过配置，也可以连接template0：

template1=# set allow_system_table_mods='DML'; 
SET
template1=# update pg_database set datallowconn='t' where datname='template0'; 
UPDATE 1
template1=# \c template0
You are now connected to database "template0" as user "gpadmin".
template0=# update pg_database set datallowconn='f' where datname='template0'; 
ERROR:  permission denied: "pg_database" is a system catalog
template0=# set allow_system_table_mods='DML'; 
SET
template0=# update pg_database set datallowconn='f' where datname='template0'; 
UPDATE 1
template0=# \q
[gpadmin@hdp3 ~]$ psql -d template0
psql: FATAL:  database "template0" is not currently accepting connections

2. 创建数据库
创建数据库的用户必须要适当的权限，比如超级用户，或者被设置了createdb角色属性。除了象前面例子中，使用CREATE DATABASE命令创建数据库，还可以使用客户端程序createdb创建一个数据库。例如，运行下面的命令将连接HAWQ主机并创建名为db3的数据库，主机名和端口号必须与HAWQ的master节点相匹配。

[gpadmin@hdp4 ~]$ createdb -h hdp3 -p 5432 db3
[gpadmin@hdp4 ~]$ psql -h hdp3
psql (8.2.15)
Type "help" for help.

gpadmin=# \l
                 List of databases
   Name    |  Owner  | Encoding | Access privileges 
-----------+---------+----------+-------------------
 db1       | gpadmin | UTF8     | 
 db2       | gpadmin | UTF8     | 
 db3       | gpadmin | UTF8     | 
 gpadmin   | gpadmin | UTF8     | 
 postgres  | gpadmin | UTF8     | 
 template0 | gpadmin | UTF8     | 
 template1 | gpadmin | UTF8     | 
(7 rows)

某些对象，如角色（用户），是被HAWQ中的所有数据库所共享的。而另外一些对象，如表，则只有它所在的数据库能感知它的存在。

3. 查看数据库列表
psql客户端程序的\l元命令显示数据库列表。如果是数据库超级用户，也可以从pg_database系统目录表中查询数据库列表。

gpadmin=# \l
                 List of databases
   Name    |  Owner  | Encoding | Access privileges 
-----------+---------+----------+-------------------
 db1       | gpadmin | UTF8     | 
 db2       | gpadmin | UTF8     | 
 db3       | gpadmin | UTF8     | 
 gpadmin   | gpadmin | UTF8     | 
 postgres  | gpadmin | UTF8     | 
 template0 | gpadmin | UTF8     | 
 template1 | gpadmin | UTF8     | 
(7 rows)

gpadmin=# select datname from pg_database;
  datname  
-----------
 hcatalog
 template1
 postgres
 gpadmin
 template0
 db1
 db2
 db3
(8 rows)

可以看到，从pg_database查询出的结果比\l命令多返回一个库名为hcatalog。此库仅HAWQ系统使用，并且不允许连接。

gpadmin=# \c hcatalog
FATAL:  "hcatalog" database is only for system use
Previous connection kept

4. 修改数据库
ALTER DATABASE命令可以用于修改数据库的缺省配置，如下面的命令修改search_path服务器配置参数，改变数据库db1缺省的模式查找路径。

gpadmin=# alter database db1 set search_path to myschema, public, pg_catalog;
NOTICE:  schema "myschema" does not exist
ALTER DATABASE

HAWQ不支持修改数据库改名。

gpadmin=# alter database db1 rename to db11;
ERROR:  Cannot support rename database statement yet

5. 删除数据库
DROP DATABASE命令删除一个数据库。它删除数据库在系统目录中的条目，并删除磁盘上的数据。只有数据库属主或超级用户才能删除数据库。并且，不能删除一个还有连接的数据库，包括不能删除自己当前会话连接的数据库。在删除一个数据库前，可先连接到template1或其它数据库。

gpadmin=# \c template1
You are now connected to database "template1" as user "gpadmin".
template1=# drop database db1;
DROP DATABASE

也可以使用客户端程序dropdb删除一个数据库。

[gpadmin@hdp4 ~]$ dropdb -h hdp3 -p 5432 db2

一个数据库有连接时是不允许删除的，必须先终止所有连接，在没有连接之后再删除数据库。

gpadmin=# drop database db3;
ERROR:  database "db3" is being accessed by other users
gpadmin=# select procpid,current_query from pg_stat_activity where datname='db3';
 procpid | current_query 
---------+---------------
  790583 | 
(1 row)

gpadmin=# select pg_terminate_backend(790583);
 pg_terminate_backend 
----------------------
 t
(1 row)

gpadmin=# drop database db3;
DROP DATABASE

注意，删除数据库操作是不可回滚的。

二、创建和管理表空间
很多数据库系统，如Oracle和MySQL等，都有表空间的概念。HAWQ的表存储在HDFS上，其表空间管理有自己的特点。HAWQ在表空间之上有一个文件空间的概念，系统中所有组件的文件系统位置的集合构成一个文件空间。文件空间可以被一个或多个表空间所使用。实际上，一个文件空间物理上就是一个HDFS的目录及其子目录。在表空间定义中需要指定它所属文件空间。一个文件空间下的所有表空间文件都存储在该文件空间所对应的HDFS目录下。
表空间允许为经常使用和不经常使用的数据库对象赋予不同的存储，或控制特定数据库对象的I/O性能。例如，将经常使用的表放在高性能文件系统（如SSD）上，而将其它表放在普通标准硬盘上。通过这种方式，DBA可以在HAWQ集群中使用多个HDFS目录，灵活规划数据库对象的物理存储。

1. 创建文件空间
文件空间是一个符号存储标识符，映射为一组HAWQ主机文件系统的位置，指示HAWQ系统的存储空间。为了创建一个文件空间，需要在HAWQ集群上准备HDFS文件系统目录，然后使用hawq filespace应用程序定义文件空间。必须以数据库超级用户创建一个文件空间。
注意，HAWQ并不直接感知底层的文件系统边界。它将文件存储在所指定的目录中，但不能人为控制逻辑文件系统中单个文件的磁盘位置。

（1）为文件空间准备HDFS目录

[root@hdp4 ~]# su - hdfs
[hdfs@hdp4 ~]$ hdfs dfs -mkdir /hawq_data1
[hdfs@hdp4 ~]$ hdfs dfs -chown -R gpadmin:gpadmin /hawq_data1

（2）用gpadmin用户登录HAWQ master

$ su - gpadmin

（3）创建一个文件空间配置文件：

$ hawq filespace -o hawqfilespace_config

（4）在提示符下，输入文件空间的名字、master文件系统位置和segment文件系统位置。

[gpadmin@hdp3 ~]$ hawq filespace -o hawqfilespace_config
Enter a name for this filespace
> testfs
Enter replica num for filespace. If 0, default replica num is used (default=3)
> 

Please specify the DFS location for the filespace (for example: localhost:9000/fs)
location> mycluster/hawq_data1
20170306:11:24:52:352152 hawqfilespace:hdp3:gpadmin-[INFO]:-[created]
20170306:11:24:52:352152 hawqfilespace:hdp3:gpadmin-[INFO]:-
To add this filespace to the database please run the command:
   hawqfilespace --config /home/gpadmin/hawqfilespace_config

[gpadmin@hdp3 ~]$ more /home/gpadmin/hawqfilespace_config
filespace:testfs
fsreplica:3
dfs_url::mycluster/hawq_data1
[gpadmin@hdp3 ~]$ hawq filespace --config /home/gpadmin/hawqfilespace_config
Reading Configuration file: '/home/gpadmin/hawqfilespace_config'

CREATE FILESPACE testfs ON hdfs 
('mycluster/hawq_data1/testfs') WITH (NUMREPLICA = 3);
20170306:11:25:50:352658 hawqfilespace:hdp3:gpadmin-[INFO]:-Connecting to database
20170306:11:25:50:352658 hawqfilespace:hdp3:gpadmin-[INFO]:-Filespace "testfs" successfully created

此时HDFS上会看到建立了/hawq_data1/testfs目录。

[hdfs@hdp2 ~]$ hdfs dfs -ls /hawq_data1
Found 1 items
drwx------   - gpadmin gpadmin          0 2017-03-07 14:32 /hawq_data1/testfs

2. 创建表空间
创建完文件空间，使用CREATE TABLESPACE命令定义一个使用该文件空间的表空间。

gpadmin=# create tablespace testts filespace testfs;
CREATE TABLESPACE

目前HAWQ只允许数据库超级用户定义表空间，并且不支持向其他用户GRANT/REVOKE表空间上的CREATION权限。

gpadmin=# create user wxy with superuser login password 'mypassword';
CREATE ROLE
gpadmin=# grant create on tablespace testts to wxy;
ERROR:  Cannot support GRANT/REVOKE on TABLESPACE statement

相关信息参见 https://issues.apache.org/jira/browse/HAWQ-24。

3. 使用表空间存储数据库对象
拥有表空间上CREATE权限的用户能够在此表空间中创建数据库对象，例如数据库、表等。使用default_tablespace参数，为没有指定表空间的CREATE TABLE语句指定缺省表空间。
与一个数据库关联的表空间存储数据库的系统目录、数据库的服务器进程创建的临时文件、数据库中创建时没有指定TABLESPACE的表。如果创建数据库时不指定表空间，数据库使用其模板数据库相同的表空间。如果有适当的权限，可以在任意数据库中使用一个表空间。

[gpadmin@hdp3 ~]$ psql -d template1 -U wxy -h hdp3
template1=# create database db1 tablespace testts;
CREATE DATABASE
template1=# \c db1
You are now connected to database "db1" as user "wxy".
db1=# create table t1 (a int);
CREATE TABLE
db1=# create table t2 (a int) tablespace testts;
CREATE TABLE
db1=# set default_tablespace = testts;
SET
db1=# create table t3 (a int);
CREATE TABLE
db1=# set default_tablespace = dfs_default;
SET
db1=# create table t4 (a int);
CREATE TABLE
db1=# select relname,reltablespace from pg_catalog.pg_class where relname in ('t1','t2','t3','t4');
 relname | reltablespace 
---------+---------------
 t1      |             0
 t2      |             0
 t3      |             0
 t4      |         16385
(4 rows)

pg_class.reltablespace为0，说明表保存在从数据库继承的缺省表空间testts里。特别要指出的是，所有非共享的系统表也都存放在这里。

4. 查看表空间和文件空间
每个HAWQ系统有以下缺省表空间：

pg_global是共享系统目录的表空间。
pg_default是缺省表空间，template1和template0数据库使用。

这些表空间使用系统缺省的文件空间，pg_system，指示系统初始化时创建的数据目录位置。pg_filespace和pg_filespace_entry目录表存储文件空间信息。可以将这些表与pg_tablespace关联查看完整的表空间的定义，例如：

db1=# select spcname as tblspc, fsname as filespc,
db1-#           fsedbid as seg_dbid, fselocation as datadir
db1-#    from   pg_tablespace pgts, pg_filespace pgfs,
db1-#           pg_filespace_entry pgfse
db1-#    where  pgts.spcfsoid=pgfse.fsefsoid
db1-#           and pgfse.fsefsoid=pgfs.oid
db1-#    order by tblspc, seg_dbid;
   tblspc    |  filespc   | seg_dbid |                    datadir                    
-------------+------------+----------+-----------------------------------------------
 dfs_default | dfs_system |        0 | hdfs://mycluster/hawq_data
 testts      | testfs     |        0 | hdfs://{replica=3}mycluster/hawq_data1/testfs
(2 rows)

5. 删除表空间和文件空间
只有表空间的属主或超级用户可以删除表空间。直到表空间所有的数据库对象都被删除后，才能删除表空间。

postgres=# drop tablespace testts;
ERROR:  tablespace "testts" is not empty: existing database.
postgres=# drop filespace testfs;
ERROR:  filespace "testfs" is not empty
postgres=# drop database db1;
DROP DATABASE
postgres=# drop filespace testfs;
ERROR:  filespace "testfs" is not empty
postgres=# drop tablespace testts;
DROP TABLESPACE
postgres=# drop filespace testfs;
DROP FILESPACE
postgres=#

此时HDFS上的/hawq_data1/testfs目录已经删除。

[hdfs@hdp2 ~]$ hdfs dfs -ls /hawq_data1/testfs
ls: `/hawq_data1/testfs': No such file or directory
[hdfs@hdp2 ~]$

三、创建和管理模式
模式（schema）是一个有趣的概念，不同数据库系统中的模式代表完全不同的东西。如Oracle中，默认在创建用户的时候，就创建了一个和用户名一样的模式，并且互相绑定，因此很多情况下Oracle的用户和模式可以通用。MySQL中的schema是database的同义词。而HAWQ中的模式是从PostgreSQL来的，其概念与SQLserver的模式更为类似，是数据库中的逻辑对象。
HAWQ的模式是数据库中对象和数据的逻辑组织。模式允许在一个数据库中有多个同名的对象，如表。如果对象属于不同的模式，同名对象之间不会冲突。使用schema有如下好处：

方便管理多个用户共享一个数据库，但是又可以互相独立。
方便管理众多对象，更有逻辑性。
方便兼容某些第三方应用程序，如果创建对象时是带schema的。

比如要设计一个复杂系统，由众多模块构成，有时候模块间又需要有独立性。各模块存放单独的数据库显然是不合适的。这时候使用schema来划分各模块间的对象，再对用户进行适当的权限控制，这样逻辑也非常清晰。

1. 缺省的“Public”模式
每个数据库有一个缺省的名为public的模式。如果不建立任何模式，对象则被创建在public模式中。所有数据库角色（用户）都具有public模式中的CREATE和USAGE权限。当创建了一个模式，需要给用户授予访问模式的权限。

2. 创建模式
使用CREATE SCHEMA命令创建一个新模式。为了在模式中创建和访问对象，完整的对象名称由模式名+对象名组成，对象名和模式名称用点号分隔。可以创建一个属于其他人的模式，语法是：CREATE SCHEMA AUTHORIZATION ;

3. 模式查找路径
可以设置search_path配置参数指定数据库对象有效模式的查找顺序。查找路径列表中的第一个存在的模式为缺省模式。如果没有指定模式，对象在缺省模式中创建。
（1）设置模式查找路径
search_path配置参数设置模式查找顺序。ALTER DATABASE命令设置查找路径

ALTER DATABASE db1 SET search_path TO u1,public, pg_catalog;

（2）查看当前模式
使用current_schema()函数查看当前模式。

SELECT current_schema();

使用SHOW命令查看当前查找路径。

SHOW search_path;

set search_path to my_schema;只能改变当前session，如果需要长久生效可以为用户创建一个变量：

alter role etl set search_path=trade;

官方建议是这样的：在管理员创建一个具体数据库后，应该为所有可以连接到该数据库的用户分别创建一个与用户名相同的模式，然后，将search_path设置为"$user"，即默认的模式是与用户名相同的模式。
4. 删除模式
使用DROP SCHEMA命令删除一个模式。

DROP SCHEMA myschema;

缺省时，模式必须为空后才能删除它。为了删除一个非空的模式，可以使用：DROP SCHEMA CASCADE;
该命令将删除模式及该模式下的所有对象（表、数据、函数等等）。

5. 系统模式
使用psql的\dn元命令查看当前连接数据库的所有模式。

gpadmin=# \dn
       List of schemas
        Name        |  Owner  
--------------------+---------
 hawq_toolkit       | gpadmin
 information_schema | gpadmin
 pg_aoseg           | gpadmin
 pg_bitmapindex     | gpadmin
 pg_catalog         | gpadmin
 pg_toast           | gpadmin
 public             | gpadmin
(7 rows)

以下是每个数据库中系统级别的模式：

pg_catalog：包含系统目录表，内建数据类型、函数和操作符等。它总是模式查找路径的一部分，即使在查找路径中没有显式命名。
information_schema：由一系列标准视图构成的数据库对象信息。用\dv information_schema.*元命令列出该模式下的视图。这些视图以标准方式从系统目录表获取系统信息。
pg_toast：存储大小超过页尺寸的大对象。这个模式被HAWQ系统内部使用。
pg_bitmapindex：存储位图索引对象，如值列表。该模式被HAWQ系统内部使用。
hawq_toolkit：管理模式，包含可以从SQL命令访问的外部表、视图和函数。所有数据库用户可以访问hawq_toolkit查询系统日志文件或系统指标。
pg_aoseg：存储AO（Append-optimized）类型表对象的信息。该模式被HAWQ系统内部使用。

6. 模式示例

# 修改master的pg_hba.conf文件，增加三个用户u1、u2、u3的认证
[gpadmin@hdp3 ~]$ vi /data/hawq/master/pg_hba.conf
...
host  all     u1         172.16.1.0/24         md5
host  all     u2         172.16.1.0/24         md5
host  all     u3         172.16.1.0/24         md5

# 使认证文件生效
[gpadmin@hdp3 ~]$ more /data/hawq/master/pg_hba.conf

# 创建数据库db1
[gpadmin@hdp3 ~]$ createdb db1

# 使用gpadmin创建两个用户u1、u2，授予超级用户权限，
[gpadmin@hdp3 ~]$ psql -c "create role u1 with superuser password 'mypassword' login;create role u2 with superuser password 'mypassword' login;"

# 使用gpadmin在db1数据库中创建两个与用户u1、u2同名的schema，并指定对应的属主。此情况模拟Oracle的用户模式。
[gpadmin@hdp3 ~]$ psql -d db1 -c "create schema u1 authorization u1; create schema u2 authorization u2;"

# 用u1用户执行
[gpadmin@hdp3 ~]$ psql -d db1 -U u1 -h hdp3 -c "create table t1 (a int); insert into t1 values(1);"

# 用u2用户执行
[gpadmin@hdp3 ~]$ psql -d db1 -U u2 -h hdp3 -c "create table t1 (a int); insert into t1 values(2);"

# 用u1用户执行
[gpadmin@hdp3 ~]$ psql -d db1 -U u1 -h hdp3 -c "select *,current_schema() from t1;"
Password for user u1: 
 a | current_schema 
---+----------------
 1 | u1
(1 row)

# 用u2用户执行
[gpadmin@hdp3 ~]$ psql -d db1 -U u2 -h hdp3 -c "select *,current_schema() from t1;"
Password for user u2: 
 a | current_schema 
---+----------------
 2 | u2
(1 row)

# 用gpadmin用户执行
[gpadmin@hdp3 ~]$ psql -d db1 -h hdp3 -c "create table t1(a int);insert into t1 values(3);"
INSERT 0 1
[gpadmin@hdp3 ~]$ psql -d db1 -h hdp3 -c "select * from pg_tables where tablename='t1';"
 schemaname | tablename | tableowner | tablespace | hasindexes | hasrules | hastriggers 
------------+-----------+------------+------------+------------+----------+-------------
 u1         | t1        | u1         |            | f          | f        | f
 u2         | t1        | u2         |            | f          | f        | f
 public     | t1        | gpadmin    |            | f          | f        | f
(3 rows)

[gpadmin@hdp3 ~]$ psql -d db1
psql (8.2.15)
Type "help" for help.

db1=# show search_path;
  search_path   
----------------
 "$user",public
(1 row)

db1=# select * from t1;
 a 
---
 3
(1 row)

db1=# set search_path='u1';
SET
db1=# select * from t1;
 a 
---
 1
(1 row)

db1=# set search_path='u2';
SET
db1=# select * from t1;
 a 
---
 2
(1 row)

# 建立只有login权限的用户u3
[gpadmin@hdp3 ~]$ psql -c "create role u3 with password 'mypassword' login;"
NOTICE:  resource queue required -- using default resource queue "pg_default"
CREATE ROLE
# 用u3用户执行
[gpadmin@hdp3 ~]$ psql -d db1 -U u3 -h hdp3
Password for user u3: 
psql: FATAL:  password authentication failed for user "u3"
[gpadmin@hdp3 ~]$ psql -d db1 -U u3 -h hdp3
Password for user u3: 
psql (8.2.15)
Type "help" for help.

db1=> set search_path='u1';
SET
db1=> db1=> \dt
No relations found.
db1-> 

# 可以看到，u3看不到表u1.t1。

# 赋予usage权限
[gpadmin@hdp3 ~]$ psql -d db1 -c "grant usage on schema u1 to u3;"
GRANT
# 用u3用户执行
[gpadmin@hdp3 ~]$ psql -d db1 -U u3 -h hdp3
Password for user u3: 
psql (8.2.15)
Type "help" for help.

db1=> set search_path='u1';
SET
db1=> \dt
              List of relations
 Schema | Name | Type  | Owner |   Storage   
--------+------+-------+-------+-------------
 u1     | t1   | table | u1    | append only
(1 row)

db1=> select * from t1;
ERROR:  permission denied for relation t1
db1=> 

# 可以看到，u3可以看到表u1.t1，但不能查询。

# 赋予select权限
[gpadmin@hdp3 ~]$ psql -d db1 -c "grant select on u1.t1 to u3;"
GRANT
# 用u3用户执行
[gpadmin@hdp3 ~]$ psql -d db1 -U u3 -h hdp3 -c "set search_path='u1';select *,current_schema(),current_schemas(true) from t1;"
Password for user u3: 
 a | current_schema | current_schemas 
---+----------------+-----------------
 1 | u1             | {pg_catalog,u1}
(1 row)

# u3现在可以查询u1.t1。

# 用u3用户执行
[gpadmin@hdp3 ~]$ psql -d db1 -U u3 -h hdp3 -c "create table t2(a int);"
Password for user u3: 
CREATE TABLE

# 删除模式
[gpadmin@hdp4 ~]$ psql -h hdp3 -d db1
psql (8.2.15)
Type "help" for help.

db1=# drop schema u1;
NOTICE:  append only table u1.t1 depends on schema u1
ERROR:  cannot drop schema u1 because other objects depend on it
HINT:  Use DROP ... CASCADE to drop the dependent objects too.
db1=# drop schema u1 cascade;
NOTICE:  drop cascades to append only table u1.t1
DROP SCHEMA
db1=# drop schema u2 cascade;
NOTICE:  drop cascades to append only table u2.t1
DROP SCHEMA

说明：

搜索路径参数search_path控制查询表时所属schema的搜索顺序。
创建的表存放哪个schema跟search_path有关。
系统默认将PUBLIC模式的usage、create权限授权给所有用户。
usage权限的含义是，可以“看到”模式中的对象，但是没有对象上的任何权限。
pg_catalog存放了各系统表、内置函数等等。它总是在搜索路径中，需要通过current_schemas看到。

四、创建和管理表
这里所说的表是HAWQ数据库内部存储的表。除了表行是分布在系统中不同的segment上，HAWQ中的表与关系数据库中的表类似。关于外部表，将在后面“外部数据”中讨论。

1. 创建表
CREATE TABLE命令创建表并定义表结构，当创建一个表时，可以定义：

表列及其数据类型。
表或列包含的限定数据的约束。
表的分布策略，决定HAWQ如何在segment中划分数据。
表在磁盘上的存储方式。
大表分区策略，指定数据如何划分。

（1）选择列的数据类型
列的数据类型决定了列中可以包含何种类型的数据。选择数据类型时应遵循以下通用原则：

选择可以容纳数据的最小可能空间，并能最好约束数据的数据类型。例如，如果可以使用INT或SMALLINT表示数据，那么就不要使用BIGINT，因为这会浪费存储空间。
在HAWQ中，字符类型CHAR、VARCHAR和TEXT除了使用空间不同，它们在性能上并无差异。在大多数情况下，应该使用TEXT或VARCHAR而不是CHAR。
考虑数据扩展。数据会随着时间的推移而不断扩展。在已经装载大量数据后，从小类型变为大类型的操作代价是很昂贵的。因此，如果当前的数据值可以用SMALLINT，但是考虑到数据扩展性，那么出于长期需要，INT是可能更好的选择。
为表连接的列使用相同的数据类型。如果数据类型不同，为了正确比较数据值，数据库必须进行数据类型转换，这将增加不必要的系统消耗。

HAWQ内建的数据类型参见 http://hawq.incubator.apache.org/docs/userguide/2.1.0.0-incubating/reference/HAWQDataTypes.html。

（2）设置约束
可以定义约束限制表中的数据。HAWQ支持与PostgreSQL相同的约束，但是有一些限制，包括：

CHECK约束只能引用它定义所属的表。
外键约束允许，但不起作用。
分区表上的约束作用于整个表。不能在一个表的单独部分上定义约束。

Check约束
Check约束允许指定特定列中存储的数据值必须满足一个布尔表达式。例如，产品价格必须为正值：

db1=# create table products
        ( product_no integer,
          name text,
          price numeric check (price > 0) );
db1=# insert into products values (1,'a',10);
INSERT 0 1
db1=# insert into products values (1,'a',10.5);
INSERT 0 1
db1=# insert into products values (1,'a',10.5111);
INSERT 0 1
db1=# insert into products values (1,'a',-10.5111);
ERROR:  One or more assertions failed  (seg0 hdp3:40000 pid=731975)
DETAIL:  Check constraint products_price_check for table products was violated
db1=# insert into products values (1,'a',0);
ERROR:  One or more assertions failed  (seg0 hdp3:40000 pid=731988)
DETAIL:  Check constraint products_price_check for table products was violated
db1=# select * from products;
 product_no | name |  price  
------------+------+---------
          1 | a    |      10
          1 | a    |    10.5
          1 | a    | 10.5111
(3 rows)

非空约束
非空约束指定一个列不能有空值。非空约束总是一个列约束。

db1=# create table products
        ( product_no integer not null,
          name text not null,
          price numeric );	   
db1=# insert into products values(1,'a',10.51);
INSERT 0 1
db1=# insert into products (price) values(10.51);
ERROR:  null value in column "product_no" violates not-null constraint (CTranslatorUtils.cpp:2726)
db1=#

主键与外键
HAWQ不支持主键与外键约束。因为主键是用唯一索引实现，而HAWQ不支持索引，因此不支持主键。根据外键的定义，既然没有主键，也就谈不上外键了。

db1=# create table t2(a int);
CREATE TABLE
db1=# create table t3(a int primary key);
ERROR:  Cannot support create index statement yet

2. 删除表
DROP TABLE命令从数据库中删除表。DROP TABLE总是删除表上的约束。指定CASCADE将删除引用表的视图。

db1=# create table t1 (a int);
CREATE TABLE
db1=# insert into t1 values (1);
INSERT 0 1
db1=# create view v1 as select * from t1;
CREATE VIEW
db1=# select * from v1;
 a 
---
 1
(1 row)

db1=# drop table t1;
NOTICE:  rule _RETURN on view v1 depends on append only table t1
NOTICE:  view v1 depends on rule _RETURN on view v1
ERROR:  cannot drop append only table t1 because other objects depend on it
HINT:  Use DROP ... CASCADE to drop the dependent objects too.
db1=# drop table t1 cascade;
NOTICE:  drop cascades to rule _RETURN on view v1
NOTICE:  drop cascades to view v1
DROP TABLE

如果要清空表中的数据，但保留表定义，使用TRUNCATE 。

3. 查看表对应的HDFS文件

假设在数据库db1中建立了表public.t2，使用以下步骤查看t2所在的HDFS文件。
（1）确定HAWQ在HDFS上的根目录

db1=# select * from pg_filespace_entry;
 fsefsoid | fsedbid |        fselocation         
----------+---------+----------------------------
    16384 |       0 | hdfs://mycluster/hawq_data
(1 row)

可以看到，HAWQ在HDFS上的根目录/hawq_data。我的Hadoop集群配置了HA，所以文件位置字段中的值使用Nameservice ID（mycluster）代替了NameNode FQDN（Fully Qualified Domain Name）。

（2）检查HAWQ系统目录表中t1的相关信息

db1=# select d.dat2tablespace tablespace_id, d.oid database_id, c.relfilenode table_id
db1-#   from pg_database d, pg_class c, pg_namespace n 
db1-#  where c.relnamespace = n.oid
db1-#    and d.datname = current_database()
db1-#    and n.nspname = 'public'
db1-#    and c.relname = 't2';
 tablespace_id | database_id | table_id 
---------------+-------------+----------
         16385 |       25270 |   156634
(1 row)

一个数据库中不同schema下的表可能重名，但对应的表ID不同，因此需要关联pg_namespace系统表。d.oid是一个系统的隐藏列，表示行的对象标识符（对象ID）。该列只有在创建表的时候使用了WITH OIDS ，或者是设置了default_with_oids配置参数时出现。用\d pg_database命令是看不到oid列的。系统表pg_class的relhasoids列是布尔类型，true表示对象具有OID。
为了简化对表的管理，每个表中的数据都被保存在一个HDFS目录中。HAWQ数据库表在HDFS上的目录结构为“文件空间根目录/表空间ID/数据库ID/表对象（分区表对象）ID”，例如表public.t2所对用的HDFS目录为/hawq_data/16385/25270/156634，该目录下是实际存储表数据的HDFS文件。

（3）查看表对应的HDFS文件

[gpadmin@hdp3 ~]$ hdfs dfs -ls /hawq_data/16385/25270/156634
Found 1 items
-rw-------   3 gpadmin gpadmin          0 2017-03-30 11:05 /hawq_data/16385/25270/156634/1

五、创建和管理视图
视图使能够保存经常使用的或者复杂的查询，然后将它们看做表，在SELECT语句中访问它们。视图并不物化到磁盘，当访问视图时，查询作为一个子查询运行。HAWQ不支持WITH子句的内嵌视图和物化视图。

1. 创建视图

db1=# create table t1 (a int);
CREATE TABLE
db1=# insert into t1 values (10);
INSERT 0 1
db1=# insert into t1 values (1);
INSERT 0 1
db1=# select * from t1;
 a  
----
 10
  1
(2 rows)

db1=# create view v1 as select * from t1 order by a;
CREATE VIEW
db1=# select * from v1;
 a  
----
  1
 10
(2 rows)

db1=# drop view v1;
DROP VIEW
db1=# create view v1 as select * from t1 order by a desc;
CREATE VIEW
db1=# select * from v1;
 a  
----
 10
  1
(2 rows)
db1=# select * from v1;
 a  
----
 10
  1
(2 rows)

db1=# select * from v1 order by a;
 a  
----
  1
 10
(2 rows)

2. 查看视图定义

db1=# \d v1
       View "public.v1"
 Column |  Type   | Modifiers 
--------+---------+-----------
 a      | integer | 
View definition:
 SELECT t1.a
   FROM t1
  ORDER BY t1.a DESC;

3. 删除视图

db1=# drop view v1;

六、其它对象
HAWQ还支持自定义数据类型、自定义函数、序列等对象。如果用过Oracle，对这些对象一定不会陌生。
自定义数据类型的例子：

gpadmin=# \c db1
You are now connected to database "db1" as user "gpadmin".
db1=# create type compfoo as (f1 int, f2 text);
CREATE TYPE
db1=# create table big_objs (
db1(#     id integer,
db1(#     obj compfoo
db1(# );
CREATE TABLE
db1=# insert into big_objs values (1,(1,'a'));
INSERT 0 1

更多自定义数据类型信息参见 http://hawq.incubator.apache.org/docs/userguide/2.1.0.0-incubating/reference/sql/CREATE-TYPE.html。

序列的例子：

db1=# create sequence myseq start 101;
CREATE SEQUENCE
db1=# select currval('myseq'), nextval('myseq');
ERROR:  currval() not supported
db1=# select nextval('myseq');
 nextval 
---------
     101
(1 row)

db1=# select nextval('myseq');
 nextval 
---------
     102
(1 row)

更多序列信息参见 http://hawq.incubator.apache.org/docs/userguide/2.1.0.0-incubating/reference/sql/CREATE-SEQUENCE.html。

自定义函数将在后面“过程语言”详细描述。

你可能感兴趣的:(BI)

Python脚本发送接收组播报文 dangdanding Python 网络编程网络 python
组播发送脚本pythonsend_mcast.py-g232.1.2.3-p12345#!/usr/bin/python#-*-coding:utf-8-*-importsocketimportstructimportosimportargparseimportlogging#组播组地址，范围是224.0.0.0-239.255.255.255，这里选用224.0.0.1作为示例multicast
bash监控指定目录下的文件变动并执行相应动作 dangdanding Bash 笔记网络安全 bash 服务器 linux 运维
#!/bin/bashdir_to_monitor="/home/sub_dirprev_files=$(ls-A$dir_to_monitor)#echo"prev_files:$prev_files"prev_files_file=$(mktemp)ls-A$dir_to_monitor>$prev_files_filewhiletrue;docurrent_files=$(ls-A$dir_
Centos Linux 离线安装 MySQL 5.7、使用MySQL 寒水馨软件解惑 mysql centos 数据库 linux
CentosLinux离线安装MySQL5.7、使用MySQL视频教程链接：https://www.bilibili.com/video/BV1Nv4y1m7u4/1.MySQL简介MySQL是一个开源的关系型数据库管理系统，由瑞典MySQLAB公司开发，属于Oracle旗下产品，适合个人和中小型企业使用。2.准备工作2.1.拥有一台CentosLinux机器参考文章：《VMware安装Cento
linux环境下安装erlang、Rabbitmq alone00 服务器环境搭建
1.安装erlang说明：erlang是(otp_src_20.1.tar.gz版本)。1.安装ncurses-develyuminstallncurses-devel2.解压otp_src_20.1.tar.gztar-xvfotp_src_20.1.tar.gz-C/usr/local/erlang3.解压好后进入到/erlang/otp_src_20.1./configure--prefix
单片机实物成品-010 智能宠物喂食系统（代码+硬件+论文）学个单片机单片机实物成品单片机宠物嵌入式硬件
项目介绍版本1：oled显示+定时投喂（舵机模拟）+声光报警+显示实时时间---演示视频：智能宠物喂食001_哔哩哔哩_bilibili1.STM32F103C8T6单片机进行数据处理2.OLED液晶显示3，按键1在数据显示界面时按下按键1切换下一个界面，在校准时间界面时按下按键1退出校准时间界面，在设置定时时间界面中如果是处于设置某个时间的状态按下按键1退出否则切换下一个页面。4.按键2数据显示
浅析NAT的类型-ZT icu 技术类网络服务器路由器防火墙 domain mobile
浅析NAT的类型何宝宏[1]摘要介绍了四种典型的NAT类型和两种典型的传统NAT类型。关键词NATNATP类型一、引言RFC1631以及相关RFC定义的网络地址翻译器(NAT)。IETF一直主张利用IPv6技术解决地址短缺问题，因此IETF虽然出版了几个与NAT相关的RFC，但对NAT技术(尤其是穿越问题)一直没有系统的标准化工作，如SIP和MobileIP就是NAT出现后设计的一些协议，都未考虑
ubuntu 22.04（arm64）环境安装zabbix6.4.4 gaodi2002 ubuntu linux 运维服务器
参考https://www.zabbix.com/download?zabbix=6.0&os_distribution=ubuntu_arm64&os_version=22.04&components=server_frontend_agent&db=mysql&ws=apache在arm环境需要部署zabbix6，尝试过centos7编译、centos8编译、docker部署，都不是想要的结果
linux（arm）安装mysql步骤余额很不足 mysql linux linux mysql 运维数据库 arm开发
1、添加mysql用户组和mysql用户]#groupadd-rmysql&&useradd-r-gmysql-s/sbin/nologin-Mmysql2、安装依赖libaioyuminstall-ylibaio*3、下载mysql对应版本wgethttps://obs.cn-north-4.myhuaweicloud.com/obs-mirror-ftp4/database/mysql-5.7
2025.1.17—misc—一、黑客帝国压缩包加密|图片文件格式问题然然阿然然 “破晓”计划第一阶段训练安全网络安全 misc
题目来源：buuctf黑客帝国目录一、解题思路step1：下载文件，查看情况step2：利用脚本转换数据step3：利用ARCHPR破解压缩包密码step4：解压后查看新文件一、解题思路step1：下载文件，查看情况下载附件，发现一堆数据有字母有数字，很像十六进制数据，利用python脚本将这些十六进制数据转换为二进制写入文件。step2：利用脚本转换数据importbinasciihex_dat
git操作（bitbucket仓库） come-昂- 笔记 git
在代码远程版本控制和提交过程中需要经常使用git命令，熟练使用git是一个软件工程师必备的技能之一。将主版本代码fork到自己的bitbucket子仓库中克隆到本地利用ssh链接进行克隆，将fork的子仓库克隆到本地。gitclonessh://{$你fork的子bitbucket仓库git链接$}添加远程主仓库虽然我们fork了主仓库的代码到自己的子仓库，但这种fork会无形中造成自己本地的代码
参考资料-Ja-10至Ja-28消防基坑开挖工程数据汇总疑样
本文还有配套的精品资源，点击获取简介：该压缩包文件包含了一系列Excel表格，用于记录和管理消防工程中的消火栓基坑开挖项目。文件名中的".XLS"扩展名表明内容涉及基坑开挖的尺寸、工程计划、成本估算及施工数据。这些数据对于建筑工程和消防工程的专业人员至关重要，但对于IT领域来说并不直接相关。尽管如此，信息技术，如BIM技术和物联网(IoT)，可以在建筑行业中提高效率，尤其是在项目管理、施工监控和数
bigemap功能对比分析 tangshenq17565
BIGEMAP功能对比分析图||||||【地图服务行业专家】BIGEMAP是全行业公认的【优秀知名软件】、高新技术企业、国内最早从事GIS领域研发的公司，为全国各行业提供GIS领域的软件产品、解决方案、技术指导以及应用环境的搭建和开发。BIGEMAP通过不断创新产品、提升产品质量，使得产品销量遥遥领先；我们制定了GIS领域的行业应用标准：降低GIS应用难度，提升软件性能，简化用户操作。我们承诺：软
bigemap地图下载器优势分析 tangshenq17565
BIGEMAP功能对比分析图||||||【地图服务行业专家】BIGEMAP是全行业公认的【优秀知名软件】、高新技术企业、国内最早从事GIS领域研发的公司，为全国各行业提供GIS领域的软件产品、解决方案、技术指导以及应用环境的搭建和开发。BIGEMAP通过不断创新产品、提升产品质量，使得产品销量遥遥领先；我们制定了GIS领域的行业应用标准：降低GIS应用难度，提升软件性能，简化用户操作。我们承诺：软
VRRP+MSTP 会飞的大羊驼网络协议 tcp/ip
VRRP+MSTP实验文章目录一、基础配置略二、运行VRRP协议1.配置子接口（以R1为例）思考一、基础配置略二、运行VRRP协议1.配置子接口（以R1为例）interfaceGigabitEthernet0/0/1.1#创建子接口dot1qterminationvid10#配置子接口dot1q封装的单层VLAN10ipaddress192.168.10.252255.255.255.0arpbr
推荐文章：libpopcnt——高效位计数的神器胡蓓怡
推荐文章：libpopcnt——高效位计数的神器libpopcntFastC/C++bitpopulationcountlibrary项目地址:https://gitcode.com/gh_mirrors/li/libpopcnt在数字处理和大数据分析的世界里，每毫秒的性能提升都是宝贵的。今天，我们要向大家隆重介绍一个名为libpopcnt的开源库，它专为快速计算数组中“1”比特的数量而生，是优化
什么是数据仓库？狮歌~资深攻城狮数据仓库
什么是数据仓库？数据仓库（DataWarehouse，简称DW）是一种面向分析和决策的数据存储系统，它将企业中分散的、异构的数据按照一定的主题和模型进行集成和存储，为数据分析、报表生成以及商业智能（BI）提供支持。数据仓库是大数据体系的重要组成部分，主要用于对大量历史数据的存储、处理和分析。简单来说，数据仓库是一个为数据分析和业务决策服务的系统，通过整合来自不同来源的数据，形成面向主题的、可查询的
vlan的配置 A968_ 网络学习智能路由器笔记
dot1q=802.1q标准[R1-GigabitEthernet0/0/0.1]dot1qterminationvid2定义该接口执行802.1q标准，且，存在于vlan2虚拟子接口默认关闭arp功能的，所以想要使用，必须手动打开[R1-GigabitEthernet0/0/0.1]arpbroadcastenable开启该子接口ARP协议的广播功能要求：SW2ippoolAAippoolBB检
损失函数BinaryCrossentropy例子说明小林书店副编集深度学习人工智能 tensorflow keras
官方说明书的例子其实特别简单明了，y_true=[[0.,1.],[0.,0.]]y_pred=[[0.6,
【免费】谷歌浏览器chrome chromedriver 131.0.6778.24 win64 下载圣phoenix chrome
首先，检查电脑上的Chrome版本是否131.*；确认了版本是131；（只要chrome版本号前端一致就可以）再下载这个driver到指定的目录上。（一般放本地电脑的/usr/local/bin目录下，或者python集中调用的电脑的/python/chromedriver，主要看应用场景）
selenium 各浏览器，各驱动，pycharm源地址一个测试开发人员的纪录 selenium python 测试工具
python官网下载地址：https://www.python.org/downloads/windows/安装seleminum之前必须先安装python浏览器和驱动下载地址：Chrome各个版本下载地址GoogleChrome64bitWindows版_chrome浏览器,chrome插件,谷歌浏览器下载,谈笑有鸿儒Chromedriver各个版本下载地址
text2sql、nl2sql框架总结 fragrans 机器学习 ai nlp 语言模型
DB-GPTDB-GPT·语雀VannaDAIL-SQLdata-copilotSuperSonic：腾讯音乐开源ChatBI平台，开启Text-to-SQL全新体验
计算机组成原理(计算机系统3)--实验三：取指和指令译码设计起床悠悠计算机系统数据库
一、实验目标：设计完成一个连续取指令并进行指令译码的电路，从而掌握设计简单数据通路的基本方法。二、实验内容本实验完成：1）首先完成一个译码器；2）接着实现一个寄存器文件；3）最后添加指令存储器和地址部件等将这些部件组合成一个数据通路原型。三、实验环境硬件：桌面PC软件：LinuxChisel开发环境四、实验步骤及说明1）设计译码电路：输入位32bit的一个机器字，按照课本MIPS指令格式，完成ad
Text2SQL的三种实现方法 AI科技分享算法线性回归回归深度学习 rnn
传统BI工具通常分为数据接入层、分析工具层和基于该工具平台的各种行业应用层面，大模型可以在这些环节发挥作用。在数据处理层面，大模型可以帮助传统的ETL过程简化难度，提高实时交互效率。在数据分析层面，大模型可以替代拖拽交互方式，让业务用户用更简单、更高效的方式以自然语言形式与底层数据交互，构建需要的报表和看板。在行业应用层面，大模型可以真正发挥对行业知识的理解能力，与具体数据结合，形成具针对客户、特
VMware ESXi 8.0U3c macOS Unlocker & OEM BIOS 集成 Marvell AQC 网卡驱动 esxi
VMwareESXi8.0U3cmacOSUnlocker&OEMBIOS集成MarvellAQC网卡驱动定制版(集成驱动版)VMwareESXi8.0U3cmacOSUnlocker&OEMBIOS集成网卡驱动和NVMe驱动(集成驱动版)发布ESXi8.0U3c集成驱动版，在个人电脑上运行企业级工作负载请访问原文链接：https://sysin.org/blog/vmware-esxi-8-u3
Python自动化测试之Selenium各浏览器驱动下载网址 Shadow℘Coder Python学习 selenium 测试工具
在自动化测试领域，Selenium无疑是一个不可或缺的工具。它允许开发者编写脚本来模拟用户在浏览器中的操作，从而进行自动化测试。然而，为了使用Selenium控制不同的浏览器，我们需要安装相应的浏览器驱动（WebDriver）。（1）Chrome浏览器驱动（chromedriver）：ChromeforTestingavailability(googlechromelabs.github.io)h
VMware ESXi 8.0U3c macOS Unlocke OEM BIOS 标准版和厂商定制版，已适配主流品牌服务器 esxi
VMwareESXi8.0U3cmacOSUnlocker&OEMBIOS标准版和厂商定制版ESXi8.0U3c标准版，Dell(戴尔)、HPE(慧与)、Lenovo(联想)、Inspur(浪潮)、Cisco(思科)、Hitachi(日立)、Fujitsu(富士通)、NEC(日电)定制版、Huawei(华为)OEM定制版请访问原文链接：https://sysin.org/blog/vmware-e
2024年总结：大转向年度总结
本文于2025年1月2号首发于公众号“狗哥琐话”。2024年是个打工人苦命年，我看到几乎每个人都比以往辛苦。这让我想起了六字真言，钱难赚屎难吃。职业转向今年我在职业上尝试做了一个转向，具体的结果可能需要比较长的时间来检验我选择是否正确，所以转向的细节我就不全部展开了，可以确定是我依然会专注在Infra和BigData，比如今年我发布了SparkSQL和FlinkSQL的IDEA提效插件。那么我为什
官宣开源阿里云与清华大学共建AI大模型推理项目Mooncake 阿里云大模型
2024年6月，国内优质大模型应用月之暗面Kimi与清华大学MADSys实验室（MachineLearning,AI,BigDataSystemsLab）联合发布了以KVCache为中心的大模型推理架构Mooncake。通过使用以KVCache为中心的PD分离和以存换算架构，大幅提升大模型应用Kimi智能助手推理吞吐的同时有效降低了推理成本，自发布以来受到业界广泛关注。近日，清华大学和研究组织9#
交叉熵损失与二元交叉熵损失：区别、联系及实现细节专业发呆业余科研深度模型底层原理人工智能深度学习 python
在机器学习和深度学习中，交叉熵损失（Cross-EntropyLoss）和二元交叉熵损失（BinaryCross-EntropyLoss）是两种常用的损失函数，它们在分类任务中发挥着重要作用。本文将详细介绍这两种损失函数的区别和联系，并通过具体的代码示例来说明它们的实现细节。交叉熵损失（Cross-EntropyLoss）常用于多类分类问题，即每个样本只能属于一个类别，但总类别数量较多。例如，在手
调用SCIP C++接口，viusal studio项目工程搭建（For新手）
搭建步骤1下载与安装SCIP官网编译好的包，得到include、bin、lib、dll文件。面用到的include、bin、lib、dll都来自于SCIP的在windows下的安装目录内容。如果是32位的电脑，则安装，则安装32位的版本。如果是64位的电脑。则安装64位的包。2新建一个vsconsoleapp工程。3对main.cpp中的内容，替换成scip的例子。这个例子来自于下面的网页。htt
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数