远处的一只猫

GreenPlum初窥

介绍

greenplum 4.3.8.0，基于PostgreSQL 8.2.15。

Greenplum is regarded as the most scalable mission-critical analytical
database。

GP是Pivotal公司，将PostgreSQL增强后，把多实例组合，一起提供服务的MPP架构数据库。

PB级的装载能力（支持50PB）
遵从SQL-92, SQL-99， SQL-2003，包括SQL 2003 OLAP扩展项
原生MapReduce功能

web GUI的greenplum数据仓库系统运行状态监控工具

有人提到，gp最大精华，就是分布式执行计划

架构

shared nothing
至少如下几部分，相对PGSQL，GP做了优化：

模块：

system catalog
query planner
optimizer
query executor
transaction manager

BI相关：

parallel data loading (external tables)
resource management
query optimizations

存储相关：

column-oriented tables
append-optimized tables
data partitioning

optimizer

因为greenplum是基于PostgreSQL做的，它自带PQSQL光环
优化器，有两种：

legacy optimizer
Pivotal Query Optimizer

segment

每个主机，叫一个segment host，而一个实体服务，叫一个segment
一个主机上，可以有多个服务实例。官方文档上也推荐，如果是现在的多核服务器，建议一个segmeng host(服务器)上，配置多个segment
但是每个segment要占用segment host下的一个端口。
一个CPU Core一个segment instance？？？

数据装载

High-performance loading uses MPP Scatter/Gather Streaming technology.
Scatter/Gather 流引擎是专为并行数据加载和导出而设计，Scatter指数据通过并行加载服务器并行分散到各个数据节点，Gather指数据在 GPDB内部可以根据分布策略按需并行分发。

数据加载方式有三种：

sql insert
copy，加载csv文件，可自定义间隔等
gpfdist & gpload，外部数据，需要看下是如何操作的
copy模式只能通过master节点导，所以相对比较慢。

存储

支持行存和列存，数据存储压缩，最大可以有30倍，这对客户最好的体验就是数据导入速度。
When different tables are joined on the same columns that comprise the distribution key, the join can be accomplished at the segments, which is much faster than joining rows across segments. 阿里某数据库，对join有要求，就是分区列必须都在join里。如果GP也这么做，速度会提升。

filespace & tablespace

基于greenplum system，创建一个filespace

tablespace是可以关联到固定磁盘空间的，譬如一些表IO要求小，可以放到sata上，一些IO要求高的，可以放到SSD上。
tablespace是创建在filespace上的：

CREATE TABLESPACE fastspace FILESPACE fastdisk;

创建表的时候，可以指定此表存储的位置：

CREATE TABLE tablename(options) TABLESPACE spacename

查看：

 SELECT spcname as tblspc, fsname as filespc, 
          fsedbid as seg_dbid, fselocation as datadir 
   FROM   pg_tablespace pgts, pg_filespace pgfs, 
          pg_filespace_entry pgfse 
   WHERE  pgts.spcfsoid=pgfse.fsefsoid 
          AND pgfse.fsefsoid=pgfs.oid 
   ORDER BY tblspc, seg_dbid;

   tblspc   |  filespc  | seg_dbid |              datadir              
------------+-----------+----------+-----------------------------------
 pg_default | pg_system |        1 | /home/gpadmin/data/master/gpseg-1
 pg_default | pg_system |        2 | /gpadmin/data/primary/gpseg0
 pg_default | pg_system |        3 | /gpadmin/data/primary/gpseg1
 pg_global  | pg_system |        1 | /home/gpadmin/data/master/gpseg-1
 pg_global  | pg_system |        2 | /gpadmin/data/primary/gpseg0
 pg_global  | pg_system |        3 | /gpadmin/data/primary/gpseg1
(6 rows)

存储模型

storage model
默认存储模型是和PostgreSQL一样的heap storage。

heap storage
heap模型，更适合OLTP类型，它的存储方式，适合频繁数据修改的场景。
因为update和delete都需要整行信息。
append-optimized storage
这种模式，官网上的介绍，建议针对批量表使用。bulk data load, read-only queries

行存，列存及混合

row
column
combination of both

行存：

事物操作频繁的OLTP作业，一次取列较多
selects against the table are wide, where many columns of a single row is needed in a query
Row oriented storage is more efficient when many columns are selected at the same time, or when the row size of a table is relatively small

列存：

典型的数据仓库作业（基于较少列进行聚合计算），简单几列数据的修改
在适合的场景，能够在I/O和存储空间上，占得优势。
更适合做压缩，对应压缩率也会更高
Column-oriented table storage is only available on append-optimized tables.
many columns where only a small subset of columns is accessed by the queries
selects are narrow and with aggregations of data computed over a small number of columns
for single columns that require regular updates without modifying other column data
best suited to queries that aggregate many values of a single column where the WHERE or HAVING predicate is also on the aggregate column

创建列存，column-oriented必须是append-optimized：

=> CREATE TABLE bar (a int, b text)
    WITH (appendonly=true, orientation=column)
    DISTRIBUTED BY (a);

数据压缩

Append-Optimized Tables Only
有两种压缩方式：1. 表级别压缩 2. 列级别压缩
显而易见，表级别压缩算法，会应用到整个表，列级别压缩算法，可以针对不同列，应用不同的压缩算法。

Distribution Policy

选择分布策略的时候，考虑三方面：

平均分布
尽量本地操作，譬如join，sort，aggregation等，尽量在本地操作
平衡查询工作，将查询任务拆解后，均衡地分布在所有节点上

默认是hash分布，如果有主键，则按主键，如果没有，则用第一列。
如果两个表join，建议使用join的列作为distributed key，这样可以使join本地化。

geometric和user-defined不能用做分布列
如果整张表都没有合适的列做分布列，gp就会按randomly或in round-robin fashion来处理

创建分布列：

=> CREATE TABLE products
                        (name varchar(40),
                         prod_id integer,
                         supplier_id integer)
             DISTRIBUTED BY (prod_id);

随机创建分布列：

=> CREATE TABLE random_stuff
                        (things text,
                         doodads text,
                         etc text)
             DISTRIBUTED RANDOMLY;

分布键(Distribution Key)选择
1. 能够将数据均衡地分散到各个segment上，达到并行处理，这是目的
2. distributed key和partition key不要用同一个
3. 数值列，可以，也建议使用这种类型。譬如smallint，integer，bigint等
4. varchar类型，可以
5. 时间类型，可以，也是比较建议使用的。譬如time，timestamp，date
6. 不适合做distributed key的类型，浮点型，TEXT类型，0/1这种等。

Partitioning

在创建表的时候，可以选择分区策略PARTITION BY和SUBPARTITION BY
在建表的时候，每个分区都会建立一个CHECK约束。这个CHECK会限定这个分区内数据的存储要求。查询器在做查询的时候，会检查分区的CHECK来决定扫描哪些分区。
表分区只能在创建的时候指定，不支持先导数据再建分区。后续会介绍多级分区，无论多少级，每一级分区最多可以有32767个。
建立分区的时候，一定要配DEFAULT partition，否则，一旦数据匹配不到CHECK，那么数据就会加载失败。
system catalog中会存储分区信息。

官方把用户的表称为root partitioned table，把经过分区后生成的有各自CHECK的存储单元称为leaf child table。可以通过INSERT把数据直接插入到根表，这时数据会被按规则分配到对应的叶表上；也可以直接把数据插入到叶表上。

如果有主键，主键必须包含分区列。

创建表分区，会带来额外的分区管理开销，不是所有的表都适合做分区。
表符合如下几个特征，才比较适合做分区：

足够大
当前查询效率不符合预期
业务查询条件一致
譬如大量查询where条件都是基于时间范围查询
历史数据
譬如要求缓存最近7天的数据，按天做分区。当做新旧数据更新的时候，可以按分区更新，更方便。
分区列，能否均衡地分割数据

只有在语句执行的时候，能够基于分区列信息去预判，减少查询分区数时，分区列才起到作用。
如果语句执行结果，要遍历所有分区，那么查询结果会差于无分区的数据存储方式。

可以做多级分区，但是操作风险略高，要小心：
譬如用col1和col2做多级分区列，col1里面有2种类型，col2里面有3中类型，那么最终GP将会划出来2*3=6个分区。
如果是列式存储，共10列。每列会存在同一个小表内，基于上面的分区，最终会生成2*3*10=60个分区
PS：要拿实际环境验证下

多级分区，会减少查询计划分解时间，单较单一的分区，查询更快。

分区有两种方式：

range partitioning
按范围分区
list partitioning
按值分区

使用Pivotal Query Optimizer的话，分区列只能使用1个。使用legacy optimizer，可以多列做composite partition keys。

range partitioning

分区可以按start, end, every来划分。默认start是包含在内的，但是end是不包含的：

CREATE TABLE sales (id int, date date, amt decimal(10,2))
DISTRIBUTED BY (id)
PARTITION BY RANGE (date)
( START (date '2008-01-01') INCLUSIVE
   END (date '2009-01-01') EXCLUSIVE
   EVERY (INTERVAL '1 day') );

可以手工指定分区，不用为每个分区指定end，它会以下一个分区的开始作为结束：

CREATE TABLE sales (id int, date date, amt decimal(10,2))
DISTRIBUTED BY (id)
PARTITION BY RANGE (date)
( PARTITION Jan08 START (date '2008-01-01') INCLUSIVE , 
  PARTITION Feb08 START (date '2008-02-01') INCLUSIVE ,
  PARTITION Mar08 START (date '2008-03-01') INCLUSIVE ,
  PARTITION Apr08 START (date '2008-04-01') INCLUSIVE ,
  PARTITION May08 START (date '2008-05-01') INCLUSIVE ,
  PARTITION Jun08 START (date '2008-06-01') INCLUSIVE ,
   END (date '2009-01-01') EXCLUSIVE );

CREATE TABLE rank (id int, rank int, year int, gender 
char(1), count int)
DISTRIBUTED BY (id)
PARTITION BY RANGE (year)
( START (2001) END (2008) EVERY (1), 
  DEFAULT PARTITION extra );

list partitioning

CREATE TABLE rank (id int, rank int, year int, gender 
char(1), count int ) 
DISTRIBUTED BY (id)
PARTITION BY LIST (gender)
( PARTITION girls VALUES ('F'), 
  PARTITION boys VALUES ('M'), 
  DEFAULT PARTITION other );

multi-level partitions

每个分区下，都会按照subpartition做分区。
两层分区：

CREATE TABLE sales (trans_id int, date date, amount 
decimal(9,2), region text) 
DISTRIBUTED BY (trans_id)
PARTITION BY RANGE (date)
SUBPARTITION BY LIST (region)
SUBPARTITION TEMPLATE
( SUBPARTITION usa VALUES ('usa'), 
  SUBPARTITION asia VALUES ('asia'), 
  SUBPARTITION europe VALUES ('europe'), 
  DEFAULT SUBPARTITION other_regions)
  (START (date '2011-01-01') INCLUSIVE
   END (date '2012-01-01') EXCLUSIVE
   EVERY (INTERVAL '1 month'), 
   DEFAULT PARTITION outlying_dates );

三层分区：

CREATE TABLE p3_sales (id int, year int, month int, day int, 
region text)
DISTRIBUTED BY (id)
PARTITION BY RANGE (year)
    SUBPARTITION BY RANGE (month)
       SUBPARTITION TEMPLATE (
        START (1) END (13) EVERY (1), 
        DEFAULT SUBPARTITION other_months )
           SUBPARTITION BY LIST (region)
             SUBPARTITION TEMPLATE (
               SUBPARTITION usa VALUES ('usa'),
               SUBPARTITION europe VALUES ('europe'),
               SUBPARTITION asia VALUES ('asia'),
               DEFAULT SUBPARTITION other_regions )
( START (2002) END (2012) EVERY (1), 
  DEFAULT PARTITION outlying_years );

索引（要看看）

GP不建议使用索引
GP主要做快速有序地扫描（基于分区）
如果建立全局索引，数据分布机制和分区机制，会完全打乱索引。如果基于单个分区去建立索引，这个有点像阿里的xxx，应该有一定效果吧。

GP中索引的起作用的场景：
返回1条或者很小的集合时
当可以使用index来替代全表扫描的查询（append-optimized tables）

GP只支持在用户创建的表上建立索引，不支持GP依据分区创建的叶表上创建索引。创建的索引会被复制到各个叶表上。

目前测试看到：
打开pivotal query optimizer，会触发index scan或table scan
打开legacy optimizer，会触发seq scan

类型

支持：
B-tree（默认）
GiST

不支持：
Hash
GIN

unique indexes
当索引列和分区列一致，append-optimized tables不支持
还有一些其他限制，再看看
bitmap indexes

创建索引：

CREATE INDEX gender_idx ON employee (gender);

cluster

cluster an index可以改变数据在物理磁盘上存储的序列，起到优化的作用。

直接用CLUSTER命令，对大表来说会比较慢。推荐一个比较快的办法，先把数据加载到一个临时表，然后通过修改的办法触发数据重排序：

CREATE TABLE new_table (LIKE old_table) 
       AS SELECT * FROM old_table ORDER BY myixcolumn;
DROP old_table;
ALTER TABLE new_table RENAME TO old_table;
CREATE INDEX myixcolumn_ix ON old_table;
VACUUM ANALYZE old_table;

PQO

Pivotal Query Optimizer
GP 4.3.5.0版本开始有，和legacy optimizer共存，默认使用legacy optimizer。
针对planning和optimization做了优化，在多核环境优势最大。
在如下几种类型的查询和操作有明显提升：

Queries against partitioned tables
Queries that contain a common table expression (CTE)
Queries that contain subqueries
DML Operation Enhancements with Pivotal Query Optimizer

在如下几个操作下，也有增强：

Improved join ordering
Join-Aggregate reordering
Sort order optimization
Data skew estimates included in query optimization

PQO的开关，可以在如下三个层面打开：

A Greenplum Database system
gpconfig -c optimizer -v on --masteronly
gpstop -u
A specific Greenplum database
ALTER DATABASE test_db SET OPTIMIZER = ON ;
A session or query
set optimizer = on ;

要使用PQO要满足几个条件：

The table does not contain multi-column partition keys.
The multi-level partitioned table is a uniform multi-level partitioned table.
The server configuration parameter optimizer_enable_master_only_queries is set to on when running against master only tables such as the system table pg_attribute.
Statistics have been collected on the root partition of a partitioned table.

在有分区的表上，应用PQO，要在根分区执行ANALYZE ROOTPARTITION，先收集一些根表的信息（不收集叶表的）。
要看下analyze命令。
GP还做了一个工具，analyzedb，用来做整体收集。

PQO和旧的legacy optimizer并存，是因为PQO不能独立支持所有GP宣传的特性，包括：

indexed expressions
PERCENTILE window function
External parameters
个别分区表不支持
- Non-uniform partitioned tables.
- Partitioned tables that have been altered to use an external table as a leaf child partition.
SortMergeJoin
Ordered aggregations
These analytics extensions:
- CUBE
- Multiple grouping sets
These scalar operators:
- ROW
- ROWCOMPARE
- FIELDSELECT
Multiple DISTINCT qualified aggregate functions
Inverse distribution functions

PQO使用时，如下功能，性能会下降：
xxx

如果使用join等操作，会触发shuffle，GP有两种类型：
1. 表比较小的时候，会广播，broadcast motion
2. 数据比较大的时候，redistribution motion，这个重分布，也只是把数据装载到内存中，同步到对应segment上而已，物理存储位置不变化

ANALYZE

针对分区和存储，做了数据收集。
可以配置参数，数值越大，信息收集时间越长，而未来查询效率更高（但只提到了legacy optimizer）

内存

GP对每个分区partition都有一个buffer
针对列存表，每列都有一个buffer
所以，一个拥有很多分区数，且列数特别多的表，消耗内存会很多

模式 schema

Query

两种查询模式：

parallel query plan
targeted query plan

motion

相比常见的查询计划，GP多了一个叫motion，并不是所有的查询都需要motion。
在查询执行的时候，segment之间会交换元组(tuple)。
查询计划，会切成很多个，能够由segment独立执行的单元，叫slice。

tuning

操作系统级别：
1. 提升系统内存cache，也不要太大，以免剩余内存不足，出现SWAP
2. 提高磁盘文件访问句柄数，提升磁盘IO

用最小的数据类型去存储数据，尤其是参与join的列。

Indexing is a bad word in Greenplum. Although supported, this is the last resort to a inefficiently written queries which usually have to do to an unbalanced distribution selection and/or some other related predicate that should have been coded (like the distributions are not being used in the JOIN)

Be constant with the execution of ANALYZE for tables that only get INSERT executed against them
Help your DBA find the Distribution Mismatch to help you make your processing work faster
Greenplum Database devises a query plan for each query it is given.
Choosing the right query plan to match the query and data structure is absolutely critical for good performance.
A query plan defines how the query will be executed in Greenplum Database’s parallel execution environment.
By examining the query plans of poorly performing queries, you can identify possible performance tuning opportunities.

Based on Greenplum’s Architecture:

Distribute by JOIN (For LOCAL JOIN Practice)
Partition by Predicate when truly necessary
Index only when truly necessary (not encourage)
As a DBA you must analyze and make sure that all of the tables associated with one another do posses the same DISTRIBUTION KEY set of components (or columns)
A LOCAL JOIN is that join between two or more tables that share the same Distribution column values, just as a Clustering Index does in a conventional RDBMS.
A LOCAL JOIN executes faster than a conventional Clustering INDEX.

select name, setting, unit, min_val, max_val, short_desc, extra_desc from pg_settings;
目前认为比较关键的

"block_size";"Shows size of a disk block"
"cpu_index_tuple_cost";"Sets the planner's estimate of the cost of processing each index entry during an index scan."
"cpu_operator_cost";"Sets the planner's estimate of the cost of processing each operator or function call."
"cpu_tuple_cost";"Sets the planner's estimate of the cost of processing each tuple (row)."
"debug_print_parse";"Prints the parse tree to the server log."
"debug_print_plan";"Prints the execution plan to server log."
"effective_cache_size";"Sets the planner's assumption about size of the disk cache."
"enable_bitmapscan";"Enables the planner's use of bitmap-scan plans."
"enable_groupagg";"Enables the planner's use of grouping aggregation plans."
"enable_hashagg";"Enables the planner's use of hashed aggregation plans."
"enable_hashjoin";"Enables the planner's use of hash join plans."
"enable_indexscan";"Enables the planner's use of index-scan plans."
"enable_mergejoin";"Enables the planner's use of merge join plans."
"enable_nestloop";"Enables the planner's use of nested-loop join plans."
"enable_seqscan";"Enables the planner's use of sequential-scan plans."
"enable_sort";"Enables the planner's use of explicit sort steps."
"random_page_cost";"Sets the planner's estimate of the cost of a nonsequentially fetched disk page."
"seq_page_cost";"Sets the planner's estimate of the cost of a sequentially fetched disk page."
"gp_autostats_mode";"Sets the autostats mode."

如果使用index scan效果比较好，我们可以通过如下方式，使优化器解析成index scan：
1. set enable_indexscan on
2. 降低random_page_cost的值到20或者10，甚至更低
3. 提升seq_page_cost的值到10或者15，甚至更高

scan包括

Seq Scan on heap tables
Append-Only Scan on row oriented AO tables
Append-Only Columnar Scan on column oriented AO tables
Index scan
Bitmap Append-Only Row-Oriented Scan

Join包括：

hash join(一般是最快的)
nested loop join
merge join

join
http://blog.csdn.net/lichangzai/article/details/8332957

聚合
HashAggregate & GroupAggregate
http://blog.csdn.net/scutshuxue/article/details/6791157

讨论

dist

ribution & partitioning
distribution是物理层面的，partitioning是逻辑层面的
distribution策略保证数据分布在不同segment上，进而使得任务并发处理
partitioning是逻辑层面的，将同一各segment上的数据进行分区，进而达到segment上查询动作的优化

安装配置

用户

不能用root安装和启动gp
新建帐户要对安装目录有完整权限，默认安装位置/usr/local/greenplum-db-4.3.x.x，也可在安装的时候输入一个完整路径

data directory

存储数据的位置
如果1个物理机上安装了多个实例，譬如装了1个master，3个segment，那么就得配4个路径

配置

国外有个安装文档，很详细，参考：
https://blog.pivotal.io/big-data-pivotal/features/how-to-build-a-hardware-cluster-for-pivotal-greenplum-database
建议每个segment host上，配置最多4到6个segments，而物理服务器的内存，也建议在256G或者更高，每个segment建议分配32G内存。

使用

连接

yum -y install postgresql
psql -d gp -h 1.2.3.4 -p 5432 -U gpadmin

操作

pqsql命令

help可以打印出总的帮助信息
\?有点类似man，可以看到pqsql的命令帮助

数据库

创建：

createdb -h 192.168.123.92 -p 5432 -U gpadmin db_t

查看数据库列表

psql -l -h 192.168.123.92 -p 5432 -U gpadmin
[root@slb1 ~]# psql -l -h 192.168.123.92 -p 5432 -U gpadmin
                  List of databases
   Name    |  Owner  | Encoding |  Access privileges  
-----------+---------+----------+---------------------
 db_t      | gpadmin | UTF8     |

列出所有数据库

db_t=# \l
                  List of databases
   Name    |  Owner  | Encoding |  Access privileges  
-----------+---------+----------+---------------------
 db_t      | gpadmin | UTF8     | 
 ...
 template0 | gpadmin | UTF8     | =c/gpadmin
                                : gpadmin=CTc/gpadmin
 template1 | gpadmin | UTF8     | =c/gpadmin
                                : gpadmin=CTc/gpadmin
(6 rows)

db_t=# SELECT datname from pg_database;
  datname  
-----------
 ...
 db_t
 template1
 template0
(6 rows)

表

创建表

 db_t=# CREATE TABLE t1 (
    i1 int PRIMARY KEY,
    i2 int,
    s1 varchar(40)
);

如果给出了模式名（比如，CREATE TABLE myschema.mytable …），那么表是在指定模式中创建的。否则它在当前模式中创建。

create TABLE t_schema.t3 (
    i1 int PRIMARY KEY,
    i2 int,
    s1 varchar(40)
);

列出表的详细信息

db_t=# \d+ t3
                         Table "t_schema.t3"
 Column |         Type          | Modifiers | Storage  | Description 
--------+-----------------------+-----------+----------+-------------
 i1     | integer               | not null  | plain    | 
 i2     | integer               |           | plain    | 
 s1     | character varying(40) |           | extended | 
Indexes:
    "t3_pkey" PRIMARY KEY, btree (i1)
Has OIDs: no

列出当前模式schema下所有表

db_t=# \dt
        List of relations
 Schema | Name | Type  |  Owner  
--------+------+-------+---------
 public | t1   | table | gpadmin
(1 row)

查看所有表，抛开模式schema

db_t=# select schemaname,tablename,tableowner from pg_tables;
     schemaname     |           tablename           | tableowner 
--------------------+-------------------------------+------------
 information_schema | sql_languages                 | gpadmin
 information_schema | sql_packages                  | gpadmin
 ...                | ...                           | ...
 public             | t1                            | gpadmin
 public             | t2                            | gpadmin
 t_schema           | t3                            | gpadmin
(90 rows)

查看某张表数据量：

select pg_size_pretty(pg_relation_size('table_name_xxxxx'));

模式

列出模式

db_t=# \dn
       List of schemas
        Name        |  Owner  
--------------------+---------
 gp_toolkit         | gpadmin
 information_schema | gpadmin
 pg_aoseg           | gpadmin
 pg_bitmapindex     | gpadmin
 pg_catalog         | gpadmin
 pg_toast           | gpadmin
 public             | gpadmin
(7 rows)

创建新模式schema

CREATE SCHEMA t_schema;

删除模式schema

DROP SCHEMA t_schema;

查看当前模式

db_t=# SHOW search_path;
  search_path   
----------------
 "$user",public
(1 row)

修改默认模式

db_t=# SET search_path=t_schema;
SET
Time: 14.754 ms
db_t=# SHOW search_path;
 search_path 
-------------
 t_schema
(1 row)

配置

select name, setting, unit from pg_settings ;

Grand Unified Configuration (GUC)
GUCs for Index Selection
1. random_page_cost (master/session/reload) Default value: 100
Sets the planner’s estimate of the cost of a non sequentially fetched disk page
Lower value increases the chances for index scan to be picked
2. enable_indexscan (master/session/reload) Default value: on
Enables or disables the query planner’s use of index-scan plan types
3. enable_nestloop (master/session/reload) Default value: off
Enables or disables the query planner’s use of nested-loop join plans
This should be enabled for use of index in nested loop joins
4. enable_bitmapscan (master/session/reload) Default value: on
Enables or disables the query planner’s use of bitmap-scan plan types.
Generally bitmap scan provides faster access, however you can try disabling it in specifically if you are getting very few rows out of index
5. enable_seqscan (master/session/reload) Default value: on
Disabling enable_seqscan results in use of index
Use this parameter very carefully only as last resort

其他

#显示命令执行的时间
\timing

运维

监控

磁盘 iostat
网络 ifstat
CPU mpstat
内存 tee/vmstat

gpperfmon，GP performance monitor

gpcheckperf，文件系统读写性能测试

pgbench和TCP-H

基础

深入

append optimized storage

todo

资源隔离&高并发

todo

评测

参考

pgsql的命令
Greenplum Database Performance Tuning

你可能感兴趣的:(linux,大数据,数据库,mysql,MPP,greenplum,postgresql,yum,大数据,MPP)

计算机毕业设计Python+uniapp校园兼职系统小程序(小程序+源码+LW) Python毕设源码程序高学长 python 课程设计 uni-app
计算机毕业设计Python+uniapp校园兼职系统小程序(小程序+源码+LW)该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+uni+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+UNI等等组成，B/S模式+pychram管理
Python-Django毕业设计养老院老人日常生活管理系统（程序+Lw) Python计算机毕设程序源码_ python django 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+Vue等等组成，B/S模式+pychram管理等等。环境需要1.运行环境：最好是python3.7.7，我们在这个版本上开发的。其他版
pigz更快的压缩和解压工具老率的IT私房菜
pigz(parallelimplementationofgzip)是一个并行执行的压缩工具，解压缩比gzip快，同时CPU消耗是gzip的好几倍，在对短时间内CPU消耗较高不受影响的场景下，可以使用pigz。环境Centos7RAM:2GB,CPU:4vcpus安装#安装epel扩展源[root@localhost~]#wget-O/etc/yum.repos.d/epel-7.repohttp
mysql 清除事物_mysql事物处理
mysql事物主要用于处理操作量大，复杂度高的数据。比如说，在人员管理系统中，你删除一个人员，你既要删除人员的基本资料，也要删除和该人员相关的信息，如信箱，文章等。这样，这些数据库操作语句就构成一个事物。注意一下几点：在MySQL中只有使用了Innodb数据库引擎的数据库或表才支持事务。事物处理可以用来维护数据库的完整性，保证成批的sql语句要么全部执行，要么全部不执行。事物用来管理insert，
智慧水库信息化系统建设产品需求文档V2.0 小赖同学啊 test Technology Precious 物联网
智慧水库信息化系统建设产品需求文档1.引言1.1文档目的本文档旨在明确智慧水库信息化系统的建设需求，为系统设计、开发和实施提供全面依据，确保系统功能满足水库管理业务需求，提升水库管理的智能化水平和决策效率。1.2背景介绍传统水库管理面临数据采集不及时、分析手段有限、决策依赖经验等问题，难以应对复杂多变的水文情势和日益增长的管理需求。随着物联网、大数据、人工智能等技术的发展，智慧水库建设成为必然趋势
MySQL(149)如何进行数据清洗？辞暮尔尔-烟火年年 MySQL mysql python 数据库
数据清洗在数据处理和分析过程中至关重要，确保数据质量和一致性。以下是一个详细的指南，展示如何使用Java进行数据清洗，包括处理缺失值、重复值、异常值、数据类型转换以及标准化等步骤。一、准备工作确保安装有Java开发环境（JDK）和Maven或Gradle等依赖管理工具。我们将使用ApacheCommonsCSV库来处理CSV文件，并使用Java标准库进行数据清洗操作。二、加载数据首先，我们加载数据
MySQL(147)如何进行跨平台迁移？辞暮尔尔-烟火年年 mysql adb 数据库
跨平台迁移涉及将数据库从一个操作系统或平台迁移到另一个，例如从Windows迁移到Linux，或从不同架构的硬件之间进行迁移。这个过程比同平台迁移更加复杂，需要特别注意数据库的兼容性、数据编码、文件路径等问题。以下是一步一步的指导，详细介绍如何进行跨平台数据库迁移。一、准备工作1.确认源与目标平台源平台：当前运行数据库的操作系统和硬件平台。目标平台：新的操作系统和硬件平台。2.安装数据库软件在目标
MySQL(141)如何处理重复数据问题？辞暮尔尔-烟火年年 MySQL mysql 数据库
处理重复数据问题是数据管理中的一个常见挑战。重复数据会影响数据库的性能、占用资源，并且可能导致数据分析结果的偏差。以下是处理重复数据问题的详细步骤以及结合代码的示例。一、识别重复数据首先，需要识别数据库中的重复数据。可以使用SQL查询来查找重复的数据。示例：假设我们有一个名为employees的表，其中包含以下字段：id、name和email。CREATETABLEemployees(idINTP
IM即时通讯源码/im源码基于uniapp框架从0开始设计搭建在线聊天系统宠友信息 uni-app mysql spring boot java 小程序
文章目录前言一、确定技术栈二、数据库设计：1.引入库2.使用SpringBoot创建后端项目3.实现WebSocket通信：3.1创建WebSocket配置类：3.2创建ChatWebSocketHandler类：3.3前端WebSocket连接与通信：总结前言随着人社交产品的不断发展，即时通讯聊天这门技术也越来越重要，很多人都开启了学习通讯技术，本文就介绍了即时通讯的基础内容。一、确定技术栈在开
磁盘性能测试参数平凡之路001
LINUX性能测试参数：•测试随机写IOPS：fio-direct=1-iodepth=128-rw=randwrite-ioengine=libaio-bs=4k-size=1G-numjobs=1-runtime=1000-group_reporting-filename=iotest-name=Rand_Write_Testing•测试随机读IOPS：fio-direct=1-iodepth
从零开始学 Linux：循序渐进的学习指南我爱学嵌入式 Linux基础 linux 服务器
Linux作为一款开源、稳定且安全的操作系统，在服务器领域、嵌入式开发、云计算等场景中占据着举足轻重的地位。对于程序员、运维工程师或IT爱好者而言，掌握Linux技能已成为一项核心竞争力。但面对命令行界面和复杂的系统架构，很多初学者往往感到无从下手。本文将为你梳理一条清晰的Linux学习路径，助你从入门到精通。一、明确学习目标：为什么学Linux？学习Linux前需明确目标，不同目标对应不同的学习
（详细！！）2024最新Neo4j详细使用指南熊猫发电机：miniqq207 neo4j neo4j
Neo4j详细使用指南一、介绍Neo4j是什么Neo4j是一个高性能的,NOSQL图形数据库，它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎，但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎，该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态
9.20其二道左无人
做一家服务公司，为下面的公司提供一些事务性的管理、财务管理、风险管理的服务，粘住一个大圈子的HR，通过下面的公司做掉项目，为HR提供一个稳定的资源变现的渠道；做一家科技公司，提供线上的平台运营，大数据采集，以及基于这个基础上的卖货、信贷等服务做一家连锁企业，每一家门店都是独立的企业，提供招聘、引流以及终端服务所以外部通过众筹绑定大批量的HR，就会有稳定的订单，通过服务公司提供服务，通过终端门店保证
mysql事物详解
前言：事物是什么？作为一个java程序员，也许我们仅仅只是停留在会使用的程度上，会通过在类上或者方法上使用@Transactional注解的方式来使用事物，但是背后的原理，为什么使用这个注解就能使事物生效可能并不是很清楚。下面本文详细一一介绍事物是什么，事物的特性，怎么使用等等。1.事物是什么所谓事物，在我的理解中就是一系列操作的一个集合，一旦其中一个操作失败，那么整个操作集合必须全部失败，回滚到
JAVAWeb2 DanB24 oracle 数据库
1.数据库设计1.软件的研发步骤数据库设计概念数据库设计就是根据业务系统的具体需求，结合我们所选用的DBMS，为这个业务系统构造出最优的数据存储模型。建立数据库中的表结构以及表与表之间的关联关系的过程。有哪些表？表里有哪些字段？表和表之间有什么关系？数据库设计的步骤需求分析（数据是什么?数据具有哪些属性?数据与属性的特点是什么）逻辑分析（通过ER图对数据库进行逻辑建模，不需要考虑我们所选用的数据库
C#程序唯一性守护：用互斥锁（Mutex）实现进程级安全控制的实战指南
为什么程序重复启动是个"毒瘤"？在软件开发中，程序重复启动可能导致以下灾难性后果：资源冲突：多个实例争夺数据库连接、文件句柄等有限资源数据污染：并发写入配置文件导致内容错乱界面混乱：多个窗口同时弹出，用户体验崩坏安全漏洞：恶意程序通过伪造实例窃取数据而互斥锁（Mutex）是Windows/Linux系统提供的原生机制，能完美解决这些问题。相比文件锁、注册表标记等传统方案，Mutex具有以下不可替代
只靠可视化大屏，做不了数字化，数据总监总结3点，你做到了几个大数据的那些事
企业数字化是很多企业热衷的话题。本文的数字化指各行业头的头部企业的端到端数字化解决方案，常见部署于华为专有云、阿里私有云、亚马逊云，项目金额一般百万起步，上不封顶。很多企业投人、投钱数字化，都希望有个酷炫的数据大脑，政府、合作伙伴来参观时，用酷炫的数据大脑让来宾们啧啧称赞。热闹散去后，企业内部的各部门，天天围着数据挖宝，大数据快告诉我，下个月能卖多少，哪几个渠道卖得不好，哪条生产线有问题，哪些货压
从零开发推客小程序系统：完整技术方案与实战经验 wx_ywyy6798 小程序推客小程序开发推客系统开发微信小程序推客小程序推客系统推客分销系统开发
一、推客小程序的市场价值社交电商爆发式增长背景推客模式的优势：低成本获客、用户裂变小程序作为推客系统载体的天然优势二、技术架构设计text1.前端技术栈：-微信小程序原生开发/uni-app跨平台方案-自定义分享组件开发-可视化数据看板实现2.后端技术选型：-Node.js/PHP/JavaSpringBoot等后端框架对比-高性能分销关系链存储方案-佣金结算系统的设计要点3.数据库设计：-用户层
基于 MySQL 8.0.40 MGR 与 ProxySQL 的高可用集群部署实践 derek2026 部署实践 mysql 数据库
构建高可用MySQL8.0.40集群：MGR+ProxySQL实战指南一、部署架构图流量路径：应用→ProxySQL（DNS解析ProxySQLIP）→MySQLMGR集群二、环境准备1.系统要求**操作系统:**CentOS7.x服务器配置3台节点（建议最小配置：4核CPU/8GB内存/100GB磁盘）网络互通（关闭防火墙或开放端口：3306,33081,6032,6033节点规划节点1:192
linux如何使用jstack分析线程状态 ycllycll linux
在高并发，多线程环境下的java程序经常需要分析线程状态，本本是一个分析步骤无具体讲解（具体命令可自行google学习）一般流程：1.使用jps-l查看有哪些java程序在运行2.使用top查看步骤1中进程号（pid或者vmid）所占用cpu以及内存情况（或者省略步骤1）3.使用top-Hppid查看具体该pid下各个线程所占用的cpu情况（进程下的线程有一个nid，后面需要用到）4.使用jsta
sql优化之延迟关联 ycllycll mysql sql 数据库
具体看这个文章，写得非常不错：mysql优化：覆盖索引（延迟关联）-一枝花算不算浪漫-博客园看完后思考：1.业务相关的表规范上都要设置递增的主键字段，便于后续优化2.很多时候sql查询的性能瓶颈基本都在io上而不是cpu，所以才会这么优化，尽量在sql的where条件后都走主键，不要让sql走回表操作3.博客中改造的sql比较适合大表跟小表的关联情形
hive底层原理 sql执行过程_Hive原理总结（完整版）
目录课程大纲(HIVE增强)31.Hive基本概念41.1Hive简介41.1.1什么是Hive41.1.2为什么使用Hive41.1.3Hive的特点41.2Hive架构51.2.1架构图51.2.2基本组成51.2.3各组件的基本功能51.3Hive与Hadoop的关系61.4Hive与传统数据库对比61.5Hive的数据存储62.Hive基本操作72.1DDL操作72.1.1创建表72.1.
Linux: rsync+inotify实时同步及rsync+sersync实时同步能不能别报错 linux系统运维 linux 服务器运维
rsync+sersync和rsync+inotify是两种常用的实时文件同步方案，用于监控源目录变化并自动同步到目标位置。以下是对两者的详细对比和配置指南：核心区别方案原理优点缺点rsync+inotify使用Linux内核的inotify监控文件变化，触发rsync同步原生支持，无需额外依赖需手动编写脚本，稳定性依赖实现rsync+sersync基于inotify和rsync，封装为独立工具，
springboot-mybatis-MySQL-集成张_皮皮 springboot mybatis maven springboot mybatis idea
这也是我第一次搭建springboot-mybatis的项目环境，记录一下。我是用IntelliJIDEA，你可以创建maven项目，也可以直接创建spring项目，最终的项目结构如下，这里说明下，resources下面的mappers里面是存放mybatis的SQL映射文件，static下面存放前端静态资源文件，如js,css等，template下存放前端模板文件，本项目使用的freemarke
Centos7下搭建Gitlab服务器行远大于想工具篇 gitlab centos 阿里云
Centos7下搭建Gitlab服务器1简介2安装配置依赖2.1安装启动ssh服务2.2配置防火墙2.3安装邮件服务3安装配置gitlab3.1配置yum源3.2yum安装3.3配置访问地址3.4重新配置应用3.5启动gitlab3.6防火墙开放端口4登录gitlab4.1阿里云配置安全规则4.2修改密码5卸载Gitlab6Gitlab忘记root密码7Gitlab汉化8参考文献1简介gitlab
Android图书借阅系统完整App开发教程(源码+数据库)
本文还有配套的精品资源，点击获取简介：本教程深入介绍了基于Android平台的图书借阅系统App开发过程，涵盖了从UI设计、网络通信到数据库操作的全面实践。项目包含源码和数据库文件，让学生能够通过实际案例学习并掌握Android应用开发的核心技术。本App具有预约借书、书籍评论、图书推荐和逾期提醒等功能，要求开发者熟悉Java语言和Android系统，以及实现后端逻辑和数据存储。此项目是一个宝贵的
gitlab修改DNS解析配置文件中东大鹅 gitlab linux git
在Linux（CentOS7.9）云服务器上解压gitlab时提示需要Python的环境[root@rainyun-v1vct1josrc]#rpm-ivhgitlab-ce-10.8.4-ce.0.el7.x86_64.rpmwarning:gitlab-ce-10.8.4-ce.0.el7.x86_64.rpm:HeaderV4RSA/SHA1Signature,keyIDf27eab47:N
CentOS7 /sysroot挂载失败 Reak.C linux 运维服务器
K8S重启完后进不了系统，提示/sysroot挂载失败测试了使用"镜像救援模式"和"进入紧急模式"两种方法我的情况是“进入紧急模式”方法有效在系统启动界面按“e”，进入编辑找到"linux16"开头的行，在该行末尾加入rd.break，按Ctrl+X启动系统#xfs文件系统使用xfs_repair修复xfs文件系统。对于其他文件系统执行fsck.xxx（xxx根据实际情况ext3、ext4）命令，
框架技术SpringBoot ---SpringBoot集成Mybatis 码农C风 JAVAweb java spring java-ee 数据库
SpringBoot框架内容管理ORM操作MySQLSpringBoot集成Mybaits步骤第一种方式：@Mapper注解第二种方式：@MapperScandao和xml文件分开---yml中配置事务txSpringBoot使用事务业务方法加入@Transactional；同时主启动类加上@TransactionManagerSpringBoot框架整合持久层框架，Mybatis前面已经分享了S
Python Django 数据库索引优化 Python编程之道 python django 数据库 ai
PythonDjango数据库索引优化关键词：DjangoORM、数据库索引、查询优化、性能调优、PostgreSQL、MySQL、执行计划摘要：本文深入探讨Django框架中的数据库索引优化策略。我们将从数据库索引的基本原理出发，详细分析DjangoORM如何生成SQL查询，以及如何通过合理的索引设计提升查询性能。文章包含索引类型选择、复合索引优化、Django模型字段索引配置、查询集优化技巧等
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb