iteye_3158

行式数据库评测：Oracle 11g R2企业版

本文我们将评测传统的行存储数据库，评测的重点仍然是tpc-h分析型查询，主要检验各种数据库在数据仓库方面的能力。我们从市场占有率最高的商业数据库Oracle开始。

　　一、数据库安装

　　Oracle在其官方技术网站上提供了Oracle 10g R2、11g R1、11g R2等各种版本软件的下载，这里也提供了文档在线浏览和下载，这为用户试用带来了方便，但值得一提的，虽然软件本身没有对功能和试用期限进行限制，但在用户协议中对用户的权利和义务有明确的约定，用户必须接受协议才能试用。由于Oracle已经宣布Oracle 10g R2、11g R1产品生命周期的结束日期，此后不再提供技术支持服务。通过文档我们了解到，企业版比标准版具有更多的高级功能，比如：分区、并行查询等，也具有更大的扩展性。因此我们采用11g R2企业版来做评测，以最大限度地了解这个产品的全部功能。在上述网站注册一个免费用户就可以下载安装文件。

　　Oracle 11.2支持的平台有windows 32位/64位、linux、Solaris、HP-UX 、AIX等10种。本次测试基于Intel Xeon 7550*8的PC服务器上用VMWare VSphere 4.1管理的虚拟机，虚拟机的逻辑CPU个数是8，内存100GB，存储为8个300GB SAS本地磁盘，采用一块512M缓存RAID卡，按RAID5方式组成磁盘阵列。操作系统采用和RHEL 5相同的核心级别的RedFlag Asian Linux Sever 3.0 x64。因此选用的安装文件是64位x86 Linux版本，linux.x64_11gR2_database_1of2.zip和linux.x64_11gR2_database_2of2.zip，2个文件合计大约2.2G,必须都下载，然后解压缩到同一个目录才能执行安装。Oracle的安装在各种数据库当中算是比较复杂的，但由于Oracle的市场地位和流行程度，专门介绍安装的文档在互联网上也是不计其数。因此本文不准备详细介绍每个步骤，只说明一些初次使用者易错的关键步骤。更详细的步骤，参考官方安装文档。

　　在Linux环境进行Oracle安装的关键步骤有下面几步：

　　1、先决条件检查，检查内存、交换文件和临时文件目录大小以及操作系统版本是否符合Oracle安装的最低要求。

[root@redflag11012501 ~]# grep MemTotal / proc / meminfo
MemTotal: 103140528 kB
[root@redflag11012501 ~]# grep SwapTotal / proc / meminfo
SwapTotal: 5996536 kB
[root@redflag11012501 ~]# free
total used free sharedbuffers cached
Mem: 103140528 5758696 97381832 0 138936 5261496
-/+ buffers / cache: 358264 102782264
Swap: 5996536 0 5996536
[root@redflag11012501 ~]# df - h / dev / shm /
文件系统容量已用可用已用% 挂载点
tmpfs50G 0 50G 0 % / dev / shm
[root@redflag11012501 ~]# uname - m
x86_64
[root@redflag11012501 ~]# df - h / tmp
文件系统容量已用可用已用% 挂载点
/ dev / mapper / VolGroup00 - LogVol00
24G 5 .4G 17G 25 % /
[root@redflag11012501 ~]# df - h
文件系统容量已用可用已用% 挂载点
/ dev / mapper / VolGroup00 - LogVol00
24G 5 .4G 17G 25 % /
/ dev / sda199M 13M 82M 14 % / boot
tmpfs50G 0 50G 0 % / dev / shm
/ dev / mapper / vg0 - datalv
739G 4 .9G696G 1 % / user1
[root@redflag11012501 ~]# cat / proc / version
Linux version 2.6 . 18 - 194.1 .AXS3 ([email protected]) (gcc version 4.1 . 2 20080704 (Asianux 3.0 4.1 . 2 - 48 )) # 1 SMP Fri May 7 10 : 03 : 53 CST 2010
[root@redflag11012501 ~]# uname - r
2.6 . 18 - 194.1 .AXS3

　　2、创建操作系统oracle用户和组。并给oracle用户设置口令。

[root@redflag11012501 ~]# / usr / sbin / groupadd oinstall
[root@redflag11012501 ~]# / usr / sbin / groupadd - g 502 dba
[root@redflag11012501 ~]# / usr / sbin / groupadd - g 503 oper
[root@redflag11012501 ~]# / usr / sbin / groupadd - g 504 asmadmin
[root@redflag11012501 ~]# / usr / sbin / groupadd - g 506 asmdba
[root@redflag11012501 ~]# / usr / sbin / groupadd - g 505 asmoper
[root@redflag11012501 ~]# / usr / sbin / useradd - u 502 - g oinstall - G dba,asmdba,oper oracle
[root@redflag11012501 ~]# passwd oracle
Changing password for user oracle.
New UNIX password:
BAD PASSWORD: it is based on a dictionary word
Retype new UNIX password:
passwd: all authentication tokens updated successfully.

　　3、设定oracle用户的资源限制。S表示软限制、H表示硬限制。

[root@redflag11012501 ~]# su - oracle
[oracle@redflag11012501 ~]$ ulimit - Sn 2048
[oracle@redflag11012501 ~]$ ulimit - Hn 65536
[oracle@redflag11012501 ~]$ ulimit - Su 16384
[oracle@redflag11012501 ~]$ ulimit - Hu 16384
[oracle@redflag11012501 ~]$ ulimit - Ss 10240
[oracle@redflag11012501 ~]$ ulimit - Hs unlimited

　　4、用root用户设定系统核心参数。从11.2开始，Oracle安装文件提供了自动修改某些参数的功能，因此这一步变得可选。可以查看原始参数的值。

[root@redflag11012501 ~]# / sbin / sysctl - a | grep sem
kernel.sem = 256 32000 100 142
[root@redflag11012501 ~]# / sbin / sysctl - a | grep shm
vm.hugetlb_shm_group = 0
kernel.shmmni = 4096
kernel.shmall = 4294967296
kernel.shmmax = 68719476736
[root@redflag11012501 ~]# / sbin / sysctl - a | grep file - max
fs.file - max = 131072

　　5、创建安装二进制文件存放目录和数据库文件存放目录等，并改变属主为oracle。

[root@redflag11012501 ~]# mkdir - p / user1 / app / oracle
[root@redflag11012501 ~]# chown - R oracle:oinstall / user1 / app / oracle
[root@redflag11012501 ~]# chmod - R 775 / user1 / app / oracle
[root@redflag11012501 ~]# mkdir - p / user1 / app / oradata
[root@redflag11012501 ~]# chown - R oracle:oinstall / user1 / app / oradata
[root@redflag11012501 ~]# chmod - R 775 / user1 / app / oradata
[root@redflag11012501 ~]# mkdir - p / user1 / app / recovery_area
[root@redflag11012501 ~]# chown - R oracle:oinstall / user1 / app / recovery_area
[root@redflag11012501 ~]# chmod - R 775 / user1 / app / recovery_area

　　6、用x图形界面工具登录。在图形终端中查看display的端口，并据此设定oracle用户DISPLAY环境变量，运行安装程序runInstaller,按界面提示操作。

[root@redflag11012501 ~]# xdpyinfo
name of display: 10.4 . 105.241 : 1.0
version number: 11.0
vendor string :NetSarang Computer, Inc.
vendor release number: 1391
...
[root@redflag11012501 ~]#
[root@redflag11012501 ~]# su - oracle
[oracle@redflag11012501 ~]$ export DISPLAY = 10.4 . 105.241 : 1.0
[oracle@redflag11012501 ~]$ cd / user1 / app / oradata / database
[oracle@redflag11012501 database]$ . / runInstaller

　　7、安装程序检查后自动生成了修改核心参数的脚本，需要用root用户执行。

[root@redflag11012501 ~]# / tmp / CVU_11. 2.0 . 2 .0_oracle / runfixup.sh
/ usr / bin / id
Response file being used is : / tmp / CVU_11. 2.0 . 2 .0_oracle / fixup.response
Enable file being used is : / tmp / CVU_11. 2.0 . 2 .0_oracle / fixup.enable
Log file location: / tmp / CVU_11. 2.0 . 2 .0_oracle / orarun.log
Setting Kernel Parameters...
fs.file - max = 131072
fs.file - max = 6815744
net.ipv4.ip_local_port_range = 9000 65500
net.core.rmem_max = 262144
net.core.rmem_max = 4194304
net.core.wmem_max = 262144
net.core.wmem_max = 1048576
fs.aio - max - nr = 1048576

　　安装注意事项：

　　Oracle用一个安装包包括了标准版和企业版的功能，只要在安装类型选择企业版即可。

　　安装完数据库软件后，执行dbca创建数据库，注意选择类型为一般用途，SGA一般用默认的物理内存的40%即可,不必设得过大，因为操作系统需要部分内存作文件缓存，如果Oracle占用过大，就会影响操作系统的操作，不但不能提高性能，反而会降低性能。用netca创建监听和服务。就可以进行一般的测试了。

　　二、TPC-H基准测试介绍

　　1、背景

　　TPC即美国事务处理效能委员会(Transaction Processing Performance Council)，是一家非盈利机构，也是国际上最具权威性的高端计算器产品效能评测组织之一，被称为 “高端计算机产品竞技的国际俱乐部”。目前在国际上几乎所有 IT界知名厂商都是其会员。负责定义事务处理与数据库性能基准测试，并依据这些基准测试项目发布客观性能数据。TPC基准测试有极为严格的运行要求，并且在独立审计机构监督下进行。

　　TPC-H(商业智能计算测试)是TPC的重要测试标准之一，主要用来模拟真实商业的应用环境。商业智能计算测试是对现实中商用计算需求的全面模拟。它包括模拟真实商业交易数据库的动态查询，以及作为决策支持与数据库应用系统的参考。可以全方位评测系统的整体商业计算综合能力，对厂商的要求更高，同时也具有普遍的商业实用意义。

　　TPC-H 基准测试是由 TPC-D发展而来的。TPC-H 用 3NF 实现了一个数据仓库,共包含 8 个基本关系/表,其中表REGION和表NATION的记录数是固定的(分别为5和25)，其它6个表的记录数，则随所设定的参数SF而有所不同，其数据量可以设定从 1GB～3TB 不等。有8个级别供用户选择。测试时，将22个复杂查询(SELECT)随机组成查询流，2个更新(带有INSERT和DELETE的程序段)操作组成一个更新流，查询流和更新流并发执行数据库访问，查询流数目随数据量增加而增加。TPC-H 基准测试包括 22 个查询(Q1~Q22),其主要评价指标是各个查询的响应时间,即从提交查询到结果返回所需时间.TPC-H 基准测试的度量单位是每小时执行的查询数( QphH@size)，其中 H 表示每小时系统执行复杂查询的平均次数，size 表示数据库规模的大小,它能够反映出系统在处理查询时的能力.TPC-H 是根据真实的生产运行环境来建模的,这使得它可以评估一些其他测试所不能评估的关键性能参数，满足了数据仓库领域的测试需求。

　　在我们的实验中，为了简化操作，只测试查询，并设定的SF的值为10。表示数据量为10GB级别。8张表的E/R图(来自tpc官方文档)如下：

　　需要说明的是，虽然每个表都有唯一键,表之间有引用关系，TPC-H并不要求测试表定义中必须包含主键和外键定义。而允许测试的数据库自行决定。

　　TPC-H用来执行的查询具有下列特征：

　　1、具有高度复杂性；2、使用各种访问；3、是特定的；4、检查可用数据的大多数；5、各不相同；6、每次查询的参数可变。

　　这些查询为下列商业分析提供了答案：

　　价格和推广、供应和需求管理、利润和收入管理、顾客满意度研究、市场份额研究、发货管理。

　　因此TPC-H的22个查询涵盖了商业分析的诸方面，具有普遍性和实用性。从查询SQL语句的实际内容来看，包括符合SQL 92标准的表连接、子查询，IN、EXISTS操作，HAVING操作，GROUP BY,UNION,日期操作，也是全面地检验了数据库应付各种语句的能力。

　　注意：具体查询sql语句必须通过dbgen工具产生，除了限定输出记录行数的子句，不允许人工修改写法。

　　2、测试数据和查询语句的产生步骤

　　将从tpc网站下载的源代码包解压缩，从模板复制一份makefile,然后修改其中和数据库类型、操作系统类型相关的内容，执行make编译。

[root@redflag11012501 tmp]# su - oracle
[oracle@redflag11012501 ~]$ cd / user1 / app / oradata / tmp
[oracle@redflag11012501 tmp]$ unzip / user1 / app / tpch_2_13_0.zip
Archive: / user1 / app / tpch_2_13_0.zip
inflating: build.c
inflating: driver.c
inflating: bm_utils.c
inflating: rnd .c
inflating: print.c
inflating: load_stub.c
inflating: bcd2.c
inflating: speed_seed.c
inflating: text.c
....

[oracle@redflag11012501 tmp]$ cp makefile.suite makefile
[oracle@redflag11012501 tmp]$ vi makefile
...
################
## CHANGE NAME OF ANSI COMPILER HERE
################
CC = gcc
# Current values for DATABASE are: INFORMIX, DB2, TDAT (Teradata)
#SQLSERVER, SYBASE, ORACLE
# Current values for MACHINE are:ATT, DOS, HP, IBM, ICL, MVS,
#SGI, SUN, U2200, VMS, LINUX, WIN32
# Current values for WORKLOAD are:TPCH
DATABASE = ORACLE
MACHINE = LINUX
WORKLOAD = TPCH
...
[oracle@redflag11012501 tmp]$ make
chmod 755 update_release.sh
. / update_release.sh 2 13 0
gcc - g - DDBNAME =\ " dss\ " - DLINUX - DORACLE - DTPCH - DRNG_TEST - D_FILE_OFFSET_BITS = 64 - c - o build.o build.c
…
gcc - g - DDBNAME =\ " dss\ " - DLINUX - DORACLE - DTPCH - DRNG_TEST - D_FILE_OFFSET_BITS = 64 - O - o dbgen build.o driver.o bm_utils.o rnd .o print.o load_stub.o bcd2.o speed_seed.o text.o permute.o rng64.o - lm
gcc - g - DDBNAME =\ " dss\ " - DLINUX - DORACLE - DTPCH - DRNG_TEST - D_FILE_OFFSET_BITS = 64 - c - o qgen.o qgen.c
gcc - g - DDBNAME =\ " dss\ " - DLINUX - DORACLE - DTPCH - DRNG_TEST - D_FILE_OFFSET_BITS = 64 - c - o varsub.o varsub.c
gcc - g - DDBNAME =\ " dss\ " - DLINUX - DORACLE - DTPCH - DRNG_TEST - D_FILE_OFFSET_BITS = 64 - O - o qgen build.o bm_utils.o qgen.o rnd .o varsub.o text.o bcd2.o permute.o speed_seed.o rng64.o - lm
-- 编译完成的可执行文件
[oracle@redflag11012501 tmp]$ ls * gen
dbgenqgen

　　用编译好的dbgen产生测试数据，qgen产生查询语句。

-- 生成1GB的测试数据
[oracle@redflag11012501 tmp]$ . / dbgen - s 1
TPC - H Population Generator (Version 2.13 . 0 )
Copyright Transaction Processing Performance Council 1994 - 2010
Do you want to overwrite . / supplier.tbl ? [Y / N]: Y
Do you want to overwrite . / customer.tbl ? [Y / N]: Y
[oracle@redflag11012501 tmp]$

[oracle@redflag11012501 tmp]$ ls - l * tbl
- rw - r -- r -- 1 oracle oinstall 24346144 01 - 30 11 : 29 customer.tbl
- rw - r -- r -- 1 oracle oinstall 759863287 01 - 30 11 : 29 lineitem.tbl
- rw - r -- r -- 1 oracle oinstall 2224 01 - 30 11 : 29 nation.tbl
- rw - r -- r -- 1 oracle oinstall 171952161 01 - 30 11 : 29 orders.tbl
- rw - r -- r -- 1 oracle oinstall 118984616 01 - 30 11 : 29 partsupp.tbl
- rw - r -- r -- 1 oracle oinstall 24134899 01 - 30 11 : 29 part.tbl
- rw - r -- r -- 1 oracle oinstall 389 01 - 30 11 : 29 region.tbl
- rw - r -- r -- 1 oracle oinstall 1409184 01 - 30 11 : 29 supplier.tbl
-- qgen需要在queries目录和dists.dss文件中读取模板
[oracle@redflag11012501 tmp]$ cd queries
[oracle@redflag11012501 queries]$ .. / qgen
Open failed for . / dists.dss at bm_utils.c: 308
[oracle@redflag11012501 queries]$ cp .. / dists.dss .
[oracle@redflag11012501 queries]$ .. / qgen
-- using 1296360498 as a seed to the RNG

select
l_returnflag,
l_linestatus,
sum(l_quantity) as sum_qty,
sum(l_extendedprice) as sum_base_price,
sum(l_extendedprice * ( 1 - l_discount)) as sum_disc_price,
sum(l_extendedprice * ( 1 - l_discount) * ( 1 + l_tax)) as sum_charge,
avg(l_quantity) as avg_qty,
avg(l_extendedprice) as avg_price,
avg(l_discount) as avg_disc,
count( * ) as count_order
from
lineitem
where
l_shipdate <= date ' 1998-12-01' - interval '93' day (3)
group by
l_returnflag,
l_linestatus
order by
l_returnflag,
l_linestatus;
where rownum <= - 1 ;

　　从上面的输出结果可以看出，虽然指定了数据库参数，qgen产生的查询语句仍然不符合oracle的语法规则。只是添加了一个where rownum<=条件，仍然需要人工编辑，在select前面增加select * from,然后再将原始的查询作为子查询用()括起来，最后再加上where rownum条件，注意将rownum<=-1中的-1改为一个较大的正整数。另外3处需要针对Oracle语法修改的地方是：将substring函数修改为substr函数，将表别名前面的as关键字去掉,将子查询构成的别名后的列名移动到子查询的select子句。

　　我们在修改完成的包含22个查询语句的sql脚本前端和末尾加上如下参数，就可以方便地进行多次测试。

set timi on lines 140 pages 5000 trimspool on termout off
set autot off
spool test.log
…
pool off
exit

　　如果是需要强制并行查询，则采用下面的设置。无论原始表是否开启了并行，设定了什么并行度，查询优化器都采用并行查询。要查看各查询的时间，在linux下可以用grep命令：

set timi on lines 140 pages 5000 trimspool on termout off
alter session force parallel query;
…
[oracle@redflag11012602 tpch]$ cat test.log|grep " Elapsed: "
Elapsed: 00 : 01 : 06.24
Elapsed: 00 : 00 : 03.83
…
Elapsed: 00 : 00 : 19.08
Elapsed: 00 : 00 : 17.28
Elapsed: 00 : 00 : 06.06

　　在Windows上可以用find命令完成同样的任务，如: find "Elapsed:" test.log。

　　三、数据加载和查询性能

　　本文不准备全面介绍Oracle的基本功能和特有功能，那需要一本书的篇幅，市面上也有很多书可供参考。这里只对分析型数据处理相关的功能做简要介绍和评测。

　　下面沿用TPC-H scale为10的大约10G字节数据来进行较大数据量的测试，先进行数据加载测试，测试前，先创建专用于测试的表空间tpch_ts，由于我们要测试的数据量大约10GB，考虑到PCT_FREE和其他开销，把表空间的大小定为20GB。然后创建tpch用户，将tpch用户的默认表空间设为tpch_ts,再利用tpch源代码包中的dss.ddl文件创建需要测试的8个表。另外，dss.ri文件中包含了表的主键和外键约束，为了提高数据加载速度，我们不执行它。

SQL > conn / as sysdba
Connected.
SQL > create tablespace tpch_ts datafile ' /user1/tpch/tpch.dbf'size 20000m nologging;

Tablespace created.

Elapsed: 00 : 01 : 19.53
SQL > create user tpch identified by tpch temporary tablespace temp default tablespace tpch_ts ;

User created.

Elapsed: 00 : 00 : 00.13
SQL > grant connect,resource to tpch;

Grant succeeded.

Elapsed: 00 : 00 : 00.02
SQL > grant create any directory to tpch;

Grant succeeded.

Elapsed: 00 : 00 : 00.00

　　1、sqlldr加载

　　我们采用Oracle的外部文件加载工具sqlldr来进行。

　　sqlldr的加载有2种模式，常规路径和直接路径，前者要将数据转化为INSERT语句，通过SGA区加载，后者将数据在内存中组成数据库的数据块格式，直接写入数据文件，避免了语句解释和记录日志的开销，因此在类似数据仓库的大量数据导入时，一般采用直接路径加载。

　　sqlldr加载需要准备一个控制文件，描述外部文件和数据库中的表的对应关系和一些参数选项，以lineitem表为例：

--
-- SQL * UnLoader: Fast Oracle Text Unloader (GZIP), Release 3.0 . 1
-- (@) Copyright Lou Fangxin (AnySQL.net) 2004 - 2010 , all rights reserved.
--
-- CREATE TABLE lineitem (
-- L_ORDERKEY NUMBER( 38 ),
-- L_PARTKEY NUMBER( 38 ),
-- L_SUPPKEY NUMBER( 38 ),
-- L_LINENUMBER NUMBER( 38 ),
-- L_QUANTITY NUMBER( 15 , 2 ),
-- L_EXTENDEDPRICE NUMBER( 15 , 2 ),
-- L_DISCOUNT NUMBER( 15 , 2 ),
-- L_TAX NUMBER( 15 , 2 ),
-- L_RETURNFLAG VARCHAR2( 1 ),
-- L_LINESTATUS VARCHAR2( 1 ),
-- L_SHIPDATE DATE ,
-- L_COMMITDATE DATE ,
-- L_RECEIPTDATE DATE ,
-- L_SHIPINSTRUCT VARCHAR2( 25 ),
-- L_SHIPMODE VARCHAR2( 10 ),
-- L_COMMENT VARCHAR2( 44 )
-- );
--
OPTIONS(BINDSIZE = 2097152 ,READSIZE = 2097152 ,ERRORS =- 1 ,ROWS = 50000000 )
LOAD DATA
INFILE ' lineitem.tbl' "STR X'0a'"
INSERT INTO TABLE lineitem
FIELDS TERMINATED BY ' |' TRAILING NULLCOLS
(
" L_ORDERKEY " CHAR( 40 ) NULLIF " L_ORDERKEY " = BLANKS,
" L_PARTKEY " CHAR( 40 ) NULLIF " L_PARTKEY " = BLANKS,
" L_SUPPKEY " CHAR( 40 ) NULLIF " L_SUPPKEY " = BLANKS,
" L_LINENUMBER " CHAR( 40 ) NULLIF " L_LINENUMBER " = BLANKS,
" L_QUANTITY " CHAR( 18 ) NULLIF " L_QUANTITY " = BLANKS,
" L_EXTENDEDPRICE " CHAR( 18 ) NULLIF " L_EXTENDEDPRICE " = BLANKS,
" L_DISCOUNT " CHAR( 18 ) NULLIF " L_DISCOUNT " = BLANKS,
" L_TAX " CHAR( 18 ) NULLIF " L_TAX " = BLANKS,
" L_RETURNFLAG " CHAR( 1 ) NULLIF " L_RETURNFLAG " = BLANKS,
" L_LINESTATUS " CHAR( 1 ) NULLIF " L_LINESTATUS " = BLANKS,
" L_SHIPDATE " DATE " YYYY-MM-DD HH24:MI:SS " NULLIF " L_SHIPDATE " = BLANKS,
" L_COMMITDATE " DATE " YYYY-MM-DD HH24:MI:SS " NULLIF " L_COMMITDATE " = BLANKS,
" L_RECEIPTDATE " DATE " YYYY-MM-DD HH24:MI:SS " NULLIF " L_RECEIPTDATE " = BLANKS,
" L_SHIPINSTRUCT " CHAR( 25 ) NULLIF " L_SHIPINSTRUCT " = BLANKS,
" L_SHIPMODE " CHAR( 10 ) NULLIF " L_SHIPMODE " = BLANKS,
" L_COMMENT " CHAR( 44 ) NULLIF " L_COMMENT " = BLANKS
)

　　我们看到，控制文件中设置了外部文件的行分隔符与列分隔符，ROWS参数是常规路径的绑定数组行数，或直接路径每次保存行数。加载方式是INSERT,此外还可以取值APPEND、REPLACE和TRUNCATE。要执行INSERT，必须保证表为空，否则sqlldr报错，不能继续执行。如果想向表中增加记录，可以指定加载选项为APPEND;为了替换表中已有的数据，可以使用REPLACE或TRUNCATE。REPLACE使用DELETE语句删除全部记录;因此，如果要加载的表中已经包含许多记录，这个操作执行得很慢。TRUNCATE使用 TRUNCATE SQL命令，执行更快，因为它不必物理地删除每一行。但是TRUNCATE 不能回退。要小心地设置这个选项，有时候其他参数也会影响这个选项。NULLIF指定了当外部某列数据为空时的处理方式。

　　由于数据仓库应用通常数据量较大，将外部文件压缩可以减少存储空间和读文件的I/O，加载时利用命名管道将解压后数据重定向到/user1/daa文件，通过在sqlldr命令行指定data参数可以覆盖控制文件的同名参数。

[root@redflag11012602 bin]# mkfifo / user1 / daa
[root@redflag11012602 bin]# chmod 666 / user1 / daa
[root@redflag11012602 bin]# su - oracle
[oracle@redflag11012602 ~]$ gunzip - c / user1 / tpch / lineitem.tbl.gz > / user1 / daa &
[ 1 ] 22955
[oracle@redflag11012602 tpch]$ date ;sqlldr tpch / tpch control = lineitem_sqlldr2.ctl data =/ user1 / daa direct = true log = lineitem_sqlldr2_10.log ; date
2011年 05月 01日星期日 08 : 34 : 45 CST

SQL * Loader: Release 11.2 . 0.2 . 0 - Production on Sun May 1 08 : 34 : 45 2011

Copyright (c) 1982 , 2009 , Oracle and / or its affiliates.All rights reserved.

Save data point reached - logical record count 50000000 .

Load completed - logical record count 59986052 .
[ 1 ] + Donegunzip - c / user1 / tpch / lineitem.tbl.gz > / user1 / daa(wd: ~)
(wd now : / user1 / tpch)
2011年 05月 01日星期日 08 : 42 : 45 CST)

　　用时8分钟，大约1分钟1GB数据。如果同一个表有多个外部数据文件，那么通过设置Parallel参数=TRUE，采用并行加载，可以提高加载速度。注意Parallel参数只是表示允许多个sqlldr进程同时加载，而不是对当前语句采用并行方式，也就是说，一个sqlldr命令只能串行加载。下面我们用并行方式加载同样的数据，比较加载时间。

　　首先，将原始数据拆分成4个文件，这里我们采用linux系统提供的split工具，因为总行数大约6千万行，因此规定单个文件行数1500万行。

[root@redflag11012501 tpch2]# gzip -- stdout - d / user1 / app / oradata / tpch2 / lineitem.tbl.gz >/ user1 / daa &
[ 1 ] 28085

[root@redflag11012501 tpch2]# date ; split - l15000000 - d / user1 / daa; date
2011年 04月 19日星期二 16 : 09 : 11 CST
[ 1 ] + Donegzip -- stdout - d / user1 / app / oradata / tpch2 / lineitem.tbl.gz > / user1 / daa
2011年 04月 19日星期二 16 : 10 : 53 CST

[root@redflag11012501 tpch2]# ls - l x *
- rw - r -- r -- 1 root root 1951033298 04 - 19 16 : 09 x00
- rw - r -- r -- 1 root root 1962174224 04 - 19 16 : 10 x01
- rw - r -- r -- 1 root root 1962182478 04 - 19 16 : 10 x02
- rw - r -- r -- 1 root root 1960323740 04 - 19 16 : 10 x03

　　如果原始文件已经有多个，那么，视文件的大小和个数，如果都比较平均，那么不需要再分割，如果存在个别文件特别大，那么对此文件继续分割。然后，同样将数据文件用gzip压缩。

　　下一步，我们需要修改控制文件的加载方式为APPEND,并行加载必须在APPEND方式下才能进行，因为其他方式都要求表为空或将表清空后才能进行。

gunzip - c / user1 / tpch / x00.gz > / user1 / daa &
gunzip - c / user1 / tpch / x01.gz > / user1 / dab &
gunzip - c / user1 / tpch / x02.gz > / user1 / dac &
gunzip - c / user1 / tpch / x03.gz > / user1 / dad &
-- 在后台并行执行sqlldr
sqlldr tpch / tpch control = lineitem_sqlldr.ctl data =/ user1 / daa direct = true parallel = true log = lineitem_sqlldr_a.log &
sqlldr tpch / tpch control = lineitem_sqlldr.ctl data =/ user1 / dab direct = true parallel = true log = lineitem_sqlldr_b.log &
sqlldr tpch / tpch control = lineitem_sqlldr.ctl data =/ user1 / dac direct = true parallel = true log = lineitem_sqlldr_c.log &
sqlldr tpch / tpch control = lineitem_sqlldr.ctl data =/ user1 / dad direct = true parallel = true log = lineitem_sqlldr_d.log &
-- 可以观察到后台有4个sqlldr进程
[oracle@redflag11012602 tpch]$ ps - ef|grep sqlldr
oracle 23205 23129 77 08 : 48 pts / 7 00 : 00 : 34 sqlldr tpch / tpch control = lineitem_sqlldr.ctl data =/ user1 / daa direct = true parallel = true log = lineitem_sqlldr_a.log
oracle 23206 23129 77 08 : 48 pts / 7 00 : 00 : 33 sqlldr tpch / tpch control = lineitem_sqlldr.ctl data =/ user1 / dab direct = true parallel = true log = lineitem_sqlldr_b.log
oracle 23209 23129 76 08 : 48 pts / 7 00 : 00 : 33 sqlldr tpch / tpch control = lineitem_sqlldr.ctl data =/ user1 / dac direct = true parallel = true log = lineitem_sqlldr_c.log
oracle 23210 23129 76 08 : 48 pts / 7 00 : 00 : 33 sqlldr tpch / tpch control = lineitem_sqlldr.ctl data =/ user1 / dad direct = true parallel = true log = lineitem_sqlldr_d.log
oracle 23227 23129 0 08 : 49 pts / 7 00 : 00 : 00 grep sqlldr
-- 4个sqlldr进程几乎同时结束
[oracle@redflag11012602 tpch]$
Load completed - logical record count 15000000 .

Load completed - logical record count 15000000 .

Load completed - logical record count 15000000 .

Load completed - logical record count 14986052 .
-- 查看每个sqlldr任务的日志
[oracle@redflag11012602 tpch]$ tail lineitem_sqlldr_a.log
Total logical records rejected: 0
Total logical records discarded: 0
Total stream buffers loaded by SQL * Loader main thread: 3709
Total stream buffers loaded by SQL * Loader load thread: 5565

Run began on Sun May 01 08 : 48 : 20 2011
Run ended on Sun May 01 08 : 50 : 30 2011

Elapsed time was: 00 : 02 : 10.32
CPU time was: 00 : 01 : 36.34
[oracle@redflag11012602 tpch]$ tail lineitem_sqlldr_b.log
Total logical records rejected: 0
Total logical records discarded: 0
Total stream buffers loaded by SQL * Loader main thread: 3729
Total stream buffers loaded by SQL * Loader load thread: 5593

Run began on Sun May 01 08 : 48 : 20 2011
Run ended on Sun May 01 08 : 50 : 30 2011

Elapsed time was: 00 : 02 : 10.29
CPU time was: 00 : 01 : 36.92
[oracle@redflag11012602 tpch]$ tail lineitem_sqlldr_c.log
Total logical records rejected: 0
Total logical records discarded: 0
Total stream buffers loaded by SQL * Loader main thread: 3730
Total stream buffers loaded by SQL * Loader load thread: 5593

Run began on Sun May 01 08 : 48 : 20 2011
Run ended on Sun May 01 08 : 50 : 30 2011

Elapsed time was: 00 : 02 : 10.28
CPU time was: 00 : 01 : 36.76
[oracle@redflag11012602 tpch]$ tail lineitem_sqlldr_d.log
Total logical records rejected: 0
Total logical records discarded: 0
Total stream buffers loaded by SQL * Loader main thread: 3728
Total stream buffers loaded by SQL * Loader load thread: 5591

Run began on Sun May 01 08 : 48 : 20 2011
Run ended on Sun May 01 08 : 50 : 30 2011

Elapsed time was: 00 : 02 : 10.28
CPU time was: 00 : 01 : 36.19

　　数据采用并行加载后，时间大幅度减少，大约是原来的四分之一。Windows操作系统不支持&语法的后台进程，可以用打开多个cmd窗口，分别执行多个不同的sqlldr语句的方式，也能达到相同的效果。需要指出的是，服务器的I/O能力对加载有巨大的影响，如果读写的I/O带宽已经用满，那么实际上就是sqlldr在等待I/O完成，那么此刻再启动多个sqlldr也不会提高加载性能。

　　2、外部表方式加载

　　外部表支持sqlldr引擎和数据泵，由于我们的数据是文本方式，故采用sqlldr引擎。

　　首先创建外部表，注意type为oracle_loader，PREPROCESSOR选择zcat,表示用zcat的结果插入。

SQL > create directory tpch_dir as ' /user1/tpch';

Directory created.

Elapsed: 00 : 00 : 00.02
SQL > create directory zcat_dir as ' /bin';

Directory created.
CREATE TABLE lineitem_ext (L_ORDERKEYNUMBER( 10 ),
L_PARTKEY NUMBER( 10 ),
L_SUPPKEY NUMBER( 10 ),
L_LINENUMBERNUMBER( 38 ),
L_QUANTITY NUMBER,
L_EXTENDEDPRICE NUMBER,
L_DISCOUNT NUMBER,
L_TAXNUMBER,
L_RETURNFLAGCHAR( 1 ),
L_LINESTATUS CHAR( 1 ),
L_SHIPDATEVARCHAR2( 10 ),
L_COMMITDATE VARCHAR2( 10 ),
L_RECEIPTDATEVARCHAR2( 10 ),
L_SHIPINSTRUCTVARCHAR2( 25 ),
L_SHIPMODE VARCHAR2( 10 ),
L_COMMENT VARCHAR2( 44 ))
ORGANIZATION EXTERNAL (
TYPE oracle_loader
DEFAULT DIRECTORY tpch_dir
ACCESS PARAMETERS (
RECORDS DELIMITED BY NEWLINE
PREPROCESSOR zcat_dir: ' zcat'
BADFILE ' bad_%a_%p.bad'
LOGFILE ' log_%a_%p.log'
FIELDS TERMINATED BY ' |'
MISSING FIELD VALUES ARE NULL )
LOCATION ( ' lineitem.tbl.gz'))
PARALLEL 2
REJECT LIMIT 0
/
Table created.
Elapsed: 00 : 00 : 00.03

　　然后用直接路径将外部表数据插入实际要处理的表。由于日期列需要指定格式，用to_date参数处理。

insert /*+ append */ into h_lineitem
select L_ORDERKEY,
L_PARTKEY,
L_SUPPKEY,
L_LINENUMBER,
L_QUANTITY,
L_EXTENDEDPRICE,
L_DISCOUNT,
L_TAX,
L_RETURNFLAG,
L_LINESTATUS,
to_date(L_SHIPDATE, ' YYYY-MM-DD'),
to_date(L_COMMITDATE, ' YYYY-MM-DD'),
to_date(L_RECEIPTDATE, ' YYYY-MM-DD'),
L_SHIPINSTRUCT,
L_SHIPMODE,
L_COMMENT
from lineitem_ext;
/
59986052 rows created.
Elapsed: 00 : 10 : 26.35
-- 利用多个文件创建另一个外部表，只修改location
CREATE TABLE lineitem_ext2 (L_ORDERKEYNUMBER( 10 ),
…
LOCATION ( ' x00.gz','x01.gz','x02.gz','x03.gz'))
…
-- 用第二个外部表并行插入
insert /*+ append parallel (a 8 ) */ into lineitema
select /*+ parallel (b 8 ) */ L_ORDERKEY,
L_PARTKEY,
L_SUPPKEY,
L_LINENUMBER,
L_QUANTITY,
L_EXTENDEDPRICE,
L_DISCOUNT,
L_TAX,
L_RETURNFLAG,
L_LINESTATUS,
to_date(L_SHIPDATE, ' YYYY-MM-DD'),
to_date(L_COMMITDATE, ' YYYY-MM-DD'),
to_date(L_RECEIPTDATE, ' YYYY-MM-DD'),
L_SHIPINSTRUCT,
L_SHIPMODE,
L_COMMENT
from lineitem_ext2 b;
/
59986052 rows created.
Elapsed: 00 : 04 : 13.94
-- 用第一个外部表并行插入

insert /*+ append parallel (a 8 ) */ into lineitema
select /*+ parallel (b 8 ) */ L_ORDERKEY,
…
from lineitem_ext b;
/

59986052 rows created.

Elapsed: 00 : 08 : 59.89

　　我们看到，location单个外部文件的外部表，指定了并行插入仍然需要大约9分钟时间，比sqlldr单进程还慢，采用多个外部文件的外部表,并行插入时间4分钟多，也比sqlldr并行加载差很多，to_date的日期转换是有些影响，但由于加载引擎实际没有区别，也就难以超过sqlldr命令的效果。

　　3、数据查询

　　为了比较不同条件下的查询结果，我们进行了4种组合的查询。分别是：单进程不压缩，并行不压缩，单进程压缩，并行压缩，每种测试做2遍，取较快的一遍的结果。

-- 用来压缩表的语句，并行参数可加快速度，但并不改变被move的表的并行度
alter table CUSTOMER move compress parallel 32 ;
alter table LINEITEM move compress parallel 32 ;
alter table NATION move compress parallel 32 ;
alter table ORDERS move compress parallel 32 ;
alter table PART move compress parallel 32 ;
alter table PARTSUPP move compress parallel 32 ;
alter table REGION move compress parallel 32 ;
alter table SUPPLIER move compress parallel 32 ;

-- 压缩前字节数
SQL > set numw 20
SQL > select segment_name,sum(bytes) from user_segments where segment_name not like ' %EXT%' group by segment_name order by 1;

SEGMENT_NAME SUM(BYTES)
------------------ --------------------
CUSTOMER 281804800
LINEITEM 7730102272
NATION 65536
ORDERS 1874067456
PART 278986752
PARTSUPP 1367867392
REGION 65536
SUPPLIER 16646144

-- 压缩后
SEGMENT_NAMESUM(BYTES)
------------------- --------------------
CUSTOMER 248643584
LINEITEM 5389484032
NATION 65536
ORDERS 1566310400
PART 207290368
PARTSUPP 1251344384
REGION 65536
SUPPLIER 17301504

　　从上面表的占用空间可见，对于tpc-h数据，因为dbgen生成的数据比较随机，又是符合第3范式的，冗余较少，Oracle压缩的效果不太明显。节约的I/O有限,像SUPPLIER表大小反而增加了，还增加了解压的负担。

　　下面是各组查询测试结果：

▲表1 TPC-H cale=10未压缩和压缩数据的测试对比，单位：秒

　　可见无论是否压缩，并行查询比单进程都有几倍或十几倍的提高，具体提高的倍数和查询的类型和机器的CPU个数有关。用来测试的机器有8个逻辑CPU,在不压缩的情况下能提高大约5倍，在压缩的情况下，单进程的性能比不压缩更差，所以光看提高的倍数是不够的，还要看查询的实际时间比。

　　从上述数据我们还可以得出单进程和并行分别查询压缩和非压缩数据的差异：

▲表2 TPC-H scale=10压缩前后数据的测试对比，单位：倍

　　如上表所示，从合计时间看，单进程压缩比不压缩反而速度降低了20%，而并行条件下，则有30%的性能提高。从单个查询看，压缩和不压缩互有胜负，这跟前面我们列出的压缩文件大小有关，如果I/O没有变化或者更大，那么加上解压开销，查询速度下降也是必然的。

　　四、性能调整和优化

　　Oracle性能调整和优化是个复杂的命题，涵盖表结构设计、查询设计、参数调整等方面，前文介绍的压缩和并行都是简单的参数调整优化手段，如果是实际的查询，而不是基准测试，我们就需要充分利用Oracle的功能，针对每个查询单独优化。

　　1、查询的改写

　　由于Oracle的查询优化器相对比较智能，对SQL语句书写的要求比其他数据库要相对低一些，这给应用开发人员带来了方便。比如第15个查询，下面2种完全迥异的写法，执行效果却是差不多的。

-- 根据原始的第15个查询语句，将视图改为子查询
SQL > select * from(
2 select
3 s_suppkey,
4 s_name,
5 s_address,
6 s_phone,
7 total_revenue
8 from
9 supplier,
10 (
11 select
12 l_suppkey supplier_no,
13 sum(l_extendedprice * ( 1 - l_discount))total_revenue
14 from
15 lineitem
16 where
17 l_shipdate >= date ' 1995-02-01'
18 and l_shipdate < date ' 1995-02-01' + interval '3' month
19 group by
20 l_suppkey
21 )
22 revenue0
23 where
24 s_suppkey = supplier_no
25 and total_revenue = (
26 select
27 max(total_revenue)
28 from
29 (
30 select
31 l_suppkey supplier_no,
32 sum(l_extendedprice * ( 1 - l_discount))total_revenue
33 from
34 lineitem
35 where
36 l_shipdate >= date ' 1995-02-01'
37 and l_shipdate < date ' 1995-02-01' + interval '3' month
38 group by
39 l_suppkey
40 )
41 revenue0
42 )
43 order by
44 s_suppkey)
45 where rownum <= 10 ;

S_SUPPKEY S_NAMES_ADDRESS S_PHONE TOTAL_REVENUE
---------- ------------------- ------------------- --------------- -------------
83966 Supplier# 000083966 0ITp9HCIUHEHgWCjeTt 24 - 897 - 113 - 5492 2147201.69

已用时间: 00 : 00 : 20.46

-- 修改后的第15个查询语句，分析函数写法
SQL > select s_suppkey, s_name, s_address, s_phone, total_revenue
2 fromsupplier
3 ,( select l_suppkey as supplier_no,
4 sum(l_extendedprice * ( 1 - l_discount)) as total_revenue
5 ,RANK() OVER(ORDER BY sum(l_extendedprice * ( 1 - l_discount)) DESC) AS rnk
6 from lineitem
7 where l_shipdate >= date ' 1995-02-01'
8 and l_shipdate < date ' 1995-02-01' + interval '3' month
9 group by
10 l_suppkey
11 ) revenue1
12 where s_suppkey = supplier_no
13 AND rnk = 1
14 order by s_suppkey;

S_SUPPKEY S_NAMES_ADDRESS S_PHONE TOTAL_REVENUE
---------- ------------------- ------------------- --------------- -------------
83966 Supplier# 000083966 0ITp9HCIUHEHgWCjeTt 24 - 897 - 113 - 5492 2147201.69

已用时间: 00 : 00 : 20.16

　　2、统计信息收集和管理

　　正确的统计信息对Oracle得出较好的执行计划有十分重要的影响，在大量插入或更新数据以后，甚至对表进行move后，需要重新收集统计信息。比如：对某个用户下所有的对象收集统计信息，degree表示并行收集的并行度。

SQL > set timi on
SQL > exec dbms_stats.gather_schema_stats( ' TPCH');

PL / SQL procedure successfully completed.

Elapsed: 00 : 19 : 29.98

SQL > exec dbms_stats.gather_schema_stats(ownname => ' TPCH', degree=> 32)

PL / SQL procedure successfully completed.

Elapsed: 00 : 14 : 55.46

　　Oracle也提供了自动统计信息收集任务，一般在晚间执行，该过程首先检测统计信息缺失和陈旧的对象。然后确定优先级，再开始进行统计信息。

　　这个功能还是很有用的，比如第18个查询，单进程查询，没有收集统计信息前需要2个多小时，自动统计信息收集后只要不到2分钟就完成了。如果不利用统计信息，那么必须要求开发人员非常熟悉Oracle的各种连接和排序方法，人工添加提示来影响执行计划，这没有相当丰富的开发经验是做不到的。

　　还有其他的优化手段，比如添加必要的索引，由于时间所限，兼之前文所述的“TPC-H检查可用数据的大多数”原因，没有进行测试。但单从添加dss.ri中的主外键约束来看，测试结果和不带主外键约束，差别不大，具体数据就不易已列出了，有兴趣的读者可以自行检验。

　　五、小结

　　看到这里，相信读者对Oracle数据库已经有了初步的印象，安装虽然比较复杂，安装包也体积庞大，但功能还是很强大，性能也比较好，能充分利用硬件资源。对开发人员来说，不必在SQL的语法上面太过钻研，转而从业务理解上面按通常的写法就能取得较好的效果，可以大大提高他们的工作效率。Oracle 11g还提供了功能更强的SQL调优工具，可以帮助开发人员改善他们的SQL。

　　要说存在的问题， Oracle对硬件的要求较高，需要提供较大的内存和磁盘空间，也需要多个CPU。其次，压缩率不高，压缩数据对单进程查询有害无益，但对于企业应用，大容量存储和多CPU都不是大问题，因此这个缺点影响不大。再就是Oracle系统的复杂性，比如同样是统计信息收集，如果用的参数不同，产生的执行计划也有天壤之别，对数据库管理人员的要求还是较高的。

　　总的来说，如果用户十分在意查询性能，对数据压缩要求一般，那么Oracle是一个好的选择。而对最终用户来说，本文没有提及的图形化的管理工具EM也是一个很好的工具，不必手工输入和记忆大量的管理SQL语句，就能监控数据库运行和进行日常维护工作。

你可能感兴趣的:(行式数据库评测：Oracle 11g R2企业版)

swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
2022-04-18 Apbenz
语重心长的和我说，不要老是说不行，人至而立之年危机四伏，内在的，外在的，感觉就是心力憔悴，让人无所适从。面对职场的无情，突然好羡慕干体力劳动的外卖小哥。难道命运是想让我去送外卖了吗？干体力活才能让我活下去？fastadmin打卡成功,淘宝金币任务完成。ㅏㅓㅗㅜㅡㅣㅐㅔㅑㅕㅛㅠㅢㅒㅖY行。야자여자요리우유의사얘기예
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
无题，感慨竹间书编辑
玉生烟，雪落天，枯叶随雪葬行边，何有芳名，流落人世间。雪中行，路中停，风送鹅雪风无情，且将留此，风波却未平
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
春季养肝正当时 dxn悟
重温快乐2023年2月4日立春。春天来了，春暖花开，小鸟欢唱，那在这样的季节我们如何养肝呢？自然界的春季对应中医五行的木，人体五脏肝属木，“木曰曲直”，是以树干曲曲直直地向上、向外伸长舒展的生发姿态，来形容具有生长、升发、条达、舒畅等特征的食物及现象。根据中医天人相应的理念，肝五行属木，喜条达，主疏泄，与春天相应，所以春天最适合养肝。养肝首先要少生气，因为肝喜条达恶抑郁。人体五志肝为怒，生气发怒最
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
赠晶晶在平凡中重新出发
逐伊衫望伊泪伊人雨中别离去莫再想莫再追莫要寸断再回味十六年六十年弹指挥间青鬓颜且浅行且珍惜待到山花烂漫时图片发自App
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
福袋生活邀请码在哪里填写，福袋生活app邀请码使用教程小小编007
很多人下载福袋生活后，注册使用时需要填写邀请码。因为福袋生活是注册邀请制，所以首次使用填写邀请码才可以正常登录使用。福袋生活是广州市福袋生活信息科技有限公司旗下一家多元化社交电商导购平台，以APP为载体，社群为媒介，汇集衣食住行、吃喝玩乐生活服务板块，使用福袋生活可以领到淘宝，拼多多等电商平台的商品优惠券和返利，还可以兼职去分享赚钱。我为什么从福袋生活转到果冻宝盒呢？当然是因为福袋生活返利更高，注
学习“论语”-第59天春峰轩
12.14子张问政。子曰：“居之无倦，行之以忠。”子张问为政之道。孔子说：“在位尽职不懈怠，执行政令要忠诚。”12.15子曰：“博学于文，约之以礼，亦可以弗畔矣夫！”孔子说：“君子广泛地学习文献，并且用礼节约束自己，也就不会离经叛道了。”12.16子曰：“君子成人之美，不成人之恶。小人反是。”孔子说：“君子成全别人的好事，而不助长别人的坏处。小人则与此相反行事。”知识点:“成人之美，不成人之恶”贯
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
2019-01-19 王小康KK
姓名:王康公司:扬州市方圆建筑工程有限公司2018年3月16日～3月18日上海361期《六项精进》感谢二组学员【日精进打卡第307天】【知～学习】《六项精进》大纲3遍共862遍《大学》通篇3遍共860遍《六项精进》全书40页【经典名句】思想决定行为，行为决定习惯，习惯决定性格，性格决定命运。【行～实践】一、修身：（对自己个人）1、践行六项精进的理念。二、齐家：（对家庭和家人）1、和女朋友视频聊天。
剧本杀《鲸鱼马戏团》剧本杀剧透+真相答案复盘解析攻略 VX搜_奶茶剧本杀
本文为剧本杀《鲸鱼马戏团》剧本杀测评+部分真相复盘，获取完整真相复盘只需两步：①、关注微信公众号【奶茶剧本杀】→②、回复剧本杀《鲸鱼马戏团》即可获取查看剧本杀《鲸鱼马戏团》剧本杀真相答案复盘+凶手剧透：以下是玩家评测+部分关键证据，凶手，时间线，复盘解析，推理逻辑--------------------------------------------------------------------
道阻且长，行则将至 sweet橘子
本文参与书香澜梦主题征文“行”文章原创首发，文责自负。我们每一个人都应该有属于自己的愿望或者是理想，人一但有了理想也就算是有了方向，它就会像灯塔一样指引我们前进的方向，哪怕是再远大的理想，如果坚持，那么我相信它就一定有收获。屈原是我最喜欢的一个浪漫主义的诗人，他曾今说过：“路漫漫其修远兮，吾将上下而求索。”人生的道路很长，但是为了实现自己的理想抱负我愿意付出我毕生的精力，只专注这一件事，因为“道阻
厦门自由行之第一天: 大苏子在广漂
厦门三人行之杂记出发前一天:12️28日下午15:00从广州粗发，来深圳集合！但是中间发生一个小插曲，验票时候发现车票不见了，或许也是一场恶作剧，对于不排队的人，忍不住说了一下，接下来就发现车票不见了，已经是拿在手上！不过还好，可以凭借购票订单查看到信息，所以有惊无险，顺利进站！晚上三个人一起去吃了柠檬鱼，说实话，那会，感觉美吃饱，啊哈哈！晚上回来，两个人又开始彻夜长谈，发现身边优秀的人，一大把，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
一文掌握python常用的list（列表）操作程序员neil python python 开发语言
目录一、创建列表1.直接创建列表：2.使用list()构造器3.使用列表推导式4.创建空列表二、访问列表元素1.列表支持通过索引访问元素，索引从0开始：2.还可以使用切片操作访问列表的一部分：三、修改列表元素四、添加元素1.append()：在末尾添加元素2.insert()：在指定位置插入元素五、删除元素1.del：删除指定位置的元素2.remove()：删除指定值的第一个匹配项3.pop()：
越努力，越幸运！ Trulyjane
只有坚持，才可以做到～～记得以前在一本书上看过这句话:再深厚的夫妻感情，如果一方前进，而另一方保持色初心，止步不前，怎么也经不起岁月的考验，将会渐行渐远！当前是个务实的社会，很多的浪漫，没有面包的爱情经不起考验，所有的风花雪月都需要看似很俗却又不得不需要的东西～金钱。所以，无论你是什么身份，多去想想怎么赚钱，让自己无论说话还是做事可以随心，做自己想做的事，并且拥有话语权。越努力，越幸运！！
《度五行》生活报报甲午62：不通痛苦，太通也痛苦，要健康快乐，需要通体舒畅。 YangduSam2021
220809壬寅戊申甲午，《度.生活五行》:天干土克水，水生木，木克土。地支寅申冲，寅午合。20220809，周二，兴大上海六班2512天，西交大2013上海班3212天，后TA15332天，度生活619天，今天拜访了一家有趣且当红产业的新创公司AK。AK一开始从事深海新能源储存与供电设备的研发生产制造，2年前开始做移动与家庭储能设备的研发生产制造。觉得有趣是因为这是笔者认知里用科技做降维打击的公
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
Linux vi常用命令 fengyehongWorld Linux linux
参考资料viコマンド（vimコマンド）リファレンス目录一.保存系命令二.删除系命令三.移动系命令四.复制粘贴系命令一.保存系命令⏹保存并退出:wq⏹强制保存并退出:wq!⏹退出(文件未编辑):q⏹强制退出(忽略已编辑内容):q!⏹另存为:w新文件名二.删除系命令⏹删除当前行dd⏹清空整个文档gg：移动到文档顶部dG：删除到最后一行ggdG三.移动系命令⏹移动到文档顶部gg⏹移动到文档底部#方式1G
2023-08-08 2023梦启支教团张牧泽
学汉字历史，行传统书法——中国矿业大学梦启支教团梦启三班开展书法文化课7月20日上午8时，中国矿业大学梦启支教团在贵州省金沙县西洛街道彩虹小学开展了“书法文化”课程。该课程意在向孩子们传授汉字演变的相关知识，围绕书法发展历史讲解不同时期的字形字体特点。此课程由梦启支教团成员王耀民讲授，梦启三班全体成员参加。中国文字的发展有数千年的历史，从早期雏形的象形文字到殷商时期的甲骨文、金文，再到西周、秦朝的
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。